首頁 > 智能時(shí)代>人工智能

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

量子位 2024/7/30 15:22:36 責(zé)編：遠(yuǎn)洋

評論：

它來了它來了，蘋果的 Apple Intelligence 終于與果粉見面了！

隨著 iOS 18.1 Beta 版的上線，注冊開發(fā)者從即日起就能體驗(yàn)到蘋果 AI 的部分功能。最明顯的一處就是 Siri 的全面換新，變身成了 Apple Intelligence & Siri。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

另一項(xiàng)重磅更新就是寫作功能了，它可以幫忙潤色推特評論，三下五除二就能把高級表達(dá)方式安排起來。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

甚至 dirty words 也能分分鐘變得儒雅隨和：

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

開啟 Apple Intelligence 后，蘋果自研的端側(cè)大模型就會被下載到設(shè)備當(dāng)中。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

根據(jù)手快的網(wǎng)友體驗(yàn)反饋，不像其他家的 AI 那樣動不動就是拒絕服務(wù)。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

與此同時(shí)，蘋果自家大模型的報(bào)告也已出爐，披露了大量技術(shù)細(xì)節(jié)。報(bào)告顯示，在指令遵循、文本總結(jié)等任務(wù)上，蘋果云端大模型取得了超過 GPT-4 的成績。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

蘋果基礎(chǔ)大模型團(tuán)隊(duì)負(fù)責(zé)人龐若鳴（Ruoming Pang）也表示，其模型與一些同類最佳模型相比具有競爭力。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

龐若鳴是普林斯頓計(jì)算機(jī)博士，本碩分別畢業(yè)于上海交大和南加州大學(xué)，于 2021 年加入蘋果，此前在谷歌擔(dān)任了 15 年的工程師。

Apple Intelligence 的主要對話功能，正是由他率領(lǐng)的團(tuán)隊(duì)研發(fā)的模型提供支持。

這次他還強(qiáng)調(diào)，這些基礎(chǔ)模型“并不是聊天機(jī)器人”，而是支持廣泛的功能，包括摘要、寫作幫助、工具使用和代碼。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

另外，蘋果也研發(fā)了許多自研算法，為提高模型表現(xiàn)提供了加持，具體信息也在報(bào)告中被披露。

還有細(xì)心的網(wǎng)友從中發(fā)現(xiàn)了華點(diǎn) —— 蘋果大模型的訓(xùn)練用的是谷歌 TPU 集群，英偉達(dá)含量竟然為零。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

Siri 升級，但 ChatGPT 暫未接入

要想體驗(yàn)到蘋果的 Apple Intelligence，需要滿足的條件有不少。

首先，搭載它的 iOS 18.1 Beta 版目前是 99 美金一年的注冊開發(fā)者限定，所以普通用戶還得等等。

還有就是之前說過的，只支持 M 系和 A17 Pro 芯片，也就是說 iPhone 中只有部分地區(qū)的 15 Pro 和 15 Pro Max 能用。

除了硬件和身份要求，系統(tǒng)設(shè)置也需要修改，要將地區(qū)設(shè)置為美國，且設(shè)備和 Siri 的語言都要改成英語。

滿足了所有這些要求之后，就可以…… 加入等待隊(duì)列了。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

此次上線的 Apple Intelligence 是部分功能，主要圍繞文本生成、Siri 和相冊這幾個(gè)模塊。

先說文本生成，作為蘋果 AI 的重要組成部分，該功能的視適用范圍不局限于蘋果官方應(yīng)用。

只要使用標(biāo)準(zhǔn)輸入文本系統(tǒng)，在第三方應(yīng)用程序當(dāng)中也能利用該功能進(jìn)行文本總結(jié)、校對和重寫。

另外結(jié)合 iOS 18 Beta 的語音備忘錄中已經(jīng)上線的音頻轉(zhuǎn)錄功能，文本生成系統(tǒng)還可以為錄音生成摘要。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

第二個(gè)比較重要的更新就是 Siri 了。界面上，新版 Siri 不再是一個(gè)圓形圖標(biāo)，在運(yùn)行時(shí)會有環(huán)繞屏幕的彩色光不斷閃動。而且還給不想語音對話的用戶提供了文本對話方式，雙擊屏幕底部即可調(diào)出鍵盤，與 Siri 打字交流。

內(nèi)容方面，新版 Siri 將能夠解答與蘋果產(chǎn)品相關(guān)的問題，幫助用戶進(jìn)行故障排除。

另外，新的 Siri 還可以夠理解從一個(gè)查詢到下一個(gè)查詢的上下文，例如要求 Siri 創(chuàng)建日歷事件，然后請求創(chuàng)建提醒，而無需重述正在談?wù)摰膬?nèi)容。

不過，之前介紹的屏幕感知功能，并未包含在此次 Siri 的更新當(dāng)中。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

相冊的更新則讓用戶可以用自然語言搜索特定照片，甚至是視頻當(dāng)中的具體時(shí)刻。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

以上就是本次開發(fā)者測試版本中有關(guān) AI 的大致內(nèi)容，需要指出的是，這只是之前發(fā)布會上所展示的功能中的一部分，還有很多沒有上線。

特別地，之前提到過的 ChatGPT 集成，此次更新也暫未接入。

解密蘋果大模型

蘋果已經(jīng)說過，ChatGPT 在蘋果 AI 中不是必選項(xiàng)，主要功能是由自家的大模型驅(qū)動。而關(guān)于這個(gè)模型，蘋果也在上線的同時(shí)發(fā)布了全面的技術(shù)報(bào)告。

模型的名字簡單粗暴，就叫蘋果基礎(chǔ)模型（Apple Foundation Model，簡稱 AFM），有端側(cè)（on-device）和云側(cè)（server）兩個(gè)版本。端側(cè)模型的參數(shù)量在 3B 左右，云側(cè)則未具體透露，只說是比端側(cè)更大，二者都有 32k 的上下文窗口。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

訓(xùn)練過程英偉達(dá)含量為 0

模型的訓(xùn)練通過自家基于 JAX 的 AXLearn 框架進(jìn)行，并采用了張量并行、流水并行等策略。

硬件則采用的是谷歌 TPU，其中云側(cè)用了 8192 顆 TPUv4 芯片，端側(cè)用了 2048 顆 TPUv5p 芯片，總之英偉達(dá)含量為 0。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

數(shù)據(jù)則主要來源于通過 Applebot 爬取的網(wǎng)頁，以及有公共許可的代碼和數(shù)學(xué)數(shù)據(jù)集。

值得一提的是，蘋果選用的數(shù)據(jù)集中無一使用 GPL，都是 MIT、Apache、CC0 這些開放程度更高的開源協(xié)議。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

流程上，AFM 的預(yù)訓(xùn)練過程共分三個(gè)階段 —— 核心訓(xùn)練、繼續(xù)訓(xùn)練和上下文延長。

在核心訓(xùn)練階段中，云側(cè)版本的數(shù)據(jù)量有 6.3T tokens，窗口長度為 4096，端側(cè)版本則是在此基礎(chǔ)之上蒸餾得到。

繼續(xù)訓(xùn)練時(shí)，低質(zhì)量數(shù)據(jù)的權(quán)重會被降低，并使用數(shù)學(xué)、代碼以及獲得授權(quán)的高質(zhì)量數(shù)據(jù)，對模型能力進(jìn)行提升。

該過程使用了 1T tokens 的數(shù)據(jù)，窗口長度也從 4096 變成了 8192。

到了下一階段，窗口長度被進(jìn)一步擴(kuò)充到 32k，涉及長序列文本和合成數(shù)據(jù)，總量為 100B tokens。

獨(dú)創(chuàng)強(qiáng)化學(xué)習(xí)新算法

AFM 的后訓(xùn)練則包括指導(dǎo)監(jiān)督微調(diào)（SFT）、人類反饋強(qiáng)化學(xué)習(xí)（RLHF）等工作。其中 SFT 階段使用了合成數(shù)據(jù)與人類標(biāo)注數(shù)據(jù)，合成數(shù)據(jù)主要關(guān)于數(shù)學(xué)、工具使用和代碼。而在 RLHF 階段，蘋果自創(chuàng)了 iTeC 和 MDLOO 兩種強(qiáng)化學(xué)習(xí)算法。

iTeC 全稱 Iterative Teaching Committee，可譯作“迭代教學(xué)委員會”，是一種用于強(qiáng)化學(xué)習(xí)后訓(xùn)練的算法，旨在通過多輪迭代優(yōu)化模型的性能。

其核心思想是結(jié)合不同的偏好優(yōu)化算法，包括拒絕采樣、直接偏好優(yōu)化（DPO），使得模型能夠從多種優(yōu)化策略中受益，從而提高其對特定任務(wù)的適應(yīng)性和性能。

在每次迭代中，iTeC 會從最新的模型中選擇一組表現(xiàn)最好的模型，形成一個(gè)“模型委員會”。這些模型是經(jīng)過 SFT、RS、DPO / IPO 和 RL 等不同訓(xùn)練方法得到的。

通過收集人類對模型響應(yīng)的偏好反饋，iTeC 不斷更新其獎勵(lì)模型，并用于訓(xùn)練新的模型集合。每收集一批人類偏好數(shù)據(jù)后，iTeC 會刷新其獎勵(lì)模型，并訓(xùn)練新的模型集合，以此循環(huán)進(jìn)行多輪迭代，逐步提升模型性能。

MDLOO 則是一種在線強(qiáng)化學(xué)習(xí)算法，特別設(shè)計(jì)用于優(yōu)化模型的響應(yīng)質(zhì)量。作為在線算法，它能在模型訓(xùn)練過程中實(shí)時(shí)解碼響應(yīng)，并應(yīng)用 RL 算法來最大化獎勵(lì)。也就是說，這種方法使得模型能夠在訓(xùn)練過程中不斷學(xué)習(xí)和調(diào)整其策略，以生成更符合人類偏好的響應(yīng)。

具體實(shí)現(xiàn)上，它結(jié)合了留一法（Leave-One-Out，LOO）優(yōu)勢估計(jì)器和鏡像下降策略優(yōu)化（MDPO），以實(shí)現(xiàn)更穩(wěn)定和有效的策略更新。

端側(cè)混合精度量化

為了讓端側(cè)模型更高效運(yùn)行，同時(shí)避免占用過多內(nèi)存資源，蘋果對 AFM 的端側(cè)版本進(jìn)行了量化操作。具體來說，蘋果采用了混合精度的量化方式，針對不同環(huán)節(jié)采用了不同的量化精度。

蘋果采用的方式被稱為“調(diào)色板”策略，在調(diào)色板量化中，權(quán)重不是每個(gè)單獨(dú)量化，而是將它們分組，并讓組內(nèi)的權(quán)重共享相同的量化常數(shù)。

對于投影權(quán)重，每 16 列 / 行共享相同的量化常數(shù)，并且使用 K-means 算法進(jìn)行 4 位量化。

針對嵌入層，由于是輸入和輸出共享的，采用了 8 位整數(shù)進(jìn)行每通道量化，另外還有某些重要性相對較低的層被進(jìn)一步壓縮到 2 位量化。

為了恢復(fù)量化后損失的性能，以保持模型的輸出質(zhì)量和準(zhǔn)確性，蘋果還引入了準(zhǔn)確性恢復(fù)適配器（Accuracy-Recovery Adapters）。

該適配器是小型的神經(jīng)網(wǎng)絡(luò)模塊，可以插入到預(yù)訓(xùn)練模型的特定層中，在量化模型的基礎(chǔ)上進(jìn)行訓(xùn)練，通過微調(diào)來學(xué)習(xí)如何補(bǔ)償量化帶來的影響。

部分任務(wù)超越 GPT-4

應(yīng)用了一系列優(yōu)化技術(shù)之后，也到了驗(yàn)收模型表現(xiàn)的時(shí)候了。在這過程中，蘋果采用了人類評估與自動化評估相結(jié)合的策略。

先說人工評估，評估人員設(shè)計(jì)了涵蓋分析推理、頭腦風(fēng)暴、聊天機(jī)器人等方面的多類問題，并讓模型生成相應(yīng)。同時(shí)，問題也會被提給用于對比的其他模型，然后由評估人員評判哪個(gè)模型的輸出更好。

結(jié)果，無論是云側(cè)還是端側(cè)模型，都有至少 60% 的概率不輸給 Llama 3、GPT-4 等對比模型。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

其余的測試主要利用數(shù)據(jù)集實(shí)現(xiàn)。

在指令遵循能力上，蘋果進(jìn)行了 IFEval 測試，結(jié)果在指令和 prompt 兩個(gè)層次上，云側(cè) AFM 都超過了 GPT-4，成為了新的 SOTA。

端側(cè)模型的表現(xiàn)，也超過了 Llama 3-8B、Mistral-7B 等近似規(guī)模的模型。在 AlpacaEval 當(dāng)中，端側(cè)和云側(cè) AFM 也都取得了第二名的成績。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

再看具體任務(wù)上的表現(xiàn)，AFM 在寫作類 Benchmark 當(dāng)中的總結(jié)任務(wù)上取得了 SOTA，撰寫任務(wù)上也與第一名接近。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

數(shù)學(xué)上，蘋果用 GSM8K 和 MATH 兩個(gè)數(shù)據(jù)集進(jìn)行了評估。

結(jié)果端側(cè)模型在 GSM8K 上不敵 Llama 3-8B 和微軟的 Phi 3 mini，云側(cè)被 GPT-4 和 Llama 3-70B 超越，但優(yōu)于 GPT-3.5。

MATH 上的成績相對高些，端側(cè)版領(lǐng)先了同規(guī)模模型，云側(cè)版也超越了 Llama 3-70B。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

性能之外，安全性也十分重要，蘋果通過人工方式對 AFM 抵御對抗性攻擊的能力進(jìn)行了評估。結(jié)果顯示，AFM 在面對對抗性提示時(shí)，實(shí)現(xiàn)的違反率顯著低于其他開源和商業(yè)模型。

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

以上就是蘋果大模型技術(shù)報(bào)告中一些值得關(guān)注的內(nèi)容，更多詳情可參閱報(bào)告原文。

One More Thing

雖然 Apple Intelligence 已經(jīng)提供給開發(fā)者進(jìn)行測試，但彭博社爆料說，正式版可能會延遲上線。

的確，按照蘋果此前的版本發(fā)布規(guī)律，18.1 的版本號也意味著，這些功能不會隨著 9 月的新機(jī)發(fā)布一同上線。

對此分析師 Gene Munster 建議，蘋果應(yīng)該考慮推遲 iPhone 16 的發(fā)布日期，以與 Apple Intelligence 保持一致。

至于庫克會不會考慮這個(gè)建議，就拭目以待了。

報(bào)告地址：

https://machinelearning.apple.com/research/apple-intelligence-foundation-language-models

參考鏈接：

[1]https://x.com/reach_vb/status/1818014366555586611
[2]https://www.cnbc.com/2024/07/29/apple-releases-apple-intelligence-its-long-awaited-ai-features.html
[3]https://www.tomsguide.com/phones/iphones/ios-181-developer-beta-is-live-with-apple-intelligence-heres-all-the-new-iphone-ai-features
[4]https://www.businessinsider.com/apple-intelligence-delay-wont-hurt-new-iphone-sales-analysts-2024-7

本文來自微信公眾號：量子位（ID：QbitAI），作者：克雷西

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

蘋果 AI 版 iOS 首日火爆：聊天秒變高情商，大模型成最強(qiáng)嘴替，Siri 華麗變身

Siri 升級，但 ChatGPT 暫未接入