IT之家 6 月 3 日消息,在今日開幕的 Build 2026 開發(fā)者大會(huì)上,微軟宣布在去年為 Edge 瀏覽器推出基于 Phi-4-mini 模型的寫作輔助 API 基礎(chǔ)上擴(kuò)展了其端側(cè) AI 能力,新增了模型和 API。本次更新主要包括三項(xiàng)內(nèi)容:
Aion-1.0-Instruct 小語(yǔ)言模型的開發(fā)者預(yù)覽版(用于早期測(cè)試和反饋);
Edge 148 版本中由端側(cè)任務(wù)專用模型驅(qū)動(dòng)的語(yǔ)言檢測(cè)和翻譯 API;
以及在 Edge Canary 和 Dev 通道中提供的實(shí)驗(yàn)性 Web Speech API 端側(cè)語(yǔ)音識(shí)別功能。

微軟表示,過(guò)去一年中,Edge 瀏覽器的寫作輔助 API 一直基于 Phi-4-mini 模型。這是一個(gè) 40 億參數(shù)的模型,在文本理解、推理和指令遵循方面表現(xiàn)出色,但其硬件要求限制了它在不同設(shè)備上的可用性。
因此,微軟即日起在 Edge Canary 和 Dev 通道中引入了 Aion-1.0-Instruct 小語(yǔ)言模型的開發(fā)者預(yù)覽版。該模型更小、更快、更高效,可擴(kuò)展到更多設(shè)備 —— 包括 GPU 性能較低的設(shè)備,以及通過(guò) CPU 推理支持無(wú) GPU 的設(shè)備,同時(shí)為廣泛的 Web 使用場(chǎng)景提供良好的輸出質(zhì)量。
該預(yù)覽版允許開發(fā)者在真實(shí) Web 場(chǎng)景中評(píng)估 Aion-1.0-Instruct,測(cè)試 API 互操作性并提供反饋,該模型計(jì)劃于 7 月以開源形式發(fā)布到 Hugging Face。
在 Edge 148 預(yù)覽版中,全新的語(yǔ)言檢測(cè)和翻譯 API 已正式可用。這些 API 允許網(wǎng)站和瀏覽器擴(kuò)展識(shí)別文本語(yǔ)言并在語(yǔ)言對(duì)之間進(jìn)行翻譯,基于端側(cè)任務(wù)專用模型,支持 145 種以上語(yǔ)言,并針對(duì) Web 翻譯負(fù)載進(jìn)行了優(yōu)化。
開發(fā)者可以在網(wǎng)站或擴(kuò)展中使用 JavaScript 調(diào)用這些 API,相比云服務(wù),可獲得更好的用戶隱私、網(wǎng)絡(luò)獨(dú)立性以及零翻譯成本。
在最新的 Edge Canary 和 Dev 通道中,微軟還引入了處理語(yǔ)音的端側(cè)任務(wù)專用模型,實(shí)現(xiàn)了 Web Speech API 的本地語(yǔ)音識(shí)別。該實(shí)現(xiàn)將語(yǔ)音轉(zhuǎn)文字過(guò)程在用戶設(shè)備上本地完成,可改善用戶隱私、降低延遲,并支持低網(wǎng)絡(luò)連接或無(wú)網(wǎng)絡(luò)場(chǎng)景。開發(fā)者只需在現(xiàn)有 Web Speech API 代碼中做少量修改,例如設(shè)置 recognition.processLocally = true,即可啟用端側(cè)語(yǔ)音識(shí)別。
微軟表示,借助 Aion-1.0-Instruct 小語(yǔ)言模型、新的語(yǔ)言檢測(cè)和翻譯 API 以及端側(cè)語(yǔ)音識(shí)別,開發(fā)者可以利用內(nèi)置于瀏覽器的模型打造基于 AI 的 Web 體驗(yàn),無(wú)需依賴專用硬件、云服務(wù)或特定領(lǐng)域?qū)I(yè)知識(shí)。
微軟 Build 2026 開發(fā)者大會(huì)專題
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。