IT之家 11 月 10 日消息,據華為麒麟官方公眾號今日分享,基于華為 CANN(Compute Architecture for Neural Networks)端云協(xié)同架構打造的華為 PC 端 AI 閃繪功能近日正式落地,標志著端側 AI 大模型應用邁入新階段。

據介紹,AI 閃繪是一種基于擴散模型的圖生圖技術,可根據現有圖片與提示詞生成符合用戶預期的新圖像。該功能由華為 CANN 團隊與生態(tài)伙伴悟空圖像協(xié)作打造,雙方圍繞 SDXL(Stable Diffusion XL)模型的端側部署展開合作,突破了模型瘦身、多風格適配與算子優(yōu)化等關鍵技術。
華為麒麟介紹稱,端側 AI 大模型的部署長期面臨三大挑戰(zhàn),包括:模型體積龐大:大模型參數規(guī)模可達數十億甚至百億級,端側設備面臨非常大的內存壓力;推理延遲高:端側算力有限,復雜模型難以實現實時響應;風格單一化:單一模型難以滿足用戶多樣化創(chuàng)作需求。
針對這些痛點,CANN 團隊提出“瘦身 — 加速 — 靈活”三位一體技術路徑,依托 CANN 端云一致的異構計算架構及內置量化能力,雙方團隊通過混合精度量化,將 SDXL 模型的體積大幅度壓縮,同時高度保留原始精度。
IT之家從華為麒麟獲悉,這一優(yōu)化不僅能高效壓縮模型在端側的存儲空間,還能使得推理時的內存帶寬顯著減少。該方案已在麒麟芯片 NPU 完成驗證,為端側大模型的高效運行奠定了基礎。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。