在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

5620 億參數(shù)!谷歌發(fā)布史上最大“通才”AI 模型 PaLM-E,可讓機(jī)器人自主執(zhí)行多種任務(wù)

2023/3/8 19:46:02 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋
感謝IT之家網(wǎng)友 HH_KK 的線索投遞!

IT之家 3 月 8 日消息,周一,來自谷歌和柏林工業(yè)大學(xué)的一組人工智能研究人員推出了史上最大的視覺語言模型 ——PaLM-E,參數(shù)量高達(dá) 5620 億(GPT-3 的參數(shù)量為 1750 億)。

PaLM-E 是迄今為止已知的最大 VLM(視覺語言模型)。作為一種多模態(tài)具身 VLM,它不僅可以理解圖像,還能理解、生成語言,執(zhí)行各種復(fù)雜的機(jī)器人指令而無需重新訓(xùn)練。它還展示出了強(qiáng)大的涌現(xiàn)能力(模型有不可預(yù)測的表現(xiàn))。

據(jù)谷歌稱,當(dāng)?shù)玫揭粋€高級命令,如“把抽屜里的米片拿給我”,PaLM-E 可以為帶有手臂的移動機(jī)器人平臺(由谷歌機(jī)器人公司開發(fā))生成一個行動計劃,并自行執(zhí)行這些行動。

PaLM-E 通過分析來自機(jī)器人攝像頭的數(shù)據(jù)來實(shí)現(xiàn)這一目標(biāo),而無需對場景進(jìn)行預(yù)處理。這消除了人類對數(shù)據(jù)進(jìn)行預(yù)處理或注釋的需要,使機(jī)器人控制更加自主。

PaLM-E 還很有彈性,能夠?qū)Νh(huán)境做出反應(yīng)。例如,PaLM-E 模型可以引導(dǎo)機(jī)器人從廚房里拿一袋薯片,由于 PaLM-E 集成到了控制回路中,它對任務(wù)中可能發(fā)生的中斷有了抵抗力。在一個視頻例子中,一名研究人員從機(jī)器人手中抓起薯片并移動它們,但機(jī)器人找到了薯片并再次抓起它們。

另外,PaLM-E 模型也可控制機(jī)器人自主完成原需人類指導(dǎo)的復(fù)雜任務(wù)。除了機(jī)器人技術(shù)外,谷歌研究人員還觀察到使用大型語言模型作為 PaLM-E 核心的幾個有趣效果,其中一個是 PaLM-E 能表現(xiàn)出“正向轉(zhuǎn)移”,這意味其可將從一個任務(wù)中學(xué)到的知識和技能轉(zhuǎn)移到另一個任務(wù)中,相較單任務(wù)機(jī)器人模型能有更好的表現(xiàn)。

谷歌研究人員計劃未來將探索 PaLM-E 在現(xiàn)實(shí)世界中有更多應(yīng)用,例如家庭自動化或工業(yè)機(jī)器人,也希望 PaLM-E 能夠激發(fā)更多關(guān)于多模態(tài) AI 的應(yīng)用。

IT之家曾報道,身為谷歌 AI 勁敵的微軟近期也發(fā)表了「ChatGPT for Robotics」的論文,以類似的方式結(jié)合視覺數(shù)據(jù)和大型語言模型來控制機(jī)器人。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:谷歌,機(jī)器人,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知