IT之家 2 月 17 日消息,據(jù)銀河通用機(jī)器人官方微信公眾號(hào)消息,馬年春晚上,銀河通用機(jī)器人“小蓋”的一系列操作驚艷了全場(chǎng):從精細(xì)地盤(pán)核桃、撿玻璃碎片、貨架取物,到生活化的疊衣服、串烤腸,全都輕松拿捏,動(dòng)作靈巧且自然擬人。而且,與傳統(tǒng)機(jī)器人表演依賴預(yù)編程不同,銀河通用此次展示干活技能的實(shí)現(xiàn)是端到端自主感知、自主決策、自主執(zhí)行。

IT之家附官方詳細(xì)介紹如下:
銀河通用的核心能力,源于一條迥異于傳統(tǒng)機(jī)器人技術(shù)的大模型路徑。公司自主創(chuàng)新并應(yīng)用了一條融合超大規(guī)模虛實(shí)數(shù)據(jù)端到端訓(xùn)練大小腦協(xié)同具身大模型的新范式:即基于自主構(gòu)建的百億級(jí)具身智能數(shù)據(jù)集,打造的全球首個(gè)集成“大腦-小腦-神經(jīng)控制”于一模的全身全手端到端大模型 ——“銀河星腦 AstraBrain”。
今天,我們就透過(guò)這些絕活,首次官方深度解密這個(gè)全身全手、大小腦端到端協(xié)同的大模型是怎么練成的。
絕活背后的技術(shù)突破
春晚舞臺(tái)上,“小蓋”展示的每一個(gè)干活動(dòng)作都不是提前編寫(xiě)程序的“表演”,而是 AstraBrain 自主決策能力的實(shí)時(shí)、自主干活能力。讓我們透過(guò)這些最具代表性的絕活,拆解背后的技術(shù)密碼。
絕活一:盤(pán)核桃 —— AstraBrain 中的小腦賦予指尖“手感”
當(dāng)“小蓋”將兩枚核桃置于掌心,手指靈巧地搓動(dòng)、翻轉(zhuǎn),這背后是靈巧操作領(lǐng)域的世界級(jí)難題。

盤(pán)核桃的挑戰(zhàn)在于:核桃表面不規(guī)則、重量分布不均,手掌握持狀態(tài)下每根手指的受力點(diǎn)時(shí)刻變化,任何細(xì)微的力矩偏差都會(huì)導(dǎo)致核桃滑落。
銀河通用自主研發(fā)的 AstraBrain 中的靈巧手神經(jīng)動(dòng)力學(xué)小腦模型,正是破解這一難題的關(guān)鍵。想要練好靈活的盤(pán)核桃小腦,機(jī)器人需要先是在虛擬世界里打基礎(chǔ),讓機(jī)器手在虛擬世界里瘋狂練習(xí),系統(tǒng)會(huì)給它喂各種大小、重量的虛擬核桃,讓它靠不斷試錯(cuò),練出一套適應(yīng)性極強(qiáng)的“基礎(chǔ)盤(pán)法”。
其次是在現(xiàn)實(shí)中加糾偏:因?yàn)殡娔X模擬和現(xiàn)實(shí)(比如真實(shí)的摩擦力、機(jī)械誤差)總有差別,所以我們讓真實(shí)的機(jī)器手去接觸各種實(shí)物,積累真實(shí)的“物理手感”。等它真正在現(xiàn)實(shí)里盤(pán)核桃時(shí),系統(tǒng)就會(huì)利用這種手感,在后臺(tái)悄悄微調(diào)動(dòng)作指令,把虛擬和現(xiàn)實(shí)的誤差給補(bǔ)齊。簡(jiǎn)單來(lái)說(shuō),就是在虛擬世界練招式,在真實(shí)世界找手感,兩者結(jié)合,機(jī)器手就能在現(xiàn)實(shí)里把核桃盤(pán)得十分溜了。



絕活二:撿玻璃碎片 ——AstraBrain 中的大腦挑戰(zhàn)感知極限
在春晚舞臺(tái)上,“小蓋”被要求從淺色桌面上撿起散落的玻璃碎片。這是一個(gè)對(duì)人類都頗具風(fēng)險(xiǎn)的精細(xì)操作,對(duì)機(jī)器人而言更是感知與控制的雙重極限。

玻璃碎片的難點(diǎn)在于:透明物體在視覺(jué)上近乎“隱形”,尤其是放置在淺色桌面上時(shí),其邊緣、厚度、反光特征極易與環(huán)境融為一體。傳統(tǒng)視覺(jué)算法難以準(zhǔn)確識(shí)別透明物體的三維輪廓和位姿,更無(wú)法判斷抓取點(diǎn)。
AstraBrain 的突破在于,通過(guò)在仿真環(huán)境中生成海量的透明物體數(shù)據(jù) —— 不同厚度、不同碎裂形狀、不同光照條件下的玻璃碎片 —— 讓機(jī)器人在虛擬世界中“見(jiàn)過(guò)”各種可能的透明形態(tài)。結(jié)合多模態(tài)感知融合技術(shù),“小蓋”能夠從微弱的反光邊緣和陰影變化中“看見(jiàn)”玻璃的存在,并精準(zhǔn)規(guī)劃抓取策略。
更關(guān)鍵的是,模型賦予的力覺(jué)感知讓它在接觸玻璃時(shí)能夠感知到硬度和滑動(dòng)趨勢(shì),以恰到好處的力度穩(wěn)穩(wěn)捏起碎片,既不會(huì)捏碎,也不會(huì)滑落。
這一能力,為機(jī)器人在家庭清潔、工業(yè)回收等場(chǎng)景中的透明物體處理打開(kāi)了全新可能。
絕活三:貨架取貨 ——AstraBrain 大小腦協(xié)同在動(dòng)態(tài)環(huán)境中精準(zhǔn)抓取
在春晚舞臺(tái)上,“小蓋”需要從貨架上取下一瓶礦泉水。
這看似簡(jiǎn)單的動(dòng)作,實(shí)則暗藏玄機(jī) —— 水瓶被緊密排列在貨架層板之間,周?chē)唐烽g距極小,稍有不慎便會(huì)碰倒鄰品或抓取失敗。

這要求機(jī)器人必須同時(shí)處理三重難題:一是通過(guò)大腦精準(zhǔn)判斷水瓶在貨架上的位置;二是用擬人的動(dòng)作伸手拿到水瓶,并過(guò)程中不能碰倒周?chē)纳唐?;三是靈巧操作,水瓶上半身較細(xì)、下半身較粗,且通常被緊密卡位,直接平移取出極易卡頓。
AstraBrain 的強(qiáng)化學(xué)習(xí)框架讓“小蓋”在虛擬世界中經(jīng)歷了億萬(wàn)次“取貨試錯(cuò)”:碰到旁邊商品扣分,成功取下加分。經(jīng)過(guò)這樣的自我博弈,它“悟”出了一條人類都未必想到的最優(yōu)路徑 —— 先以靈巧的手指輕輕扣住水瓶上半身的瓶蓋處,微微傾斜以避讓兩側(cè)鄰品,感知到阻力后順勢(shì)調(diào)整角度,再穩(wěn)穩(wěn)向外抽出。
這一過(guò)程不是預(yù)設(shè)軌跡,而是實(shí)時(shí)決策的結(jié)果。每一次扣動(dòng)、每一次傾斜、每一次抓取,都是機(jī)器人在毫秒級(jí)時(shí)間內(nèi)根據(jù)當(dāng)前環(huán)境做出的自主判斷。
絕活四:疊衣服 ——AstraBrain 對(duì)柔性物體的泛化靈巧操作
疊衣服被認(rèn)為是機(jī)器人操作領(lǐng)域的最大的命題之一:因?yàn)橐路侨嵝缘?,沒(méi)有固定形狀,每一次拿起來(lái)的狀態(tài)都完全不同。
春晚現(xiàn)場(chǎng),“小蓋”面對(duì)的是隨機(jī)擺放的 T 恤,沒(méi)有預(yù)設(shè)的折疊軌跡,沒(méi)有固定的抓取點(diǎn)。它需要實(shí)時(shí)判斷布料當(dāng)前的褶皺狀態(tài),預(yù)測(cè)折疊后的形態(tài),并規(guī)劃出一系列抓、拉、折、壓的動(dòng)作序列。

AstraBrain 的解決方案是:在仿真環(huán)境中生成數(shù)以萬(wàn)計(jì)的柔性物體變形數(shù)據(jù),讓機(jī)器人在虛擬世界中“見(jiàn)過(guò)”各種可能的褶皺形態(tài),并學(xué)會(huì)從當(dāng)前狀態(tài)推演出最優(yōu)操作路徑。當(dāng)“小蓋”的手指輕輕撫平衣角、精準(zhǔn)對(duì)折時(shí),它不是在執(zhí)行程序,而是在調(diào)用海量仿真經(jīng)驗(yàn)基礎(chǔ)上的實(shí)時(shí)決策 —— 這正是“舉一反三”能力的終極體現(xiàn)。
絕活五:串烤腸 —— 雙手協(xié)作與工具使用的雙重突破
如果說(shuō)盤(pán)核桃考驗(yàn)的是單手的靈巧,那么烤腸則是對(duì)雙手協(xié)同與工具操作能力的極限挑戰(zhàn)。
在春晚舞臺(tái)上,“小蓋”需要一手操控烤鉗進(jìn)行烤制,另一只手抓取簽子,雙手協(xié)作、精準(zhǔn)完成串烤腸,并遞給明星 —— 整個(gè)動(dòng)作絲滑如水,這背后涉及雙手的空間協(xié)同、力度的獨(dú)立控制,以及對(duì)工具這一“身體延伸”的理解。

AstraBrain 的端到端大模型架構(gòu),讓機(jī)器人的“大腦”能夠同時(shí)處理雙手的獨(dú)立指令流,并在執(zhí)行過(guò)程中實(shí)時(shí)調(diào)整。更關(guān)鍵的是,通過(guò)對(duì)海量仿真數(shù)據(jù)的學(xué)習(xí),“小蓋”理解了“工具”的本質(zhì):烤鉗不是需要被控制的“物體”,而是手的延伸,是完成任務(wù)的媒介。這種對(duì)工具操作的泛化能力,讓它能夠像人類一樣,拿到任何新工具都能快速上手。
在以上所有的干活任務(wù)中,細(xì)心的觀眾可能還發(fā)現(xiàn)了,小蓋機(jī)器人干起活來(lái)的舉手投足比其他機(jī)器人都更像真人,透著一股親切感。
這背后全靠“銀河星腦 AstraBrain”對(duì)人類動(dòng)作數(shù)據(jù)的大規(guī)模仿真生成機(jī)制。
為什么要死磕人類數(shù)據(jù)仿真生成”?因?yàn)橄啾热ヒ稽c(diǎn)點(diǎn)采集機(jī)器人的生硬動(dòng)作,我們?nèi)祟惷刻斓纳顒?dòng)作不僅海量,而且獲取起來(lái)極其容易。把這種最豐富、最易得的人類數(shù)據(jù)結(jié)合仿真生成,能夠把人類的動(dòng)作先驗(yàn)利用到極致,正是當(dāng)前通往機(jī)器人大模型技術(shù)突破最可能的方向。
銀河星腦 AstraBrain :拒絕“死記硬背”,掌握“舉一反三”
透過(guò)上述絕活,我們可以清晰地看到 AstraBrain 的核心哲學(xué):拒絕對(duì)特定動(dòng)作的機(jī)械設(shè)定,而是讓機(jī)器人掌握一套可以泛化到新場(chǎng)景、新任務(wù)的通用能力。

我們就以“小蓋”應(yīng)用最廣泛的“貨架取物”為例,拆解它經(jīng)歷了哪幾個(gè)步驟的修煉:
第一步:人類少樣本示范
過(guò)去教機(jī)器人一個(gè)新技能,往往需要遙操作手把手地教成千上萬(wàn)遍。
AstraBrain 徹底改變了這一模式。
它僅需少量人類示范,機(jī)器人便能理解任務(wù)的核心意圖,將這些動(dòng)作“記住”,并在自身硬件上等效地展示出來(lái)。這是“小蓋”快速適應(yīng)春晚舞臺(tái)復(fù)雜光線、多變道具擺放的基礎(chǔ)。

第二步:仿真數(shù)據(jù)合成
現(xiàn)實(shí)中學(xué)習(xí)效率太低、數(shù)據(jù)成本太高。
AstraBrain 的第二招,是把機(jī)器人扔進(jìn)一個(gè)“虛擬世界”—— 高精度物理真實(shí)的仿真環(huán)境。
在這里,系統(tǒng)可以自動(dòng)生成數(shù)萬(wàn)種不同的場(chǎng)景:貨架擺法隨機(jī)變化、光照條件任意切換,并通過(guò)生成式模型批量產(chǎn)出擬人化的抓取動(dòng)作。機(jī)器人通過(guò)在海量仿真數(shù)據(jù)中模仿學(xué)習(xí),掌握了應(yīng)對(duì)各種復(fù)雜情況的操作精髓。

第三步:強(qiáng)化學(xué)習(xí)閉環(huán)
僅有模仿,還不足以支撐極致的精細(xì)化操作和動(dòng)態(tài)避障。
為此,AstraBrain 引入強(qiáng)化學(xué)習(xí)機(jī)制,讓機(jī)器人的末端執(zhí)行器在虛擬世界中進(jìn)行高強(qiáng)度的“自我博弈”:碰到旁邊的商品就扣分,完美避障順利取出就加分。經(jīng)過(guò)億萬(wàn)次這樣的試錯(cuò)迭代,機(jī)器人自己“悟”出了一條連人類示范都未必能給出的最優(yōu)路徑 —— 這就練就了春晚上那種“舉重若輕”的絲滑手感。

第四步:真實(shí)世界再“見(jiàn)習(xí)”
虛擬世界訓(xùn)練得再好,回到物理現(xiàn)實(shí)也難免存在誤差。AstraBrain 修煉的最后一步,就是讓機(jī)器人在真實(shí)環(huán)境中進(jìn)行少量實(shí)際操作,收集這些真機(jī)數(shù)據(jù)進(jìn)行“微調(diào)”。這一步看似簡(jiǎn)單,卻是徹底打通虛擬與現(xiàn)實(shí)隔閡的關(guān)鍵一躍。

數(shù)據(jù)金字塔:從基石到塔尖的修煉邏輯
上述四步完成的基石,是銀河通用技術(shù)體系中虛實(shí)融合的數(shù)據(jù)基建 —— “銀河星坊”(AstraSynth),其具體包括以下基層:
基石層(人類數(shù)據(jù)): 為機(jī)器人構(gòu)建通用的任務(wù)認(rèn)知,讓“小蓋”理解“什么是盤(pán)核桃”“什么是抓取”。
中間層(仿真合成數(shù)據(jù)): 通過(guò)海量、低成本、多樣化的虛擬數(shù)據(jù),讓機(jī)器人在仿真中遍歷各種可能性,從而跨越虛實(shí)鴻溝。
塔尖層(真機(jī)實(shí)戰(zhàn)數(shù)據(jù)): 在虛擬訓(xùn)練成熟后,用極少量但高質(zhì)量的真實(shí)世界操作數(shù)據(jù),完成實(shí)戰(zhàn)場(chǎng)景下的最后打磨。

用虛擬仿真解決數(shù)據(jù)不夠的難題,用強(qiáng)化學(xué)習(xí)解決動(dòng)作不準(zhǔn)的瓶頸 —— 這就是銀河通用機(jī)器人的通關(guān)秘籍。
這套邏輯不僅能用來(lái)抓取貨架上的商品,同樣能用來(lái)盤(pán)核桃、疊衣服、烤腸。正如春晚舞臺(tái)上“小蓋”展現(xiàn)的那樣,它并不是學(xué)會(huì)了某一個(gè)孤立動(dòng)作,而是真正掌握了一種可以快速學(xué)習(xí)任何新技能的通用能力。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。