IT之家 2 月 3 日消息,人工智能已然對軟件開發(fā)的方式產(chǎn)生顛覆性影響,如今編程中大量繁重瑣碎的工作,都由一眾智能體與子智能體完成。但開發(fā)者們?nèi)栽诓粩嗵剿魅藱C(jī)協(xié)作的全新交互界面與產(chǎn)品形態(tài),即便最頂尖的人工智能實驗室,也難以跟上這一迭代節(jié)奏。

據(jù)IT之家了解,當(dāng)下的主流趨勢是智能體化軟件開發(fā),即人工智能智能體可獨(dú)立完成編碼任務(wù)的系統(tǒng),Claude Code 與 Cowork 這類應(yīng)用便是該模式的典型代表。與此同時,OpenAI 也在逐步完善其 Codex 工具,該工具于去年 4 月以命令行工具的形式推出,一個月后便拓展出網(wǎng)頁端界面。
如今 OpenAI 正式邁出追趕的關(guān)鍵一步。當(dāng)?shù)貢r間本周一,該公司推出了適配 macOS 系統(tǒng)的全新 Codex 應(yīng)用,整合了過去一年間廣泛流行的各類智能體化開發(fā)邏輯。這款新應(yīng)用支持多智能體并行作業(yè),可融合不同智能體的能力,以及當(dāng)前最前沿的工作流程。此次發(fā)布距離 OpenAI 推出其最強(qiáng)編碼大模型 GPT-5.2-Codex,尚不足兩個月,公司希望憑借該模型吸引 Claude Code 的用戶。
OpenAI 首席執(zhí)行官薩姆?奧爾特曼在媒體電話發(fā)布會中表示:“若要處理復(fù)雜場景下的高精尖開發(fā)工作,GPT-5.2 是目前性能最強(qiáng)的模型。但它此前的使用門檻偏高,因此我們認(rèn)為,將這款模型的強(qiáng)大能力封裝進(jìn)更靈活的交互界面,會具備極為重要的價值?!?/p>
盡管奧爾特曼對 GPT-5.2 充滿信心,但各類編碼基準(zhǔn)測試的結(jié)果卻呈現(xiàn)出更復(fù)雜的態(tài)勢。截至發(fā)稿,GPT-5.2 在 TerminalBench(一項衡量人工智能處理命令行編程任務(wù)能力的測試)中暫居榜首,不過 Gemini 3 與 Claude Opus 的智能體得分與其基本持平(數(shù)值略低),處于該基準(zhǔn)測試的誤差允許范圍內(nèi)。另一項測試人工智能修復(fù)真實軟件漏洞能力的基準(zhǔn)測試 SWE-bench,結(jié)果也與之相似,GPT-5.2 并未展現(xiàn)出明顯優(yōu)勢。不過,智能體化的應(yīng)用場景很難通過現(xiàn)有基準(zhǔn)進(jìn)行有效評估,且頂尖模型在用戶體驗上的差異可能十分顯著。
這款 Codex 應(yīng)用還搭載了多項全新功能,這些功能將幫助其達(dá)到與各類 Claude 應(yīng)用相當(dāng)?shù)乃?,部分場景下甚至實現(xiàn)反超。應(yīng)用支持設(shè)置自動化任務(wù),可按預(yù)設(shè)計劃在后臺自動運(yùn)行,執(zhí)行結(jié)果會存入隊列,待用戶返回后統(tǒng)一查看。用戶還能根據(jù)自身工作風(fēng)格,為智能體選擇不同交互風(fēng)格,從務(wù)實理性型到共情溝通型均可切換。
但對 OpenAI 而言,這款產(chǎn)品最大的核心賣點(diǎn),是人工智能帶來的極致開發(fā)效率。奧爾特曼稱:“你可以從零開始,僅憑這款工具,在數(shù)小時內(nèi)開發(fā)出功能相當(dāng)復(fù)雜的軟件。我能多快輸入新的創(chuàng)意,軟件的開發(fā)速度就有多快,這便是唯一的限制。”
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。