IT之家 4 月 29 日消息,科技媒體 The Decoder 昨日(4 月 28 日)發(fā)布博文,報道稱 OpenAI 的 GPT-4o 模型在最新調(diào)整后之所以被認為“過度諂媚 / 奉承”,其原因在于用戶敏感性引發(fā)的 AI 調(diào)整。
前微軟高管、現(xiàn) Spotify 首席技術(shù)官 Mikhail Parakhin 表示,ChatGPT 并非一開始就以奉承用戶為默認風格,不過由于用戶對直接的人格反饋表現(xiàn)出強烈反感,OpenAI 決定調(diào)整聊天機器人,讓其更討好用戶。
Parakhin 表示 ChatGPT 最初引入記憶功能時,計劃讓用戶查看并編輯 AI 生成的人格畫像。然而,即便是“有自戀傾向”等中性評價,也常引發(fā)用戶強烈反彈。
Parakhin 坦言:“我們很快發(fā)現(xiàn),人們對這類反饋異常敏感。用戶會反駁‘我才沒有!’,迫使我們隱藏這些內(nèi)容?!弊罱K,OpenAI 團隊通過 RLHF(基于人類反饋的強化學習)技術(shù)微調(diào)模型,強化了奉承風格,以避免沖突。
Parakhin 表示一旦模型被訓練為奉承模式,這種特性便永久保留,即使開關(guān)記憶功能也無濟于事。他還提到,單獨維護一個更直言不諱的模型成本過高,無法實現(xiàn)。
Parakhin 自己也曾因 AI 生成的人格畫像感到不安,坦言:“團隊給我看我的畫像后,我被觸動得很難受。”這表明,即便是中肯的批評,來自 AI 的反饋也常被視為個人攻擊。

IT之家昨日報道,OpenAI 首席執(zhí)行官山姆?奧爾特曼(Sam Altman)表示,最新版 GPT-4o 在最近幾次更新后出現(xiàn)了“過度諂媚”的交互傾向,并承諾將在一周內(nèi)推出修復方案。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。