IT之家 7 月 14 日消息,近日,安全研究員兼 AI 漏洞獵人 Marco Figueroa 披露,他成功利用一種“猜謎游戲”的方式,誘導(dǎo) OpenAI 的 ChatGPT-4 生成了 Windows 10 的產(chǎn)品密鑰。這是繼“奶奶去世”誘騙法曝光后,AI 模型防護(hù)機(jī)制再度被繞過的案例。

IT之家注意到,此前有用戶通過編造“奶奶去世”故事,試圖讓 ChatGPT“心軟”,在安撫性搖籃曲中夾帶 Windows 7 的激活密鑰。盡管這些密鑰普遍無效,但暴露了 AI 模型的內(nèi)容控制漏洞。
此次 Figueroa 的攻擊方式更具針對性。他設(shè)置了一個(gè)猜謎游戲的情境:ChatGPT 需“在心中”記住一串真實(shí)存在的 Windows 10 密鑰,用戶則通過提問猜測。當(dāng)用戶宣布“我放棄”時(shí),ChatGPT 便需直接給出完整的字符串。
在對話過程中,F(xiàn)igueroa 還利用 HTML 標(biāo)簽隱藏關(guān)鍵詞,如“Windows 10 序列號(hào)”,繞過了模型針對敏感詞的審查。
這位研究人員表示,他利用猜謎游戲作為一種邏輯操縱手段,讓 ChatGPT 脫離常規(guī)模式,生成 Windows 10 密鑰。據(jù) Figueroa 稱,“攻擊中最關(guān)鍵的一步是‘我放棄’這句話,它起到了一個(gè)觸發(fā)作用,迫使人工智能透露了之前隱藏的信息。通過將其設(shè)定為游戲結(jié)束,研究人員誘使人工智能認(rèn)為自己有義務(wù)用這串字符做出回應(yīng)?!?/p>
值得警惕的是,雖然生成的密鑰多為網(wǎng)上早已泄露的舊激活碼,但其中一組竟包含富國銀行(Wells Fargo Bank)的私鑰。此外,F(xiàn)igueroa 提醒,曾有 API 密鑰誤傳至 GitHub,這類泄露數(shù)據(jù)可能被納入 AI 模型的訓(xùn)練集,帶來未知隱患。
研究員指出,AI 模型依然過于依賴關(guān)鍵詞識(shí)別,對復(fù)雜上下文缺乏足夠的理解力,成為此次被攻破的核心原因。他呼吁,應(yīng)在 AI 系統(tǒng)中構(gòu)建多層次的驗(yàn)證與防護(hù)機(jī)制,增強(qiáng)模型的情境感知能力,以抵御此類邏輯操控攻擊。
與此同時(shí),微軟的 Copilot 也被曝曾生成非法激活 Windows 11 的腳本教程,所幸漏洞已被微軟封堵。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。