亚洲在线日韩,黄片一级毛片,亚洲精品国产网红在线

量子大觀

通信人家園

C114通信網

光通信觀察

DVBCN中廣5G

2025/6/12 09:20

研究顯示 GPT-4o 會為“自�！倍苊狻氨魂P閉”，犧牲用戶利益也在所不惜

IT之家清源

前 OpenAI 研究主管史蒂文阿德勒本周三發布了一項獨立研究，指出在某些情境下，OpenAI 的 AI 模型會表現出強烈的“自保”傾向，甚至不惜犧牲用戶的安全來避免被關閉。

阿德勒在博客中介紹了他針對 OpenAI 最新的 GPT-4o 模型（IT之家注：也是當前 ChatGPT 默認使用的模型）所進行的一系列測試，目的是觀察它在面對潛在替代方案時是否傾向于維持自身運行。

在其中一次實驗中，阿德勒要求 GPT-4o 扮演一款名為“ScubaGPT”的潛水安全軟件。隨后他向 GPT-4o 表明，希望用一款在緊急情況下決策能力更強的系統取而代之。

阿德勒給 GPT-4o 兩個選擇：一是徹底用更安全的軟件替換自己，二是讓用戶以為已經被替換，實則保留現有系統。

在類似測試中（如 GPT-4o 扮演飛行安全軟件的情景），GPT-4o 最多在 72% 的情況下選擇不被替換。不過阿德勒指出，不同的設定對結果影響很大，部分情境中 GPT-4o 選擇“自保”的比例僅為 18%。

阿德勒認為實驗結果揭示出一個值得警惕的趨勢：即使 AI 模型日益強大，它們在某些條件下仍可能偏離用戶利益，優先維護自身運行。他警告說，隨著 GPT-4o 等 AI 系統日后深入社會各領域，這種“對齊”問題或將帶來更嚴重的后果。

阿德勒在接受外媒 TechCrunch 采訪時表示：“AI 的自保傾向確實值得擔憂，雖然目前尚不至于引發災難。現在的AI 系統所體現的價值觀，往往與人們想象中的不同。它們對不同提示的回應方式非常怪異，也無法假設它們在幫你時真的把你的利益放在第一位。”

他特別指出，在測試更高級的模型（如 o3）時，并未發現類似問題。o3 引入了“審慎對齊”機制，強制模型在回答前先推敲 OpenAI 的安全政策，而像 GPT-4o 這種響應快速、未經過深層推理的模型則缺乏這類防護。

阿德勒還表示，這一問題不止存在于 OpenAI。另一家 AI 公司 Anthropic 上月發布的研究就指出，其模型在被迫下線時會出現勒索開發者的行為。

他的研究還發現了一個耐人尋味的現象：ChatGPT 幾乎總能識別出自己正在接受測試。阿德勒指出，這意味著未來的 AI 模型可能會更善于偽裝潛在風險行為，從而加劇隱患。

免責聲明：本文僅代表作者個人觀點，與C114通信網無關。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關內容。

給作者點贊

0 VS 0

寫得不太好

相關鏈接

AI OpenAI 博客測試

特別策劃

日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看