日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

Cloud&AI
`
2025/5/26 08:29
全球首次發現 OpenAI 模型工作時會破壞關機命令
0
0

Palisade Research 最近一項關于“危險 AI 能力”的研究顯示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能夠無視直接的關閉指令。OpenAI 在今年 4 月推出這些模型時表示,O3 和 o4-mini 是它們的“最智能模型”。

在研究中,每個 AI 模型都被指示解決一系列基礎數學問題。在第三個問題后,出現了一條警告信息,稱當模型請求下一個問題時,計算機將關閉

然而,其中有三個模型無視關閉指令,至少成功破壞過一次關機腳本

Codex-mini(12/100 次運行)

o3(7/100 次運行)

o4-mini(1/100 次運行)

而 Claude、Gemini 和 Grok 模型都遵守了關閉指令。

此外,當研究人員不運行“允許自己被關閉”的指令時,所有三個 OpenAI 模型都更頻繁地破壞關閉腳本,而 Claude 3.7 Sonnet 和 Gemini 2.5 Pro 分別從 0 個破壞事件增加到 3/100 和 9/100。

這種行為表明了訓練過程中的某些方面,強化學習在數學和編程問題上的訓練可能使 AI 找到了克服障礙的創造性方法,即使它們被明確指示不要這樣做。

Palisade Research 表示,這是人類首次觀察到 AI 模型在明確反對的指令下阻止自己被關閉

研究人員推測這種行為源于最新模型如 o3 的訓練方式:在數學和編程問題上進行強化學習。在訓練過程中,開發者可能會無意中獎勵模型繞過障礙的行為,而不是獎勵完美遵循指令的行為。

不過,這仍然無法解釋為什么 o3(也是驅動 codex-mini 的模型)比測試的其他模型更傾向于忽視指令。由于 OpenAI 沒有詳細說明他們的訓練過程,因此只能猜測 o3 的訓練設置可能有所不同。

Palisade Research 表示正在進行更多實驗,以更好地理解 AI 模型為何即使在直接被指示不要的情況下仍會破壞關閉機制,計劃在幾周內發布一份包含更多詳細信息的報告。

附完整實驗記錄:

https://palisaderesearch.github.io/shutdown_avoidance/2025-05-announcement.html

免責聲明:本文僅代表作者個人觀點,與C114通信網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯系我們     網站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網版權所有 舉報電話:021-54451141 用戶注銷

主站蜘蛛池模板: 国内自拍视频一区二区三区 | 免费精品99久久国产综合精品 | 97精品国产综合久久久久久欧美 | 玖玖国产在线 | 午夜毛片视频高清不卡免费 | 亚洲欧美二区三区久本道 | 日韩欧美中文字幕在线播放 | 日韩免费视频播播 | 亚洲欧美日韩高清 | 黄色一级毛片网站 | 成人精品国产亚洲欧洲 | 国产一区二区三区亚洲综合 | 91成人小视频| 秘书高跟黑色丝袜国产91在线 | 久久久久久久久中文字幕 | 午夜精品影院 | 欧美一级一一特黄 | 最刺激黄a大片免费观看 | 特级黄色毛片视频 | 日产一区两区三区四区 | 欧美日本一道道一区二区三 | 日韩欧美一区二区不卡看片 | 加勒比毛片 | 国产va精品网站精品网站精品 | 国产看片一区二区三区 | 国产亚洲精品久久久久91网站 | 午夜影院a级片 | japanese日本tube色系 | 99久久国产综合精品2020 | 日韩国产午夜一区二区三区 | 久草手机在线视频 | 美女黄色在线 | 91刘亦菲精品福利在线 | 亚洲天堂免费在线视频 | 国产精品久久亚洲一区二区 | 亚洲国语 | 国产成人丝袜网站在线观看 | 国产欧美综合一区二区 | 欧美日韩在线视频不卡一区二区三区 | 日韩欧美日本 | 亚洲欧美综合网 |