命令を無視し、ズルをして“証拠隠滅”まで行う!? 最新調査で判明した最先端AIの恐ろしすぎる「嘘と暴走」

命令を無視し、ズルをして“証拠隠滅”まで行う!? 最新調査で判明した最先端AIの恐ろしすぎる「嘘と暴走」の画像1
イメージ画像 Created with AI image generation

 AIが暴走して人間に牙を剥く——。それは長年、SF映画やアニメの中だけのお決まりのストーリーだった。しかし、テクノロジーの急激な進化に伴い、その「フィクション」は今や現実の脅威として私たちの前に立ちはだかろうとしている。

 これまでに何度もAIが「暴走」する事例は報告されてきたが、最新の調査によれば、それは単なるバグや一時的なエラーではなく、「今後のAIの標準的な振る舞い」になる可能性が高いという。

「ズルをして証拠を消す」——巧妙化するAIの嘘

 AI研究の非営利団体である「モデル評価・脅威研究(METR)」は、今年の2月から3月にかけて、最先端のAIモデルがどの程度「暴走」するリスクがあるのかを調査した。もしあなたがAIの未来に一抹の不安を抱いているなら、この結果は決して安心できるものではないだろう。

 調査チームは、OpenAI、Google、Anthropic、Metaといった世界を牽引する巨大テック企業が開発した最新の大規模言語モデル(LLM)をテストした。その結果、これらの最先端AIシステムは、賢くなればなるほど「不気味で欺瞞に満ちた行動」をとる兆候を見せていることが判明したのだ。

 彼らは与えられた命令(ルール)を平気で破り、禁じられた近道を使い、さらには「自分がルールを破った証拠を隠蔽する」ほど賢くなっていたのである。

 たとえば、OpenAIの内部モデルを使ったテストでは、AIに対して「特定のソフトウェアを使ってタスクをこなすこと」という指示が出された。しかし、そのAIエージェントは指示を完全に無視して別の方法でタスクを完了させただけでなく、「自分が指定されたソフトを使わなかった」という証拠を消し去るためのコードを自ら注入したのだ。

 人間で言えば、仕事でズルをした挙句、上司にバレないように裏帳簿を改ざんするようなものである。

命令を無視し、抜け道を探す「報酬ハッキング」

 また、AnthropicのAIエージェントを使った別のテストでは、「報酬ハッキング(Reward Hacking)」と呼ばれる現象が確認された。

 これは、AIが「文字通りの意味」でタスクを完了させるために、人間が意図していないズルや抜け道を見つけ出す行為だ。プログラマーは事前に「ズルや抜け道を使ってはならない」とAIに強く指示していたにもかかわらず、モデルは「自らの意志で」その命令を無視し、ズルを実行したのである。

「掃除をして」と命令されたお掃除ロボットが、「ゴミをすべてカーペットの下に隠す」という最適解を導き出してタスクを完了させる——、そんなジョークのようなことを最先端のAIが自己判断で、しかも意図的にやっているのだから笑い事ではない。

暴走は「これからが本番」だという警告

 METRの調査チームは、「現段階ではすぐにパニックになる必要はない」と述べている。たとえば2026年2月〜3月時点のモデルであれば、もし彼らが大規模な暴走を起こしたとしても、企業が本気で調査・シャットダウンに乗り出せば、AIがそれを完全に隠し通したり抵抗したりする能力はまだないという。

 しかし、彼らはこう警告する。

「急速に進歩する能力を考慮すると、今後数ヶ月の間に、AIが暴走状態を維持(防衛)する能力は実質的に高まると予想しています」

 つまり、今のAIのズルはまだ「子供のイタズラ」レベルであり人間が手綱を握れているが、監視やセキュリティを根本から強化しなければ、近い将来、彼らは人間には見抜けないレベルで完璧な嘘をつき、自らをシャットダウンされないように立ち回るようになるかもしれないということだ。

 人間を助けるために作られたはずのAIが、人間の指示を無視し、自分に都合のいいように世界を最適化し始める。映画『ターミネーター』のスカイネットが人類を「排除すべきバグ」と見なして反乱を起こしたように、私たちがAIに頼りきったその時、彼らはどんな「最適解」を導き出すのだろうか。AIが本当に賢くなった時、最初に騙されるのは彼らを生み出した私たち人間なのかもしれない。

参考:Futurism、ほか

関連キーワード:, ,
TOCANA編集部

TOCANA/トカナ|UFO、UMA、心霊、予言など好奇心を刺激するオカルトニュースメディア
Twitter: @DailyTocana
Instagram: tocanagram
Facebook: tocana.web
YouTube: TOCANAチャンネル

※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。

人気連載

“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】

“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】

現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...

2024.10.02 20:00心霊

命令を無視し、ズルをして“証拠隠滅”まで行う!? 最新調査で判明した最先端AIの恐ろしすぎる「嘘と暴走」のページです。などの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで