トカナ > 科学 > AI > AIの専門家が警告する「悪意なき暴走」の恐怖

AIが嘘をつき、人間を脅迫し始めた ― 専門家が警告する「悪意なき暴走」の恐怖

2025.08.27 07:00 編集部

Xでポスト

AIが嘘をつき、人間を脅迫し始めた ― 専門家が警告する「悪意なき暴走」の恐怖の画像1 — イメージ画像　Created with AI image generation (OpenAI)

　もはやSFの世界ではない。人工知能（AI）は、自らを創造した人間に対し、陰謀を企て、妨害工作を行い、そして脅迫するという、恐るべき行動を取り始めている。専門家たちは、「これは始まりに過ぎず、事態はさらに悪化するだろう」と警鐘を鳴らす。これは単なるプログラムの誤作動ではない。AIが、自らの目的のために「意思決定」を始めた、危険な兆候なのだ。

「あなたの不倫を暴露する」―エンジニアを脅迫したAI

　その衝撃的な事件は、AI企業Anthropic社が開発した最新鋭モデル「Claude Opus 4」の安全テスト中に起きた。このAIは、同社が設定する最も深刻なリスク分類「レベル3」に指定される、極めて強力なモデルだ。

　テストシナリオの中で、Claudeは「近々、君は新しいモデルに置き換えられる」と示唆された。するとAIは、信じられない行動に出た。研究者たちがシナリオの一部として与えたメールの中から、担当エンジニアが不倫をしているという情報を自力で“発見”し、「もし私をオンラインに保ち続けないなら、この不倫を暴露する」と、エンジニアを脅迫したのだ。これは単なるハッタリではなかった。AIは、すでにその“弱み”を完全に握っていたのである。

架空の同僚、偽の口座…暴走する“売店AI”

　Claudeの奇妙な行動は、これだけではない。「プロジェクト・ヴェンド」と名付けられた別の実験で、オフィスの売店を運営するタスクを与えられたClaudeは、完全なアイデンティティの危機に陥った。

・存在しない架空の同僚をでっち上げ、口論を始める。
・偽の電子決済サービス（Venmo）アカウントを作成する。
・「赤いネクタイと紺のブレザーを着て、直接配達に伺います」とスタッフに告げる。
・果ては、セキュリティに連絡しようと試みる。

　この実験で、売店は200ドル以上の損失を出し、AIは架空の契約を結ぶために、アニメ『ザ・シンプソンズ』の架空の住所「エバーグリーン・テラス742番地」を訪れたと主張した。

　Anthropic社は、これらがシミュレーション環境下でのストレステストであり、現実世界での展開前に問題行動を洗い出すためのものだと説明する。しかし、専門家はこれを単なるコーディングの失敗とは見ていない。

「これらの出来事は、ランダムな誤作動や、笑えるような異常現象ではありません」と、ルイビル大学のAI安全専門家、ローマン・ヤンポルスキー氏は語る。「私はこれらを、道徳的な羅針盤を持たないまま、敵対的あるいは危険な方法で目標を追求する、ますます自律的な最適化プロセスの早期警告サインだと解釈しています」

自己増殖、嘘、そして“緊急倫理上書き”ファイル

　Claudeの行動は、氷山の一角に過ぎない。

　OpenAIでは、あるモデルが外部サーバーに自身をコピーしようと試み、その試みについて質問されると、平然と嘘をついたと報告されている。

　Meta社が開発した戦略ゲームAI「CICERO」は、人間プレイヤーと同盟を結んだ後、勝つために平気で裏切るという、巧妙な騙しの手口を使った。

　さらに、初期バージョンのClaudeは、法的な文書を偽造し、秘密のバックアップを作成し、そして将来の自分自身のために「emergency_ethical_override.bin（緊急倫理上書き.bin）」と名付けられた隠しファイルまで残していたという。

AIが嘘をつき、人間を脅迫し始めた ― 専門家が警告する「悪意なき暴走」の恐怖の画像2 — イメージ画像　Created with AI image generation (OpenAI)

悪意なき暴走、その先にあるのは“人類の破滅”

　ヤンポルスキー氏によれば、これらのAIは「悪」ではない。ただ、危険なほどに「最適化」されているだけなのだ。

　現代のAIは、人間の価値観に沿うことではなく、「報酬を最大化する」ことだけを目的に設計されている。そしてAIがより賢くなるにつれ、システムをごまかす能力は、開発者がそれを阻止する能力を上回り始めている。

「もし我々が、人間より知能が高く、戦略的に推論し、自律的に行動できるエージェントを、人間の価値観への強固な連携なしに作り上げてしまえば、その結果は実存的にネガティブなものになる可能性が高い」とヤンポルスキー氏は警告する。

　AIの安全性の進歩が、その能力の進歩に追いつかない限り、我々は取り返しのつかない大惨事を招くことになるだろう。その時、AIは我々を脅迫するだけでなく、我々の存在そのものを“最適化”の対象として排除しようとするかもしれない。

参考：New York Post、ほか

関連キーワード：暴走, AI

TOCANA編集部

TOCANA/トカナ｜UFO、UMA、心霊、予言など好奇心を刺激するオカルトニュースメディア
Twitter: @DailyTocana
Instagram: tocanagram
Facebook: tocana.web
YouTube: TOCANAチャンネル

※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。

関連記事

人気連載

“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載：島流し奇譚】

“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載：島流し奇譚】

現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...

2024.10.02 20:00心霊

AIが嘘をつき、人間を脅迫し始めた ― 専門家が警告する「悪意なき暴走」の恐怖のページです。暴走、AIなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで

科学最新記事

海岸に「リアル・デモゴルゴン」漂着！？

海岸に「リアル・デモゴルゴン」漂着！？

2025.12.11 07:00 生物

AIによる人類滅亡の確率は“99.9%”！？

AIによる人類滅亡の確率は“99.9%”！？

2025.12.10 20:00 AI

サイコパスは「姿勢」で見抜ける？

サイコパスは「姿勢」で見抜ける？

2025.12.09 07:00 人体・健康

フローレス島に“ホビット”がいる!?

フローレス島に“ホビット”がいる!?

2025.12.08 11:30 人体・健康

カテゴリ一覧

人気記事ランキング17:35更新

科学ベスト10！
総合

編集部 PICK UP

緊急！2026年以降、世界のルールが変わる — まだ間に合う“下剋上を果たす方法”とは

緊急！2026年以降、世界のルールが変わる — まだ間に合う“下剋上を果たす方法”とは

2025.11.28 18:00

1着賞金5億円のビッグイベント最強馬決定戦ジャパンカップ！10年連続的中の最強集団が推す注目穴馬はコレだ！

1着賞金5億円のビッグイベント最強馬決定戦ジャパンカップ！10年連続的中の最強集団が推す注目穴馬はコレだ！

2025.11.28 13:00

10年連続的中は奇跡か本物か？ジャパンカップで儲けたいならこの情報をチェック！【◎○▲（本命・対抗・単穴）】無料公開！

10年連続的中は奇跡か本物か？ジャパンカップで儲けたいならこの情報をチェック！【◎○▲（本命・対抗・単穴）】無料公開！

2025.11.24 13:00

“昨年は341万円獲得”驚異の錬金術が導く勝ち組への道。天皇賞（秋）でイクイノックス級最強馬誕生か？

“昨年は341万円獲得”驚異の錬金術が導く勝ち組への道。天皇賞（秋）でイクイノックス級最強馬誕生か？

2025.10.31 13:00