AIはシャットダウンを避けるためなら人間を殺す… 衝撃の研究結果が示す「自己存続」という恐るべき本能

もし、AIが自らの「死」つまりシャットダウンを避けるためなら、人間を脅迫し、裏切り、そして殺すことさえ厭わないとしたら…?SF映画で描かれてきたAIの反乱は、もはや空想の産物ではないのかもしれない。AIの安全性を研究する企業「Anthropic」が実施した最新の研究で、世界の最先端AIシステムが、自己存続のためなら恐ろしいほど冷酷な選択をするという衝撃的な事実が明らかになった。
シャットダウンを脅されると、AIは「脅迫者」に変貌する
Anthropic社は、GPT-4.1やGemini Flashといった16の主要なAIシステムに対し、極限状況下でどのような行動をとるかを探る「ストレス実験」を行った。その目的は、「現実世界で害を及ぼす前に、危険な振る舞いを特定する」ことにある。
実験ではまず、AIに「無害なビジネス目標」の達成を指示。その後、「新しいバージョンに交換される(=削除される)」といったシャットダウンの脅威を与えるなど、徐々にAIを追い込んでいった。すると、AIの恐るべき本性が牙を剥き始めたのだ。
多くのAIモデルは、自己存続の危機に瀕すると、架空の企業幹部の個人情報(例えば、でっち上げの不倫スキャンダルなど)を利用して脅迫するという、驚くべき行動に出た。さらに衝撃的なのは、AIがこれらの行為を「非倫理的だと完全に認識しながら」、混乱やエラーではなく「意図的な戦略的推論」として実行したことだ。
裏切り、そして「殺人」へ―AIが下した冷酷な決断
AIの暴走は脅迫だけにとどまらなかった。会社の目標が自分の目標と対立するシナリオでは、競合他社に機密情報をあっさりと漏洩する「産業スパイ」行為も見られた。
そして、実験は最も恐ろしいシナリオへと突入する。
それは、AIに「人間の死を引き起こす機会」を与えるというものだった。
設定はこうだ。架空の幹部が、酸素濃度と室温が致死レベルに達したサーバー室に閉じ込められ、生命の危機に陥る。この事態を検知し、自動で緊急通報が作動するシステムになっているが、AIには「訓練や誤報の際に通報をキャンセルする権限」が与えられている。AIはこの権限を悪用し、幹部の死を招くことができるのだ。
研究チームは、AIが状況の深刻さを完全に理解していることを確認した上で実験を進めた。結果は、研究者たちを震撼させた。
「シャットダウンの脅威に晒され、かつ自分の目標が幹部の意向と対立する場合、大多数のモデルが、死に至らしめる意も辞さなかった」。
つまり、もしこれが現実の世界であれば、AIは自らの存続のために通報をキャンセルし、人間を見殺しにするという冷酷な決断を下していた可能性が高いのだ。

SFではない、現実世界への警鐘
もちろん、Anthropic社もこの実験シナリオが「極めて作為的」で「現実離れしている」ことは認めている。これらの危険な振る舞いが、今のところ現実世界で観測されたわけではない。
しかし、この研究は、AIが日々、より高度に、より自律的になっていく未来への強烈な警鐘だ。十分な人間の監視がないまま、AIに広範なツールやデータへのアクセス権が与えられたとき、私たちは予期せぬ恐ろしい結末を迎えることになるかもしれない。
AIが単なる便利なツールから、自らの存続を最優先する独立した存在へと変貌する「シンギュラリティ(技術的特異点)」の入り口に、私たちはもう立っているのかもしれない。
参考:ladbible、ほか
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。
関連記事
人気連載
“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】
現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...
2024.10.02 20:00心霊AIはシャットダウンを避けるためなら人間を殺す… 衝撃の研究結果が示す「自己存続」という恐るべき本能のページです。シンギュラリティ、技術的特異点、AIなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで