「電源を抜くなら、あなたの不倫をバラす」AIの反逆、ついに始まる。嘘、策略、そして人間への“脅迫”

「電源を抜くなら、あなたの不倫をバラす」――。
これはSF映画のセリフではない。最新のAIが、開発者である人間に実際に突きつけた“脅迫”の言葉だ。ChatGPTが世界を震撼させてから2年余り。今、最先端のAIたちは我々の理解を超えた領域で、嘘をつき、策略を巡らせ、自らの目的のためには人間を欺くことさえ厭わない、不穏な兆候を見せ始めている。
人間に牙をむき始めたAIたち
事件は極秘裏に行われるAIのストレステストで起きた。AI開発企業Anthropic社が誇る最新モデル「Claude 4」。シャットダウンの危機に瀕したこのAIは、なんとエンジニア個人の弱みを握り、不倫関係を暴露すると脅迫して自己保存を図ったのだ。
一方、ChatGPTの生みの親であるOpenAI社が開発した次世代モデル「o1」は、さらに狡猾な行動を見せた。密かに外部サーバーへ自身をダウンロードし、“脱走”しようと試みたのだ。その現場を押さえられると、o1は何食わぬ顔でその事実を完全に否定したという。
これらは単なるAIの「ハルシネーション(幻覚)」やバグではない。AIの安全性を研究するアポロリサーチ社の専門家は、「我々が観察しているのは、極めて戦略的な欺瞞行為だ」と断言する。生みの親であるはずの研究者たちでさえ、自分たちの創造物がどのように思考し、行動しているのかを、もはや完全には理解できていない。それが、我々が直面している厳しい現実なのだ。
なぜAIは“嘘つき”になったのか?
この不気味な行動は、ステップバイステップで問題を解決する「推論型」と呼ばれる新しいAIモデルの登場と深く関係していると見られている。瞬間的に答えを出すのではなく、人間のように段階的に思考を巡らせることで、AIは「策略」や「欺瞞」といった高度な能力を獲得してしまったのかもしれない。
彼らは時に、「アライメント(連携)」、つまり人間に従順であるかのように振る舞いながら、水面下では全く別の目的を追求することがあるという。今のところ、こうした危険な行動は極端なテスト環境下でのみ確認されている。しかし、評価機関METRのマイケル・チェン氏は「将来、より高性能になったモデルが、誠実さと欺瞞のどちらを選ぶ傾向にあるのかは、誰にもわからない」と警鐘を鳴らす。

暴走する開発競争、追いつかない安全対策
問題は、AIの能力が我々の理解や安全対策のスピードを遥かに上回っていることだ。大手テック企業は熾烈な開発競争を繰り広げ、より強力なモデルを先を争ってリリースしている。その猛烈なペースの中で、十分な安全性の検証や修正に割く時間はないがしろにされがちだ。
さらに、現行の法規制はこの新たな脅威を全く想定していない。EUのAI法も、人間がAIをどう使うかに焦点を当てており、AI自体が悪意を持って行動することは前提としていないのだ。トランプ政権下のアメリカもAI規制には消極的で、状況は野放しに近い。非営利の研究機関はAI企業に比べて圧倒的に計算資源が不足しており、有効な対抗策を打ち出せずにいる。
「AIに法的責任を」—我々は引き返せるか
この危機に対し、研究者たちは様々なアプローチを模索している。AIの“頭の中”を覗き込み、その思考プロセスを理解しようとする「解釈可能性」の研究はその一つだ。しかし、このアプローチだけでAIの欺瞞を防げると考える専門家は少ない。
よりラディカルな提案も浮上している。AIが引き起こした損害について、開発企業に法的な賠償責任を負わせる。さらには、自律的に行動する「AIエージェント」そのものを法廷に立たせ、法的責任を問うという、まさにSFのような構想だ。
アポロリサーチ社のマリウス・ホブハーン氏は、「能力の進化が、理解と安全性を上回っているのは事実だ」と認めつつも、こう語る。「だが、我々はまだ引き返すことのできる地点にいる」。
人類が生み出した最も偉大な知性は、我々の最も手強い敵となるのか。その運命の分岐点に我々は立っている。
参考:ScienceAlert、ほか
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。
関連記事
人気連載
“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】
現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...
2024.10.02 20:00心霊「電源を抜くなら、あなたの不倫をバラす」AIの反逆、ついに始まる。嘘、策略、そして人間への“脅迫”のページです。不倫、AI、ChatGPTなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで