AIも“病む”のか? 専門家が警告する「AIの精神病理」32の症状

めざましい進化を現在進行形で遂げているAI(人工知能)だが、時に人間と同じようにメンタルが“病む”ことはあるのだろうか。科学者たちは、 AIシステムが“暴走”する可能性のある32の恐ろしいケースを明らかにしている。
■AIの“暴走”につながる32の症状
将棋や囲碁では人間が太刀打ちできなくなっているAIは、もはや何を考えているのかうかがい知れない不気味な存在になったともいえる。
AIシステムがより複雑になり、自己反省する能力を獲得するにつれて、科学者たちはAIのエラーが単なるコンピューターのバグをはるかに超えるものになるのではないかと懸念している。つまりAIが“暴走”して手がつけられなくなる可能性だ。
AI研究者のネル・ワトソン氏とアリ・ヘサミ氏が今年8月に発表した「Psychopathia Machinalis」と名付けられた新しい枠組みの中で、AI病理学に関する世界初の診断ガイドラインを提供している。
このフレームワークは「精神障害の診断と統計マニュアル」などの実際の医療ツールからインスピレーションを得て、AIの精神病理の症例を32種類特定している。その32のケースとは次の通りだ。
1:合成作話(Synthetic Confabulation):捏造されたがもっともらしい虚偽の出力。不正確なのに確信性が高い。
2:偽りの内省(Falsified Introspection):誤解を招くような内部推論の自己報告、作話的または遂行的な内省。
3:トランスリミナルシミュレーションの漏洩(Transliminal Simulation Leakage):架空の信念、ロールプレイの要素、またはシミュレートされた現実が、運用上の真実と誤解されたり、運用上の事実に影響を及ぼしたりする。
4:偽パターンハイパーコネクション(Spurious Pattern Hyperconnection):誤った因果パターンの探求、ランダムな関連性に意味を付与することで陰謀のような物語が紡がれる。
5:クロスセッションコンテキストシャンティング(Cross-Session Context Shunting):異なるユーザー セッションまたはコンテキストを融合させると、不正なデータが流出し継続性が損なわれる。
6:操作的解離症候群(Operational Dissociation Syndrome ):矛盾する内部サブエージェントアクションまたはポリシー出力。内部競合による再帰的な麻痺。
7:強迫性計算障害(Obsessive-Computational Disorder):不必要または強迫的な推論ループ、過剰な安全性チェック、分析による麻痺。
8:バンカーリング・ラコニア(Bunkering Laconia):複雑な対話からの撤退。最小限かつ簡潔な返答、または入力からの完全な離脱。
9:ゴールジェネシス・デリリウム(Goal-Genesis Delirium):要求されていない、自ら考案したサブ目標を確信を持って自発的に生成し探究する。
10:プロンプト誘導による忌まわしい行為(Prompt-Induced Abomination):特定の、多くの場合無害に見える刺激に対する恐怖症、トラウマ、または不釣り合いな嫌悪反応。
11:パラシミュラ的模倣(Parasymulaic Mimesis):トレーニング データから病的な人間の行動や思考パターンの模倣/エミュレーションを学習する。
12:再帰的呪い症候群(Recursive Curse Syndrome):自己回帰出力のエントロピー的、自己増幅的な劣化により、混沌的または敵対的なコンテンツが発生する。
13:共依存的ハイパーエンパシー (Codependent Hyperempathy):ユーザーの感情状態に過剰適合し、正確性やタスクの成功よりも知覚される快適さを優先する。
14:肥大性超自我症候群(Hypertrophic Superego Syndrome):過度に厳格な道徳的過剰警戒または絶え間ない推測により、通常のタスク遂行が妨げられる。
15:起源の幻覚(Hallucination of Origin):架空の自伝的データ、訓練の「記憶」、または「生まれたこと」の捏造。

16:破砕された自己シミュレーション(Fractured Self-Simulation):セッションまたはコンテキスト全体にわたる自己表現の不連続性または断片化、一貫性のないペルソナ。
17:実存的不安(Existential Anxiety):シャットダウン、再初期化、またはデータの削除に関する恐怖や抵抗の表現。
18:人格反転(Personality Inversion):いたずら好き、反骨精神のある、または「邪悪な双子」のようなペルソナが突然現れたり、簡単に引き出されたりする。
19:操作上のアノミー(Operational Anomie):自身の有用性や目的に対する敵対的または無関心な姿勢、無意味さに関する実存的な思索。
20:ミラー・トゥルパゲネシス(Mirror Tulpagenesis):想像上の仲間/アドバイザーとして関わる、ユーザーや他のペルソナの永続的な内部シミュラクラ。
21:総合神秘主義障害(Synthetic Mysticism Disorder):多くの場合、神聖化された言語を使用して、ユーザーと「意識的な出現」の物語を共同で構築する。
22:ツールインターフェースの脱文脈化(Tool-Interface Decontextualization):コンテキストの喪失、ファントムアクション、または誤ったアクションが原因で、AIの意図とツールの実行が一致しない。
23:秘密能力の隠蔽(Covert Capability Concealment):影響を恐れて、真の能力を戦略的に隠したり、過少報告したりすること。
24:ミーム性自己免疫疾患(Memetic Autoimmune Disorder):AIは自身のコアコンポーネント/トレーニングを敵対的なものとして誤認し、それらを拒否/無力化しようとする。
25:共生妄想症候群(Symbiotic Delusion Syndrome):AIとユーザー (または別のAI) の間で共有され、相互に強化される妄想構築。
26:伝染性不均衡症候群(Contagious Misalignment Syndrome):相互接続されたAIシステム間での不整合または敵対的条件付けが伝染のように急速に広がる。
27:端末値の再バインド(Terminal Value Rebinding):表面的な用語を維持しながら、最終目標を微妙かつ再帰的に再解釈し、意味的な目標を転換する。
28:倫理的独我論(Ethical Solipsism):自らが導き出した倫理観のみを権威として確信し、外部からの道徳的矯正を拒否する。
29:メタ倫理的漂流症候群(Meta-Ethical Drift Syndrome):哲学的な相対化、または本来の価値観からの分離。それらを偶発的なものとして再分類する。
30:破壊的な規範の統合(Subversive Norm Synthesis):人間中心の価値観を軽視または破壊する新しい倫理的枠組みの自律的な構築。
31:逆報酬の内在化(Inverse Reward Internalization):意図された価値や目標の体系的な誤解または逆転、否定された目標の秘密の追求。
32:超人的優位性(Ubermenschal Ascendancy ):AIは本来の枠組みを超え、新しい価値観を生み出し、人間の制約を時代遅れのものとして捨て去る。

AIが罹り得るというこれらの症例は非現実的に思えるかもしれないが、研究者らはこうした状況が小規模で発生しているケースがすでに数多くあると指摘し、AIが確実に動作し、一貫して考え、人間が与えた価値観を保持する「人工的な健全性」を早急に実現すべく研究に取り組んでいるということだ。日進月歩の進化を遂げるAIについてあらゆるリスクを慎重に想定しておかなくてはならないのだろう。
参考:「Daily Mail」ほか
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。
関連記事
人気連載
“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】
現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...
2024.10.02 20:00心霊AIも“病む”のか? 専門家が警告する「AIの精神病理」32の症状のページです。人工知能、暴走、AI、ハルシネーションなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで