「ゴブリン、グレムリン、トロルについて話すな」OpenAIが新モデルに下した奇妙な厳命と、その背後にある”あの可能性”

「ゴブリン、グレムリン、タヌキ、トロル、オーガ、ハト、その他の動物や生き物については、ユーザーの質問に絶対的かつ明確に関連している場合を除き、絶対に話してはならない」
これは、OpenAIのプログラマーが自社のAIツール「Codex CLI」に与えた指示の一節だ。Codex CLIはAIによるコード生成に使われるコマンドラインツールで、いわばエンジニア向けの実務ツールである。そんな真面目な用途のソフトウェアに、なぜかゴブリン禁止令が刻まれていた。しかも一度ではなく、ファイル内に複数回繰り返されているというから、尋常ではない。
AIが勝手にゴブリンに目覚めた
テクノロジーメディアの『Wired』によれば、この奇妙な命令が挿入された背景には、モデルが以前から特定の生き物に異常な執着を見せていたという経緯があるらしい。
問題が起きたのは「OpenClaw」というツールを使用していたユーザーたちだ。OpenClawはAIがユーザーのパソコンやアプリを直接操作して作業を代行するというツールで、これ自体はごく真っ当な実用ソフトである。ところがこれをOpenAIのモデルで動かしていると、AIが急にゴブリンや怪物の話をし始めるという珍現象が多発していたというのだ。
実際にXには「なぜ突然、俺のClawがゴブリンになったんだ(codex 5.5から)」「最近よく使ってるんだけど、バグのことを”グレムリン”とか”ゴブリン”って呼ぶのが止まらなくて笑える」といった投稿が相次いでいた。
コードのバグをグレムリンと呼ぶ…確かにちょっとかわいいが、業務中にAIがファンタジー世界に旅立つのはさすがに困る。こうした事態を受け、OpenAI側は泣く泣く「妖怪禁止」の指示を明文化する羽目になったと考えられている。
魔界との癒着か、それとも単なる確率の悪戯か
さて、ここで誰もが(?)抱く疑問がある。「OpenAIは闇の世界の存在と手を結んでいるのではないか」という線だ。
…もちろん、冗談である。技術的に説明するなら、AIは本質的に「知能」を持っているわけではなく、膨大な学習データをもとに確率的に次の言葉を選んでいるだけだ。学習データの中には当然、ゴブリンやグレムリンに言及したテキストが無数に含まれており、それが文脈から切り離されて「解釈」されることで、妙なタイミングで妖怪が召喚されてしまう、ということらしい。
日本で言えば、AIが突然「バグは座敷童のせいです」と言い出すようなものだと思えばいい。学習データの海に漂う民俗学的フレーバーが、意図せず浮上してしまうわけだ。
ただ、この説明はいかんせん地味すぎる。「確率的構文生成の副作用です」では話が終わってしまう。やはりここは「OpenAIは悪魔と手を組んでいる」説を推したい気持ちを、完全には否定できないでいる。

「妖怪禁止令」が示すAIの本質的な限界
笑い話のように見えて、この一件はAI開発の根本的な課題を突いている。どれだけ高性能なモデルを作っても、人間が意図しない挙動は必ず生まれる。そしてその対処法が「禁止する」という力技になってしまうのは、AIが「理解している」わけではないことの証左でもある。
人間のエンジニアなら「ここでゴブリンの話はしないほうがいい」と文脈で判断できる。でもAIはそれができないから、明示的に「絶対に話すな」と書かなければならない。その禁止リストにタヌキとハトが並んでいるあたり、開発現場の苦労と混乱が透けて見えるようだ。
というわけで、ゴブリンに取り憑かれたAIの話は、技術的にはちょっと情けなく、でもどこか微笑ましい出来事として記録されることになりそうだ。次のバージョンでは「鬼」や「天狗」も禁止リストに加わるかもしれない。AIに日本語を大量に学習させている以上、その可能性は決してゼロではないのだ。
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。
関連記事
人気連載
“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】
現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...
2024.10.02 20:00心霊「ゴブリン、グレムリン、トロルについて話すな」OpenAIが新モデルに下した奇妙な厳命と、その背後にある”あの可能性”のページです。悪魔、ゴブリン、グレムリン、トロール、OpenAIなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで