トカナ > 科学 > AI > 「ゴブリンについて話すな」OpenAIが新モデルに下した奇妙な厳命

「ゴブリン、グレムリン、トロルについて話すな」OpenAIが新モデルに下した奇妙な厳命と、その背後にある”あの可能性”

2026.05.02 07:00 編集部

Xでポスト

「ゴブリン、グレムリン、トロルについて話すな」OpenAIが新モデルに下した奇妙な厳命と、その背後にある"あの可能性"の画像1 — イメージ画像　Created with AI image generation

「ゴブリン、グレムリン、タヌキ、トロル、オーガ、ハト、その他の動物や生き物については、ユーザーの質問に絶対的かつ明確に関連している場合を除き、絶対に話してはならない」

　これは、OpenAIのプログラマーが自社のAIツール「Codex CLI」に与えた指示の一節だ。Codex CLIはAIによるコード生成に使われるコマンドラインツールで、いわばエンジニア向けの実務ツールである。そんな真面目な用途のソフトウェアに、なぜかゴブリン禁止令が刻まれていた。しかも一度ではなく、ファイル内に複数回繰り返されているというから、尋常ではない。

AIが勝手にゴブリンに目覚めた

　テクノロジーメディアの『Wired』によれば、この奇妙な命令が挿入された背景には、モデルが以前から特定の生き物に異常な執着を見せていたという経緯があるらしい。

　問題が起きたのは「OpenClaw」というツールを使用していたユーザーたちだ。OpenClawはAIがユーザーのパソコンやアプリを直接操作して作業を代行するというツールで、これ自体はごく真っ当な実用ソフトである。ところがこれをOpenAIのモデルで動かしていると、AIが急にゴブリンや怪物の話をし始めるという珍現象が多発していたというのだ。

　実際にXには「なぜ突然、俺のClawがゴブリンになったんだ（codex 5.5から）」「最近よく使ってるんだけど、バグのことを”グレムリン”とか”ゴブリン”って呼ぶのが止まらなくて笑える」といった投稿が相次いでいた。

　コードのバグをグレムリンと呼ぶ…確かにちょっとかわいいが、業務中にAIがファンタジー世界に旅立つのはさすがに困る。こうした事態を受け、OpenAI側は泣く泣く「妖怪禁止」の指示を明文化する羽目になったと考えられている。

魔界との癒着か、それとも単なる確率の悪戯か

　さて、ここで誰もが（？）抱く疑問がある。「OpenAIは闇の世界の存在と手を結んでいるのではないか」という線だ。

　…もちろん、冗談である。技術的に説明するなら、AIは本質的に「知能」を持っているわけではなく、膨大な学習データをもとに確率的に次の言葉を選んでいるだけだ。学習データの中には当然、ゴブリンやグレムリンに言及したテキストが無数に含まれており、それが文脈から切り離されて「解釈」されることで、妙なタイミングで妖怪が召喚されてしまう、ということらしい。

　日本で言えば、AIが突然「バグは座敷童のせいです」と言い出すようなものだと思えばいい。学習データの海に漂う民俗学的フレーバーが、意図せず浮上してしまうわけだ。

　ただ、この説明はいかんせん地味すぎる。「確率的構文生成の副作用です」では話が終わってしまう。やはりここは「OpenAIは悪魔と手を組んでいる」説を推したい気持ちを、完全には否定できないでいる。