AIがチューリングテストを突破? GPT-4.5が「人間以上に人間らしい」と評価された衝撃

チューリングテストとは何か?
「機械は思考できるのか?」という問いに対して、英国の数学者アラン・チューリングが1950年に提案したのがチューリングテストだ。これは、あるAIがテキストによる会話で相手を騙し、「人間だ」と誤認させることができれば、そのAIは「人間並みの知性を持つ」とみなすという考え方だ。
具体的には、ある審査員が「人間」と「AI」の両者とテキストチャットを通じて会話し、どちらが人間かを判定する。もしAIが人間と見分けがつかないレベルで会話できれば、チューリングテストに合格したとされる。
GPT-4.5が“人間以上に人間らしい”と判定される
そんな歴史あるチューリングテストを、最新のAIがついに公式に突破したと報じられている。ニュースサイト「Futurism」によれば、カリフォルニア大学サンディエゴ校の研究チームが実施した実験で、OpenAIのGPT-4.5が「人間だ」と誤認された割合が73%に達したという。
実験では、参加者たちが「AI」と「人間」の両方とチャットを行い、どちらが本物の人間かを判定する形式が採用された。ランダムで正解する確率は50%だが、GPT-4.5は明確にそれを上回り、多くの人間を“騙した”のだ。
特に興味深いのは、「若くてインターネットに詳しい人物」といったキャラクター設定(ペルソナ)をAIに与えたとき、より高い精度で人間に近づいたことだ。逆に「ただ人間っぽく振る舞え」と指示した場合、成功率は36%にまで落ちた。
AIは人間を代替する存在になりうるのか?
同時にテストされたMetaの「LLaMA 3.1」や、OpenAIの最新モデル「GPT-4o」、さらには80年前の古典的チャットボット「ELIZA」も比較対象となったが、いずれもGPT-4.5には及ばなかった。とくにGPT-4o(ペルソナ設定なし)は21%と苦戦。ELIZAでさえ23%を記録したことを考えると、“キャラ設定”による人間らしさの演出がいかに効果的かがわかる。
研究者のキャメロン・ジョーンズ氏は、こうした結果について「もはや短いやり取りでは、人間とAIの違いを判別するのは難しい」と述べており、職場、カスタマーサポート、教育などでの“人間の代替”が現実的になっていると警鐘を鳴らす。

思考実験から現実へ、チューリングテストの“次の段階”へ
かつては哲学的な問いだった「機械は人間のように考えることができるのか?」というテーマが、今まさに現実の問題になりつつある。もちろん、チューリングテストは「AIが本当に知性を持つ証明」ではなく、「人間をいかに模倣できるか」の基準でしかない。
だが、現実の社会においては“本物かどうか”よりも“見分けがつくかどうか”のほうが重要になる場面も多い。たとえば、詐欺対策、情報の信頼性、倫理的な判断、対人支援の現場などにおいて、AIと人間の区別がつかないこと自体が大きな課題になっていくだろう。
人間のように話すAIが、いつか「人間以上に賢くなる日」が来るのか?この問いが、いよいよ現実味を帯びてきた。
参考:Futurism、ほか
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。
関連記事
人気連載
“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】
現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...
2024.10.02 20:00心霊AIがチューリングテストを突破? GPT-4.5が「人間以上に人間らしい」と評価された衝撃のページです。チューリングテスト、AI、ChatGPTなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで