AIが「人類最後の試験」を突破する日は近い!? 科学者が開発した史上最難関テストで見せた驚異の進化速度

かつてアラン・チューリングが提唱した「チューリング・テスト」。人間と機械の対話を区別できるかというこの古典的な知能テストは、現代のAIチャットボットの前ではもはや意味をなさなくなってしまった。
あまりにも流暢に語る彼らの「本当の知能」を測るため、科学者たちが立ち上がった。彼らが作り出したのは、その名も恐ろしい「人類最後の試験(Humanity’s Last Exam)」だ。
AIが人類の知性を超えるXデー、すなわち「汎用人工知能(AGI)」の誕生を見極めるための、史上最難関のベンチマークテストである。
ネット検索では解けない「博士レベル」の超難問
この試験は、AI安全センター(Center for AI Safety)とScale AIの研究者たちが共同開発したもので、100以上の分野にわたる2500問の難問で構成されている。
問題作成には世界50カ国、500機関から1000人以上の専門家が参加。その基準は厳格だ。「明確な正解があるが、ネット検索では即座に答えが見つからない」ものであること。
実際、7万件以上の投稿の中から、既存のAIが正解できてしまった問題は容赦なく却下され、AIを完膚なきまでに叩きのめした問題だけが厳選された。
例えば、ギリシャ神話の家系図に関するマニアックなトリビアから、摩擦のないレール上を滑る物体の力学的関係を問う物理学の問題まで、そのレベルはまさに博士課程クラス。
この試験に対し、人間の専門家たちはそれぞれの専門分野で90%以上の正答率を叩き出している。一方、AIはどうだったか。
わずか1年で急成長するAIの脅威
2025年1月の試験開始当初、OpenAIの「GPT-4o」や「o1」、Anthropicの「Claude 3.5 Sonnet」といった最先端モデルが挑戦したが、最高スコアはOpenAIのo1が出したわずか8.3%だった。人類の圧勝である。
しかし、AIの進化速度は我々の想像を遥かに超えている。
それからわずか1年後の2026年2月、Googleの最新モデル「Gemini 3 Deep Think」が、なんと48.4%という驚異的なスコアを記録したのだ。
研究者たちは当初「2025年末までに正答率50%を超えるかも」と予測していたが、その予想はほぼ的中しつつある。
人類が数百年かけて積み上げてきた知識の塔を、AIは猛スピードで駆け上がっているのだ。

50点取れても「真の知能」とは限らない
とはいえ、専門家たちは冷静だ。
「この試験で高得点を取ったからといって、すぐにAGI(汎用人工知能)が完成したわけではない」と彼らは釘を刺す。
この試験はあくまで「閉じた質問(答えが決まっている問題)」に対する処理能力を測るものであり、自律的な研究能力や創造性、あるいは「意識」のようなものを証明するものではないからだ。
デラウェア大学の神経科学者マヌエル・ショットドルフ氏はこう語る。
「この試験で良い点を取ることは必要条件だが、十分条件ではない。これだけで機械が本当に知的になったとは結論付けられない」
AIがこの「最後の試験」で満点を取る日は、そう遠くない未来にやってくるだろう。
しかし、その時彼らは本当に「理解」しているのだろうか? それとも、単に膨大なデータを巧みにパッチワークしているだけなのだろうか。
テストの点数だけでは測れない「知性」の本質を、我々人類自身が問われる日が近づいているのかもしれない。
参考:Live Science、Unexplained Mysteries、ほか
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。
関連記事
人気連載
“包帯だらけで笑いながら走り回るピエロ”を目撃した結果…【うえまつそうの連載:島流し奇譚】
現役の体育教師にしてありがながら、ベーシスト、そして怪談師の一面もあわせもつ、う...
2024.10.02 20:00心霊AIが「人類最後の試験」を突破する日は近い!? 科学者が開発した史上最難関テストで見せた驚異の進化速度のページです。人工知能、AI、AGIなどの最新ニュースは好奇心を刺激するオカルトニュースメディア、TOCANAで
