校長ブログ
AIが東大数学で合格ライン
2025.04.29
EdTech教育
4月29日
AIが東大の入試問題の数学を合格ラインまで解けるようになったそうです。他教科と比べると、これまで数学はなかなか成果が出しにくかったのですが、推論モデルと呼ばれるAIモデルが登場してから、状況は一変したとのこと。

かつてAIプロジェクト「ロボットは東大に入れるか」を率いた新井紀子氏(国立情報学研究教授)は、東大2次試験の理系数学だけでなく、難問とされる問題もほぼ解け、東大の合格ラインどころか、上位のレベルになったと述べられています。
一年前には、対話型AIであるチャットGPTは東大の数学には対応できませんでした。しかし、数学をはじめとする論理的思考力を必要とする課題解決に特化した推論モデルが登場したのです。プロンプト(指示文)の書き方によって結果が変わったり、答案を仕上げる際、冗長な記述があったり、高校の指導を超えた知識を用いる場合が見られるとはいうものの、実際、東大入試で出題された理系数学の大問6つのうち、4~5問程度を解けたとのこと。
数学オリンピックの予選「AIME」に対するGPT-4o(オープンAI)の正答率(2024.5)は9.3%ですが、9月のo1 previewは56.7%、12月にリリースされたo1は83.3%、2025年1月のo3-miniは87.3%と改善しています。
推論モデルが好成績を出すメカニズムはいまだ明らかにされていませんが、正しい推論をした場合に報酬を与える「強化学習」、課題を段階に分けて解く「思考の連鎖」、推論にかける計算量(計算時間)の増加などにつながると考えられています。
大学入試や数学五輪予選などは一定の出題範囲の中で作問されるものですが、最新のAIなら大学入学共通テストの得点率が9割を超えることも可能であり、入試レベルではAIが人間を超えるのが至極当然という時代がくると指摘されています。さらに、それ以上の性能を発揮できる段階に達しているようです。
当然、AIが進化するのに伴い、大学入試や教育は変容していくでしょう。しかし、推論モデルの数学性能が高いとはいっても、まだ数学者のように難問を解いたり、新しい定理を生み出したりできるわけではありません。その意味で、人間のような知的活動を遂行できる汎用人工知能(AGI)や人間の能力を上回る人工超知能(ASI)の実現に向けて研究開発が求められるということになるのです。