LifePrompt(東京都新宿区四谷)は4月28日、2026年2月実施の東京大学・京都大学の二次試験問題に生成AIで解答させ、採点結果を検証したと発表しました。東大理科三類(満点550点)ではChatGPT 5.2 Thinkingが503.59点、Gemini 3 Pro Previewが496.54点となり、合格者最高点453.60点を上回りました。京大医学部医学科(満点1275点)でもChatGPTが1176.38点で、最高点1098.25点を超えたとしています。
検証は入試問題PDFをページ単位で画像化し、API経由で各モデルに送信しました。チャット画面は使わず人為的介入を排除し、全科目共通プロンプトでWeb検索も不使用です。記述答案は河合塾講師が人間と同基準で採点協力し、KIESも関与したとしています。
科目別では、東大の理系数学120点、文系数学80点、京大の理系数学200点でChatGPTとGeminiが満点を記録しました。京大では文系数学150点と化学100点でChatGPTが満点だったとしています。一方で弱点として、画像読み取り、論述の構成、出力制御、慣習依存の問題を挙げています。なお昨年検証では東大理系数学が最新モデルでも38点だったとし、伸び幅も示しました。
LifePromptは、AIが満点を取れるタスクと難しいタスクの差が明確になったとして、実務では業務設計やデータ接続の工夫が重要になるとの見解を示しました。10〜20年後の進化を前提に、組織や業務の設計を進める必要があるとしています。
【関連リンク】
詳細URL(note):https://note.com/lifeprompt/n/n85674c186fbc
公式HP:https://lifeprompt.net
AxMates:https://axmates.com
