无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

號稱“史上最難”的高考數學，千問拿下滿分

2026-06-09 19:05:07　來源: 黑馬公社

四川舉報

0

分享至

高考這不剛結束嗎。

和前兩年差不多，還沒考完呢“史上最難”“喜提大專”之類的詞條已經先一步沖上了熱搜。

最讓人繃不住的，毫無疑問還是又是就是——數學。

6月7日下午，2026全國高考數學剛考完，#高考數學#難就沖上微博熱搜第一。

尤其是最后一道題，更是被網友集體譽為“史上最難高考壓軸題”，可以說是考完就道心破碎、喜提大專、準備二戰。

見此場景，黑馬當時就有了個好點子：

如果今年的數學卷真的這么難，那不就是上好的試金石，正好拿它來測AI……

畢竟過去兩年，各家 AI 天天都在宣傳自己數學能力有多強——什么推理模型、強化學習、長鏈思維說得一個比一個猛。

既然你們都真心實意的宣傳了，那我就大發慈悲的把你們直接拉上考場，真刀真槍考一次。

說干就干，轉頭黑馬就扒拉了6個目前常用的AI，為了以示公平，除了國內大模型之外，黑馬還專門邀請了Gemini和ChatGPT兩個國際選手參賽。

一張試卷，滿分150分，同一考場，同一時間，沒有搜索、沒有外掛、純靠模型本身的推理能力。

我們想看看——在真正的"高考級"難度面前，誰是真學霸，誰在裸泳。

為了保證公平，黑馬還設定了一套的評測規則：

試卷直接用的：2026年普通高等學校招生全國統一考試·數學（全國I卷），全卷共19題：選擇題11道（共58分）、填空題3道（共15分）、解答題5道（共77分），滿分150分。

6位考生分別是： GPT 5.5（OpenAI）、Gemini 3.1（Google）、DeepSeek、千問（阿里）、豆包（字節）、元寶（騰訊）。

具體規則如下：

1、所有試題以原卷掃描圖片輸入（不做OCR預處理）；

2、每道題獨立作答，不給上下文提示；

3、解答題按高考閱卷標準評分（過程分+結果分）；

4、同一時段內完成，避免模型更新差異。

然后成績單，就出來了。

說實話，這個第一我覺得是有點東西的。

本來我還在好奇到底是中國模型技高一籌，還是國外模型遙遙領先……

還好整體來說還是中國AI做數學更強一些。

而千問也收獲全場唯一滿分。

知道你們好奇，我們一個一個來看解題過程。

成績單往下翻，在前10道選擇題上，千問、豆包、元寶、DS、GPT、Gemini，清一色滿分。

基礎送分題拉不開差距，這很正常。

但僵局沒有持續太久，從第11題開始，Gemini就開始掉鏈子，6 分沒了；到了填空題又拉下來兩位選手，元寶第14題啞火，GPT 第12題丟分……

想不到吧，應用題都還沒開始就已經決出了前三甲了。

而到了應用題階段，前四道題大家的水平也都很平均，平均的沒有扣掉一分。

真正拉開差距的，還是大家吐槽的壓軸題19題。

對，就是那道今年被考生集體控訴"不是人做的題"的三道。

具體來看的話：

DeepSeek、Gemini、GPT都倒在了第（3）題，各丟5分；

豆包、元寶則在第（2）問和第（3）問同時失守，各丟9分；

只有千問的三個小問全部正確，滿分通過。

說實話，看到千問第 19 題全對，黑馬自己也愣了一下。

因為這道題的（2）（3）小問全是證明題，考的是新定義、集合、函數性質以及復雜條件推導。

簡單來說，就是特別考驗邏輯鏈條，只要中間有一步推錯，后面就會全崩。

這里放一個千問的答題過程：

可以看到，千問第（2）問奇函數性質推導完整，多情形分類一個不漏；第（3）問用反證法，條件①②的組合運用極具技巧性，結構嚴密得像一道證明題教科書。

說實話，這種級別的長鏈路推理能力，在目前的AI里值得一個夯的水平。

而其他家輸在哪其實也很明顯，主要就是推理穩定性差一點：

有的模型前面推理完全正確，卻在最后一步計算時出現符號錯誤；

有的模型思路方向沒問題，但分類討論漏掉了一種情況；

還有的模型明明已經接近正確答案，卻因為中間一個條件理解偏差導致滿盤皆輸。

這邊直接放一下大家的試卷：

豆包和元寶在第（2）問就開始出現計算偏差，根基一歪，后面越走越偏；

DeepSeek、Gemini、GPT 更能扛，但卡在了第（3）問的反證法構造上，實際上就是差在邏輯的精密度上。

當我們把各家的解題過程擺在一起看時嘛，很容易就能發現差距在哪里，前面那幾步大家都會做。

但能不能從第一步一直正確推到最后一步，才是真正決定分數的關鍵。

對于考生來說，這份成績單其實說明了一件事：

哪怕到了 2026 年，高考數學依然是檢驗思維能力最有效的試卷之一，因為它考察的從來不只是知識點，而是你能不能在陌生環境下完成推理、計算、遷移和驗證。

這也是為什么很多人覺得數學難，因為它不允許你“差不多”。

對 AI 行業來說，道理也是一樣。

現在的大模型寫作文、翻譯、總結資料，大家水平已經越來越接近很多場景里，你甚至很難感受到明顯差異。

但數學不一樣，尤其是高考壓軸題這種"一步錯步步錯"的題型。

它就像個照妖鏡，誰是真會推理，誰只是看起來會推理，往里一照基本就藏不住了。

而這次千問能拿到唯一滿分，本質上也是多種能力疊加的結果。

一方面是拍照識題、多模態理解能力——原卷掃描圖片直接輸入，不做任何 OCR 預處理，能準確識別手寫數學符號和復雜排版，本身就是一道門檻；

另一方面則是數學推理模型本身的強化訓練。千問此前在 SAT 考試中拿過 1580 分，超過全球 99% 的考生，也超過了 ChatGPT 和 Gemini，不是第一次在數學上展示這種水平了。

這次高考數學滿分，也只是再次證明了這件事。

回頭看，其實還挺有意思的。

2023年，我們第一次拿高考題測試AI的時候，討論最多的問題還是AI會不會寫作文。

那時候大家覺得，寫作是一件很高級的事情，需要理解、思考、表達和創造力。

但數學恰恰相反，當時它還被認為是最考驗邏輯和推理能力的領域，也是AI最難跨過去的一道坎。

等到2024年的時候，我們終于開始討論AI能不能做壓軸題，能不能上140分，能不能考上985。

直到今年，阿里千問在數學高考試卷上拿下了滿分。

現在你要是問我明年AI會被拿來測什么，那我也只能說不知道了。

撰文：柯然

編輯：Lena

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

親測高考數學壓軸題，小學家長別逼孩子刷題了！＃高考

朵朵花林 2026-06-09 07:28:45
214 跟貼 214
高考數學越難，國運越穩！讀懂國家的頂級人才布局！

陽光小筑Sunny 2026-06-09 02:35:10
0 跟貼 0

高考數學解題快，30秒搞定，考場提速

萌城少年強 2026-06-08 11:56:36
0 跟貼 0

高考數學考完了，如果你覺得簡單，那就太天真了！聽老師怎么說

無我漂佩MY 2026-06-09 04:15:44
12 跟貼 12
高考數學結束的采訪

一只小赤鹿 2026-06-08 20:13:00
5 跟貼 5

如果讓韋東奕做2026年高考數學題，能不能考滿分？

壓抑小情緒 2026-06-10 05:46:57
0 跟貼 0

鑄魂育人引領方向科學選拔

中國教育新聞網 2026-06-10 07:57:15
0 跟貼 0
千年古塔闖入高考數學卷

草莓信箱 2026-06-09 11:26:22
1 跟貼 1

刷題時代終結！2026高考數學背后，是一場國家級的戰略轉向

智商已欠費啦 2026-06-10 06:35:48
1 跟貼 1
用語文的方式讓大家感受一下高考數學的難度，熟悉又陌生！

遼寧老年報全搜索 2026-06-09 20:25:50
0 跟貼 0
高考數學難哭了，那讓AI試試呢?

科技媒體 2026-06-09 15:33:42
4 跟貼 4
還是經驗太豐富了!唐尚珺壓中2026年新一卷高考作文,自謙隨口說說

趣筆談 2026-06-10 08:14:26
0 跟貼 0
高考結束后的最后一堂班會課，湯圓老師送孩子兩個忠告，好老師

樹懶小結界 2026-06-10 04:47:33
0 跟貼 0
“韋神二號！”人大附中學霸考生火了，網友：仿佛行走的數學答案

世界圈 2026-06-10 07:57:18
0 跟貼 0
人民日報發文！沒想到，高考開始2天，張桂梅因一個舉動口碑暴漲

溫心娛樂1 2026-06-09 08:14:33
3 跟貼 3
化學不簡單、地理有創新、生物較友好、政治貼時事，2026高考溫柔收官

新快報新聞 2026-06-10 08:35:14
0 跟貼 0
高考人數連降兩年信號比數字重要

琳姐財經觀 2026-06-07 09:29:38
0 跟貼 0
高考全國卷一作文，《無名之人》老師寫得太好了，網友怒贊

ulu秋名山 2026-06-09 09:30:47
0 跟貼 0
高考加油！

敏說說 2026-06-07 19:16:03
0 跟貼 0
王立群；高考作文題“日月不失其體，故蔽而復明”

淮淮淮寧喵 2026-06-10 04:25:01
0 跟貼 0
山西高考成績！公布時間定了！

黃河新聞網呂梁 2026-06-07 16:06:13
0 跟貼 0
乾坤未定，你我皆是黑馬。愿學子們落筆皆如愿，乘風破浪，未來可期！

河南法治頻道 2026-06-08 21:37:58
0 跟貼 0
【今日高考】厚積薄發今朝亮劍！祝所有高考生金榜題名前程似錦

黃河新聞網呂梁 2026-06-07 09:37:45
0 跟貼 0
華南F3家長高考不陪考？其他省份爸爸都為孩子穿上了旗袍！

暴走哥觀點 2026-06-07 19:36:32
0 跟貼 0
高考落幕，親朋好友花式迎接考生

湘潭在線 2026-06-10 08:45:14
0 跟貼 0
網警護航高考 | 考題有解，陷阱難辨——網警帶你避開這些坑，預祝金榜題名

小易正能量 2026-06-10 08:41:40
0 跟貼 0
5款AI 同臺競寫今年高考作文，高考閱卷作文組長打分，得分最高的竟是豆包！

封面新聞 2026-06-09 11:12:08
0 跟貼 0
今天是6月7日，高考第1天。“67”諧音“錄取”，愿所有考生考的全會、做的全對

江西都市現場 2026-06-07 18:00:49
0 跟貼 0
高考也解不了汽車的題：“造車”徹底變了？｜林示有話說

財圈社 2026-06-09 09:26:51
3 跟貼 3
10余省份敲定高考查分時間，6月25日成績將公布

丁羂解說 2026-06-10 00:22:40
3 跟貼 3
北京2026年高考英語作文出爐，今年幫“李華”寫信談AI

丁羂解說 2026-06-09 00:51:48
1 跟貼 1
考生們走出考場合影留念

新浪財經 2026-06-10 08:45:24
0 跟貼 0
填高考志愿你確定不考慮一下帶電工科嗎？

河右生 2026-06-09 05:02:46
0 跟貼 0
高考英語作文：給睡覺學習社交排序，考生答案出人意料！

丁羂解說 2026-06-09 00:40:55
1 跟貼 1
此去經年，頂峰相見;今日送考，愿你筆尖生花

衡陽華岳高級中學 2026-06-08 23:03:29
0 跟貼 0
喜歡考試的有福了，可以報考醫學專業！

娛小癲 2026-06-08 22:13:52
0 跟貼 0
5分高考題帶火千年古塔！寧夏108塔藏的秘密，90%人不知道

韻與生活 2026-06-10 04:33:24
0 跟貼 0
河北尚義10支志愿服務隊暖心服務助力高考

人民資訊 2026-06-10 08:57:19
0 跟貼 0
華坪女高第16屆學生畢業，張桂梅：我努力活著，年年等你們

極目新聞 2026-06-10 08:09:26
0 跟貼 0
考場外“華為全家桶”走紅！網友調侃：小米全家桶，不比這有面兒

火山詩話 2026-06-10 08:50:50
39 跟貼 39

炸裂！捐精有多亂，雙方直接在賓館完成懷孕過程，一次八百到幾萬

炸裂！捐精有多亂，雙方直接在賓館完成懷孕過程，一次八百到幾萬

就一點

2026-06-02 15:45:51

老牌玻璃廠拿下三大科技巨頭訂單，千億資金涌入AI基建暗線

老牌玻璃廠拿下三大科技巨頭訂單，千億資金涌入AI基建暗線

算力游俠

2026-06-08 20:49:39

特朗普騙了全世界？英媒爆料，美軍終于承認，在中方手里吃了大虧

特朗普騙了全世界？英媒爆料，美軍終于承認，在中方手里吃了大虧

福建睿平

2026-06-09 13:14:25

網傳王健林暗中幫助黃一鳴母女，助力孫女閃閃參與高端走秀并簽約

網傳王健林暗中幫助黃一鳴母女，助力孫女閃閃參與高端走秀并簽約

露珠聊影視

2026-06-10 00:45:10

原來他們是父子，《主角》他是星二代，弟弟也是演員，1家人太像

原來他們是父子，《主角》他是星二代，弟弟也是演員，1家人太像

娛君墜星河

2026-05-30 15:35:10

國米峰會浮現中場引援新人選意甲過人榜第四之法國國字號新星

國米峰會浮現中場引援新人選意甲過人榜第四之法國國字號新星

國際足球冷雪

2026-06-10 07:05:14

估值255億的豐巢，上市失敗對賭翻車，創始人含淚離場

估值255億的豐巢，上市失敗對賭翻車，創始人含淚離場

李砍柴

2026-05-06 17:17:07

唐代最完美詩人：36歲中狀元，86歲衣錦還鄉，一輩子沒被貶一次官

唐代最完美詩人：36歲中狀元，86歲衣錦還鄉，一輩子沒被貶一次官

長風文史

2026-06-08 19:13:27

傳聞：美貌勝林徽因，兩巨匠為她孤獨終老，93歲丈夫對她深情告白

傳聞：美貌勝林徽因，兩巨匠為她孤獨終老，93歲丈夫對她深情告白

卡西莫多的故事

2026-03-14 21:42:41

劉伯承元帥：軍中只有賀龍和陳賡，能玩得轉舊社會的“三教九流”

劉伯承元帥：軍中只有賀龍和陳賡，能玩得轉舊社會的“三教九流”

史之韻

2026-06-10 00:49:28

在岸人民幣兌美元（CNY）北京時間03:00收報6.7734元，較周一夜盤收盤漲108點

在岸人民幣兌美元（CNY）北京時間03:00收報6.7734元，較周一夜盤收盤漲108點

每日經濟新聞

2026-06-10 05:37:05

中國拒絕美國請求

楊興文

2026-06-09 21:27:35

尼克斯不敵馬刺，還有4個壞消息球隊內憂外患，FMVP之爭暗流涌動

尼克斯不敵馬刺，還有4個壞消息球隊內憂外患，FMVP之爭暗流涌動

南海浪花

2026-06-09 12:23:56

劉浩存問孫浩：和張嘉益張藝謀他們聚餐為何不叫我？孫浩回復搞笑

劉浩存問孫浩：和張嘉益張藝謀他們聚餐為何不叫我？孫浩回復搞笑

可樂談情感

2026-06-10 02:08:13

官方：狼隊簽下自由身球員勞爾·希門尼斯，簽署2+1合同

官方：狼隊簽下自由身球員勞爾·希門尼斯，簽署2+1合同

硯底沉香

2026-06-10 07:10:23

馬特·達蒙《傳染病》翻紅登頂，15年前神預言再應驗

馬特·達蒙《傳染病》翻紅登頂，15年前神預言再應驗

赴一場山海啊

2026-06-10 00:36:12

鄭欽文慘敗引外媒熱議：團隊似乎出問題弱點完全暴露要退役了嗎

鄭欽文慘敗引外媒熱議：團隊似乎出問題弱點完全暴露要退役了嗎

顏小白的籃球夢

2026-06-09 09:28:23

中國真正該警惕的戰爭對手浮出水面，不是臺海而是它！

中國真正該警惕的戰爭對手浮出水面，不是臺海而是它！

阿七說史

2026-06-01 15:27:59

一個家庭最大的悲哀：沒有一個社會化的人

一個家庭最大的悲哀：沒有一個社會化的人

心理觀察局

2026-06-07 06:15:05

80歲黃百鳴被判處入獄5個月

熱點追蹤人

2026-06-09 15:32:22

解讀、體驗你關心的科技

2640文章數 80475關注度

往期回顧全部

教育要聞

小學生奧數題目，求a?b＝？

頭條要聞

國際宇航科學院16年來首次更新文件：不要回復外星人

頭條要聞

國際宇航科學院16年來首次更新文件：不要回復外星人

體育要聞

誰會花400萬，去看一場尼克斯的比賽？

娛樂要聞

吳文忻因癌癥惡化離世，女兒哭泣不舍

財經要聞

大盤股IPO終結行情盛宴？背后真相來了

科技要聞

一文看懂蘋果WWDC26：庫克告別，Siri重生

汽車要聞

賽豆科技AIVA品牌發布全系產品覆蓋20萬級市場/量產車年內亮相

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

親子

數碼

手機

公開課

本地新聞

用楊柳青年畫的方式，打開天津

親子要聞

52歲王小騫沒想到，患矮小癥的女兒，如今已經竟然開始給她爭光了

數碼要聞

初探蘋果macOS 27液態玻璃調整：透明度滑塊、強化文字可讀性等

手機要聞

OPPO Reno 16國際版現身跑分庫，換用驍龍7 Gen 4處理器

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版