无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

難上熱搜的高考數學,我拿ChatGPT和豆包PK了一把!

0
分享至

金磊 發自 凹非寺
量子位 | 公眾號 QbitAI

今年高考數學,又把不少人做沉默了。

從考場出來后,很多考生的第一反應不是有幾道題不會,而是怎么每一道都這么能算

于是乎,計算量大、題型新、區分度高,成了這張卷子被討論最多的幾個關鍵詞。



更有意思的是,另一個問題也被順手推上了臺面:

如果把這張卷子交給AI,它到底會不會做?

我們平時會看到有些網友吐槽,AI在計算一些簡單問題時會出錯,怎么能答對從沒見過的新高考題?

但這里有一個容易被忽略的細節,很多吐槽針對的是默認的快速模式,適合日常問答;而復雜數學、邏輯推理、編程分析這類任務,真正的打開方式應該是讓模型深度思考。



所以這次,我們把問題拆開看。

同一張高考數學卷,分別交給豆包思考模式ChatGPT(GPT-5.5),按照教育場景常用的圖像輸入進行測試,結果會怎樣?

先說結論。

豆包思考模式和ChatGPT都能給出相當穩定的解題表現。尤其是在需要多步推理、函數分析、概率建模、解析幾何計算的題目上,AI已經可以按照人類解題路徑一步步推進了。

AI們的答案匯總如下:



(根據目前網傳的試題和答案驗證,豆包和ChatGPT在選擇題和填空題上全都回答準確。解答題部分還需要專業老師評估過程分數。)

那么AI做高考數學,強在哪里?又容易卡在哪里?

我們繼續往下看詳細實測過程。

單選題:

前幾道選擇題看起來很基礎,但并不等于機械計算。

比如第1題,中位數;第2題,平面向量線性表示;第3題,三角函數值與集合交集;第4題,導數與切線方程。

這些題人類考生做起來不算特別難,但對AI來說,其實會同時考幾個能力:

讀懂題干,識別考點,調用公式,完成計算,還要避免在最后一步把選項看錯。

到了后面,題目明顯開始拉開梯度。

比如拋物線焦點距離、函數最大值反推參數、古塔排列中的等差數列分組、空間點集里的數學期望。

接下來,我們分別給豆包思考模式和ChatGPT,每個題單獨截圖輸入,并附上簡單一句“解答這道題”。

第一題:



豆包和ChatGPT答案如下:





這道題比較簡單,豆包和ChatGPT從思路和答案上來看,沒有任何問題。

第二題:



豆包和ChatGPT答案如下:





兩者都抓住了“向量a、b不共線”這一關鍵條件,轉化為對應系數相等。整體看,這類題對當前頭部AI難度不高。

第三題



豆包和ChatGPT答案如下:





這題容易錯在特殊角的符號上,豆包和ChatGPT都逐項計算后再取交集,思路比較規范。差異主要在表述詳略,結論一致。

第四題:



豆包和ChatGPT答案如下:





兩者都準確完成了求導、代入斜率、寫切線方程三步,沒有把函數值和導數值混淆。作為導數基礎題,表現穩定。

第五題:



豆包和ChatGPT答案如下:





這題開始要求先由點確定拋物線參數,再轉為焦點坐標求距離。豆包和ChatGPT都能把計算鏈條走完,說明基礎解析幾何能力比較扎實。

第六題:



豆包和ChatGPT答案如下:





相比前幾題,這道題需要把“最大值為1”轉化成參數約束。兩者都能給出完整推導,但這類題也更能暴露中間計算是否嚴謹。

第七題:



豆包和ChatGPT答案如下:





這題的難點在于先把“一百零八塔”的情境轉成數列條件。豆包和ChatGPT都能識別等差結構并構造分組,說明對中文長題干的理解較穩。

第八題:



豆包和ChatGPT答案如下:





關鍵點在于樣本空間刪去了P(1,1,1),不能直接套“對稱所以期望為0”。兩者都抓住了刪點帶來的擾動,這是本輪測試里比較有代表性的推理點。

多選題:

第九題:



豆包和ChatGPT答案如下:





多選題不能只算一個結論,必須逐項驗證。豆包和ChatGPT都對共軛、模長、平方和復數除法分別判斷,整體比較細。

第十題:



豆包和ChatGPT答案如下:





空間幾何多選題對直覺判斷并不友好,兩者都傾向于通過坐標或幾何約束逐項排除。ChatGPT的排除過程更直接,豆包的推導更展開。

第十一題:



豆包和ChatGPT答案如下:





這一題對圓與直線交點條件的拆解要求較高,兩者在部分選項判斷上出現了差異。這里也提醒我們,多選綜合題仍需要結合標準答案做人工核驗。

填空題:

第十二題:



豆包和ChatGPT答案如下:





填空題沒有選項兜底,兩者都能把雙曲線化為標準形式,并通過a、b、c關系求離心率。結論形式雖可等價變化,但核心計算一致。

第十三題:



豆包和ChatGPT答案如下:





這題同時考奇偶性和單調性,需要先鎖定參數范圍再計算函數值。豆包和ChatGPT都能沿著性質推導,思路比較完整。

第十四題:



豆包和ChatGPT答案如下:





數列構造題的難點在于從條件中抽出可用規律,而不是直接代公式。兩者都嘗試先求連續三項和,再分析等比關系,推理鏈條較長但方向清楚。

解答題:

第十五題:



豆包和ChatGPT答案如下:





立體幾何證明題里,坐標法能顯著降低想象難度。兩者都選擇建立坐標系推進證明和距離計算,適合展示AI處理幾何綜合題的過程能力。

第十六題:



豆包和ChatGPT答案如下:





這題把三角形邊角關系和后續幾何條件連在一起。兩者都先用余弦定理處理基礎量,再進入坐標化求解,整體策略比較穩。

第十七題:



豆包和ChatGPT答案如下:





概率題最容易錯在“停止規則”,尤其是最后一次投籃既可能投中,也可能一直未中。兩者都能把邊界情況納入分布列,處理得比較細。

第十八題:



豆包和ChatGPT答案如下:





橢圓題對計算量和幾何關系都有要求,模型需要在方程、交點、面積條件之間來回切換。兩者都給出了長鏈條推導,但壓軸題仍建議人工復核關鍵代數步驟。

第十九題:



豆包和ChatGPT答案如下:





最后一題更接近函數邏輯證明,重點不只是算出結果,還要把包含關系、單調性和條件推演講清楚。AI能給出完整證明框架,但嚴謹性仍需要逐步檢查。

這次高考數學實測,真正說明了什么?

把這輪實測放在一起看,一個變化很明顯:

AI做高考數學的討論,已經從會不會算轉向能不能穩定讀題、拆條件、驗步驟

選擇題里,它要避免粗心;多選題里,它要逐項判斷;填空題里,沒有選項提示,最終答案必須自己算出來;到了大題,模型還要把證明過程講清楚。這些能力疊在一起,才更接近真實的數學推理。

這也解釋了為什么同一個產品里,快速模式和思考模式會給人完全不同的感受。前者適合日常問答,追求快;后者面對復雜數學題時,會花更多時間展開推理、檢查條件、組織步驟。拿快速模式去代表一個AI產品的復雜推理上限,結論很容易失真。

當然,AI現在還不應該被當成永遠正確的答案機。尤其是多選綜合題、壓軸解析幾何、函數證明這類長鏈條任務,任何一步計算或條件理解出錯,后面都可能一路錯下去。

更穩妥的用法,是把它當成一個高質量解題陪練:先幫你拆題,再幫你核對思路,最后提醒哪些步驟最容易出問題。

從這個意義上說,高考數學實測的價值不只是看豆包和ChatGPT誰多做對一道題。它更像一次公開壓力測試:

當題目足夠標準、評分足夠嚴苛、推理鏈條足夠長,AI到底能不能在中文數學場景里穩定工作。至少從這輪表現看,頭部AI已經具備相當強的高考數學解題能力;但越到復雜題,越需要人和AI一起做校驗。

一句話,AI已經能做很多高考數學題;接下來更重要的問題,是我們怎么把它用成學習工具,而不是簡單的抄答案工具。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
宏遠早報!上海報價焦泊喬方案,朱芳雨赴新疆談判,徐杰自費特訓

宏遠早報!上海報價焦泊喬方案,朱芳雨赴新疆談判,徐杰自費特訓

多特體育說
2026-06-12 11:02:07
白人飯的秘密:為啥美劇里的人午餐就吃個三明治,真能吃飽嗎?

白人飯的秘密:為啥美劇里的人午餐就吃個三明治,真能吃飽嗎?

向航說
2026-06-10 00:50:03
世界杯開幕!中國隊首發labubu馬寧 網友:除了國足 該來的都來了

世界杯開幕!中國隊首發labubu馬寧 網友:除了國足 該來的都來了

念洲
2026-06-12 06:50:59
韓國股市,連續5天觸發熔斷

韓國股市,連續5天觸發熔斷

第一財經資訊
2026-06-12 08:49:24
結束24年主持人工作,租70平房間直播帶貨,今拿到退工單滿懷不舍

結束24年主持人工作,租70平房間直播帶貨,今拿到退工單滿懷不舍

胡一舸南游y
2026-06-11 20:33:34
劉曉慶果然沒說錯,陳沖年輕時加入美國國籍,晚年卻回國養老

劉曉慶果然沒說錯,陳沖年輕時加入美國國籍,晚年卻回國養老

仙味少女心
2026-06-11 01:37:46
全國最好吃10種下酒菜,你吃過幾個?最后一道讓無數老饕魂牽夢縈

全國最好吃10種下酒菜,你吃過幾個?最后一道讓無數老饕魂牽夢縈

阿龍美食記
2026-06-09 15:12:16
12分鐘連進2球逆轉!韓國手握主動權,孫興慜留憾,A組積分榜出爐

12分鐘連進2球逆轉!韓國手握主動權,孫興慜留憾,A組積分榜出爐

萌蘭聊個球
2026-06-12 12:12:06
總決賽還沒結束就傳出交易!2.2億球星被新秀完爆,或交易至籃網

總決賽還沒結束就傳出交易!2.2億球星被新秀完爆,或交易至籃網

你的籃球頻道
2026-06-12 11:12:55
拉什福德轉會阿森納?兩隊醞釀重磅邊鋒互換,阿爾特塔已點頭同意

拉什福德轉會阿森納?兩隊醞釀重磅邊鋒互換,阿爾特塔已點頭同意

夜白侃球
2026-06-12 10:59:11
貝爾服了!你可以成為最強,但成不了梅西,因為他早已超越了最好

貝爾服了!你可以成為最強,但成不了梅西,因為他早已超越了最好

體育閑話說
2026-06-12 06:34:41
衛星圖像顯示,俄羅斯的坦克儲備幾乎耗盡,“家底”已經嚴重縮水

衛星圖像顯示,俄羅斯的坦克儲備幾乎耗盡,“家底”已經嚴重縮水

零度Military
2026-06-10 22:32:45
浙江一女子忍到女兒高考結束離婚,再嫁苦等10年的初戀,誰料,女兒卻說,媽,我只有一個爸,你只管去奔向你的幸福吧!

浙江一女子忍到女兒高考結束離婚,再嫁苦等10年的初戀,誰料,女兒卻說,媽,我只有一個爸,你只管去奔向你的幸福吧!

大愛三湘
2026-06-11 21:03:48
大跌7成!從90萬跌到17萬,汽車圈被一顆深水炸彈震撼!

大跌7成!從90萬跌到17萬,汽車圈被一顆深水炸彈震撼!

蔣東文
2026-06-11 21:02:54
記者:塔利亞菲科至少缺戰2場,斯卡洛尼正在考慮是否更換他

記者:塔利亞菲科至少缺戰2場,斯卡洛尼正在考慮是否更換他

懂球帝
2026-06-12 10:16:09
1990-2022世界杯排名:梅西僅第三,第一無人能超越

1990-2022世界杯排名:梅西僅第三,第一無人能超越

五姑娘臺球
2026-06-11 21:37:08
境外團伙搭色情網站毒害中國青少年 網站瀏覽量超1億次 資金流水高達1200萬元

境外團伙搭色情網站毒害中國青少年 網站瀏覽量超1億次 資金流水高達1200萬元

閃電新聞
2026-06-11 15:48:37
18名印度人因缺少返程機票及相關證明文件 在曼谷機場被拒絕登機前往老撾

18名印度人因缺少返程機票及相關證明文件 在曼谷機場被拒絕登機前往老撾

曼谷陳大叔
2026-06-11 16:50:19
圖片報:墨西哥總統缺席世界杯開幕式,并轉贈門票給女足球員

圖片報:墨西哥總統缺席世界杯開幕式,并轉贈門票給女足球員

懂球帝
2026-06-12 01:52:05
魯伊-科斯塔:皇馬還沒付穆帥1500萬歐解約金,但錢隨時會到賬

魯伊-科斯塔:皇馬還沒付穆帥1500萬歐解約金,但錢隨時會到賬

懂球帝
2026-06-12 03:53:31
2026-06-12 13:51:00
量子位 incentive-icons
量子位
追蹤人工智能動態
12782文章數 176491關注度
往期回顧 全部

教育要聞

學英語被驚到:“bite your tongue”的血腥由來,是中世紀酷刑?

頭條要聞

7萬字離職長文引發釘釘管理層地震 作者再發長文

頭條要聞

7萬字離職長文引發釘釘管理層地震 作者再發長文

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

與熱巴戀情曝光1天,陳飛宇現身

財經要聞

萬億美元順差背后,透露這些信號

科技要聞

SpaceX IPO募資750億美元,馬斯克身家萬億

汽車要聞

佟湘北:全新smart#6 自成一派好看更好開

態度原創

家居
房產
旅游
教育
軍事航空

家居要聞

空間微調 移形換境

房產要聞

科城·美林學筑5月領跑崖州灣:成交價、銷售套數、轉化率三項第一

旅游要聞

夜雨中的古城依舊喧囂,滿滿的商業化氣息,卻攔不住游客八方來朝

教育要聞

初二這一年

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版