无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

5個140分!2026高考數(shù)學AI評測出爐

0
分享至


15日,山東省教育招生考試院舉辦2026年夏季高考評卷工作開放日活動。

2026年山東省參加夏季高考統(tǒng)一考試的考生共計72萬人,9個科目試卷總數(shù)達到432萬余份。 評卷工作委托山東大學和山東師范大學進行,共選聘評卷員3700余人。

山東大學負責評閱語文、數(shù)學、物理、化學、生物5個科目。山東師范大學負責評閱外語、思想政治、歷史、地理4個科目。評卷工作于6月11日正式啟動,選擇題部分實行機器評閱,目前已全部完成。非選擇題部分由人工網(wǎng)上評閱,目前正在進行中。

據(jù)悉,本輪評卷工作結束后,我省將陸續(xù)開展成績匯總、 錄取控制分數(shù)線 劃定等工作,6月25日下午3點后正式公布高考成績。

近日,新京報展開一場評測,選取訊飛星火、DeepSeek、智譜、ChatGPT、Kimi和MiniMax六款以推理見長的大模型,以2026年新高考I卷數(shù)學卷為統(tǒng)一試題進行測試。評測邀請了兩位專業(yè)教師參與閱卷評分:人大附中北京經(jīng)濟技術開發(fā)區(qū)學校高中數(shù)學教師、教研組長、北京市數(shù)學骨干教師韓靜波,以及北京市中學數(shù)學特級教師、全國高中數(shù)理化名師俱樂部副理事長、中國數(shù)學奧林匹克高級教練丁益祥。

六個“考生”,五個上了140分

測試共19道題目,滿分150分。試卷題目依據(jù)網(wǎng)絡流出的多個版本交叉驗證而成,可能與真題存在不完全相符的情況,但所有模型使用的是同一套題目,不影響橫向比較的公平性。

從總分來看,六款大模型呈現(xiàn)了明顯的梯度:訊飛星火以148分位居第一,Kimi以145分緊隨其后,DeepSeek144分、智譜143分、MiniMax142分依次排列,ChatGPT以137分排在末尾。六個“考生”中,有五個上了140分


▲6名大模型“考生”總體得分情況。新京報制圖/盧子雄

基礎題全員滿分,解題規(guī)范拉開差距

在選擇題和多選題上,六款模型實現(xiàn)了全員滿分,僅有個別模型在填空題上出現(xiàn)了失誤。真正拉開差距的,是解答題的得分和解題過程的規(guī)范性。

訊飛星火的規(guī)范分與結果分完全一致,推理過程較為清晰,字符也較規(guī)范。丁益祥舉例說,在第15題第(2)小題中,訊飛星火給出了幾何法和向量法兩種解法;第18題第(2)小題的兩問中,它充分利用了平面幾何中三角形面積之間的關系,并借助夾角公式簡化了運算。丁益祥還注意到,“MiniMax卷”和“智譜卷”在第18題第(2)小題的第①問上,同樣利用了幾何中三角形面積關系來處理問題,“都有不錯表現(xiàn)”。

韓靜波則發(fā)現(xiàn),訊飛星火在數(shù)形結合、對圖形幾何性質的分析上明顯優(yōu)于其他模型,“它在解析第二問幾何性質時分析得很好,做法簡潔,還有一些題目給出了兩種解法。”

其他模型則在解答題中不同程度地出現(xiàn)了步驟失分,原因多為關鍵推導缺失或邏輯不連貫


▲各大模型“考生”不同題目分數(shù)統(tǒng)計情況。新京報制圖/盧子雄

壓軸題分出高下,部分模型用了"超綱"知識

壓軸題(第18、19題)成為區(qū)分模型復雜推理能力的分水嶺。大部分模型在第18題中表現(xiàn)尚可,但在第19題上出現(xiàn)了明顯的“后繼乏力”——有模型僅得到12分(滿分17分),暴露出部分大模型在處理多步驟、高復雜度邏輯鏈時仍存在能力短板。

韓靜波觀察發(fā)現(xiàn),DeepSeek在形式化的代數(shù)推導方面比較擅長,能按部就班地完成長邏輯推導,但在數(shù)形結合、對圖形幾何性質的分析上稍顯欠缺,利用題目特殊性靈活處理問題的能力也顯不足。

值得注意的是,部分模型在解題中動用了超出高中知識范圍的方法。丁益祥指出,“DeepSeek卷”“Kimi卷”“ChatGPT卷”“智譜卷”在求解第18題第(2)小題時都使用了向量的叉乘運算,而“DeepSeek卷”在第19題第(2)小題中還動用了“上確界”的概念。丁益祥表示,這些都屬于高等數(shù)學知識,在解答高考數(shù)學試題中一般不宜使用。


▲丁益祥對試卷的批閱記錄。

"答卷各有千秋",仍有改進余地

除了知識運用的問題,丁益祥還指出了大模型在答題呈現(xiàn)上的一些不足。“MiniMax卷”和“智譜卷”中存在字符不統(tǒng)一、不規(guī)范的情況,給人的感覺較為凌亂。他還提到,ChatGPT卷第15題第(2)小題的幾何法證明較為繁瑣,智譜卷第19題第(3)小題的推導也不夠簡練。

不過,在答題思路的一致性上,六款模型表現(xiàn)出了一定程度的趨同。以第15題第(1)小題為例,六份答卷一致地采用幾何法證明;第18題第(1)小題,六份答卷一致地利用參數(shù)之間的關系求橢圓的標準方程;第19題第(1)小題,六份答卷也一致地使用直接計算的方法得出結果。丁益祥用“某些思路雷同,答卷各有千秋”來概括六份答卷。

總體而言,測評結果表明,頭部大模型在高考數(shù)學場景中已展現(xiàn)出一定的解題實力,不僅能算出正確結果,也能以較為規(guī)范、嚴謹?shù)倪^程呈現(xiàn)推導思路。但部分模型在步驟規(guī)范性、復雜壓軸題的推理能力以及答題格式的規(guī)范呈現(xiàn)上,仍然存在明顯的提升空間。正如有專家指出,當前大模型的數(shù)學能力競爭,已從“能算出結果”轉向了“過程嚴謹、邏輯完整、復雜問題可拆解”的更高階段。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
布倫森:即便今年沒有奪冠,放棄1.13億美元續(xù)約尼克斯也是100%超值

布倫森:即便今年沒有奪冠,放棄1.13億美元續(xù)約尼克斯也是100%超值

818體育
2026-06-15 11:50:51
1979年計劃生育,一家只準生一個,陳云:搞不好要被罵斷子絕孫

1979年計劃生育,一家只準生一個,陳云:搞不好要被罵斷子絕孫

微野談寫作
2026-06-15 10:55:06
布倫森:我沒什么壓力 父親簽過八、九份非保障合同那才叫壓力

布倫森:我沒什么壓力 父親簽過八、九份非保障合同那才叫壓力

北青網(wǎng)-北京青年報
2026-06-15 10:04:13
理查德:提到鳳凰山我的雞皮疙瘩都起來了,非常感謝成都球迷

理查德:提到鳳凰山我的雞皮疙瘩都起來了,非常感謝成都球迷

懂球帝
2026-06-15 19:31:01
張帥2-0完勝更高排名的歐洲悍將,晉級WTA500柏林站正賽

張帥2-0完勝更高排名的歐洲悍將,晉級WTA500柏林站正賽

側身凌空斬
2026-06-15 19:51:04
外媒:伊朗裔美國人將在洛杉磯抗議伊朗隊參加世界杯

外媒:伊朗裔美國人將在洛杉磯抗議伊朗隊參加世界杯

懂球帝
2026-06-15 14:09:41
小米工程師稱怕某些公司“比情懷搞捆綁”,疑似暗諷盤古大模型

小米工程師稱怕某些公司“比情懷搞捆綁”,疑似暗諷盤古大模型

三言科技
2026-06-14 15:48:00
鄭麗文在美說出實話:島內很難接受“一國兩制”,和平統(tǒng)一難通過

鄭麗文在美說出實話:島內很難接受“一國兩制”,和平統(tǒng)一難通過

飄逸的云朵
2026-06-14 18:41:15
78歲老帥落淚!世界杯首秀吞1-7慘案 賽后崩潰:實在受不了被暴揍

78歲老帥落淚!世界杯首秀吞1-7慘案 賽后崩潰:實在受不了被暴揍

風過鄉(xiāng)
2026-06-15 05:41:17
震撼!美國頂級芯片工程師確認:華為無需ASML依舊能實現(xiàn)1.4nm

震撼!美國頂級芯片工程師確認:華為無需ASML依舊能實現(xiàn)1.4nm

林子說事
2026-06-15 17:16:57
伊朗養(yǎng)了20多年的反美武裝,在伊朗最困難的時候反水倒戈

伊朗養(yǎng)了20多年的反美武裝,在伊朗最困難的時候反水倒戈

明天見灌裝冰塊
2026-06-15 19:19:17
凱特暴怒!三小只被起哄,凱特冷眼怒懟:人民的王妃,終究還是站到了王權的堡壘之內...

凱特暴怒!三小只被起哄,凱特冷眼怒懟:人民的王妃,終究還是站到了王權的堡壘之內...

悅居英國
2026-06-15 19:32:23
臺當局徹底絕望!大陸第二波反制開始,要把日本野心按死在臺海

臺當局徹底絕望!大陸第二波反制開始,要把日本野心按死在臺海

十夏九漓
2026-06-14 20:40:59
NBA官方總決賽G5裁判報告:漏吹哈珀對布倫森犯規(guī) 無礙尼克斯奪冠

NBA官方總決賽G5裁判報告:漏吹哈珀對布倫森犯規(guī) 無礙尼克斯奪冠

醉臥浮生
2026-06-15 08:41:50
C羅不愧是人生大贏家!一家八口整整齊齊,5個孩子長得都像他

C羅不愧是人生大贏家!一家八口整整齊齊,5個孩子長得都像他

照見古今
2026-06-15 15:58:10
世界杯播客|世界杯“水門事件”:被切開的90分鐘

世界杯播客|世界杯“水門事件”:被切開的90分鐘

澎湃新聞
2026-06-15 12:08:27
官媒發(fā)文,76歲張藝謀再破天花板,全家改國籍移民早就水落石出

官媒發(fā)文,76歲張藝謀再破天花板,全家改國籍移民早就水落石出

青杉依舊啊啊
2026-06-15 04:22:01
世界杯F組憑什么被叫“死亡之組”?看完四隊底牌,我手心全是汗

世界杯F組憑什么被叫“死亡之組”?看完四隊底牌,我手心全是汗

林子說事
2026-06-15 07:04:19
都體:曼奇尼接近回歸執(zhí)教意大利,4年合同稅后年薪250萬歐

都體:曼奇尼接近回歸執(zhí)教意大利,4年合同稅后年薪250萬歐

懂球帝
2026-06-15 18:57:47
庫庫妻子發(fā)文告別切爾西,并曬出自己兒時穿皇馬球衣照片

庫庫妻子發(fā)文告別切爾西,并曬出自己兒時穿皇馬球衣照片

懂球帝
2026-06-15 17:33:41
2026-06-15 22:19:00
山東教育 incentive-icons
山東教育
發(fā)布山東教育界資訊
6875文章數(shù) 13223關注度
往期回顧 全部

教育要聞

人大附中校長宓奇寄語2026年新生一代 人大附中校長宓奇:對2026年出生的孩子,我想說三句話

頭條要聞

女生當模特被折騰3個半小時 遭老板嫌棄顏值取消合作

頭條要聞

女生當模特被折騰3個半小時 遭老板嫌棄顏值取消合作

體育要聞

世界杯開賽4天,亞足聯(lián)依然保持不敗!

娛樂要聞

黃大煒猝逝過程太離奇,母親追查真相

財經(jīng)要聞

活鼠、活蛆、農(nóng)殘超標 山姆回應被約談

科技要聞

白宮一個電話,最強Claude上線三天就沒了

汽車要聞

網(wǎng)易X智己 夏日尊享內購會,熱力收官

態(tài)度原創(chuàng)

教育
旅游
親子
房產(chǎn)
公開課

教育要聞

院士導師坐鎮(zhèn)!海淀這所特色科技高中,藏著科學院頂配資源

旅游要聞

上海迪士尼擴建項目全速推進,蜘蛛俠園區(qū)、第三座酒店取得新進展

親子要聞

“10塊錢的鞋,咋敢給孩子穿?”寶媽情緒失控:你們都很有錢嗎

房產(chǎn)要聞

最低13100元/㎡!三亞新一輪安居房房源,開始登記!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版