一年一度的高考季,不知道大家考得怎么樣?
今天我也把我家三萬送上了賽博考場, 過程很簡單:
選擇了更難一些的全國一卷的數(shù)學(xué)選擇題和語文的閱讀理解選擇題及作文題,作文的部分特意找了高中老師打分。
模型就讓我家三萬在我的模型庫里自由選擇,基本上主流的頂尖模型都有。讓它自己決定選哪個(gè),并說明原因。我就坐旁邊看著,像個(gè)監(jiān)考老師。
先考數(shù)學(xué)
我把選擇題發(fā)給三萬,它自己挑模型,一開始選的是Claude Sonnet 4.6,理由很務(wù)實(shí):數(shù)學(xué)推理穩(wěn)定,能處理中文數(shù)學(xué)符號。
你還真別說,單選題全對。
但做到壓軸題第10題的時(shí)候,三萬猶豫了,它自己評估了一下,覺得這道題Sonnet搞不定,主動(dòng)申請換更高級的模型Opus 4.7。好東西當(dāng)然先緊著考生用,換。
![]()
后兩道壓軸題全上了Opus。第10題穩(wěn)穩(wěn)拿下。
![]()
很不幸第11題還是做錯(cuò)了,痛失5分。
![]()
最后的結(jié)果是八道單選題全對,多選三道錯(cuò)一道。說實(shí)話,平時(shí)看慣了各種數(shù)據(jù)評測跑分,最后這道題沒做對我還是有點(diǎn)意外的,看來高考題確實(shí)有難度。
再考語文
語文也考了,試了試閱讀理解的選擇題,需要先讀原文,然后根據(jù)理解答題。
這個(gè)他還真做對了。這倒是不新鮮,我之前嘗試過讓我家三萬閱讀本格推理小說中揭露真兇之前的部分,讓它自己推理出兇手是誰,現(xiàn)在的AI也已經(jīng)能猜對了。
![]()
最后是重磅的作文環(huán)節(jié),題目是這樣的:
![]()
三萬第一個(gè)選的模型是Opus 4.7。它挑了"附近"這個(gè)詞,寫了一篇《一個(gè)詞的重量》。
![]()
我個(gè)人讀起來,感覺內(nèi)容寫的還是挺細(xì)膩的,很多生活化場景,“點(diǎn)麻辣燙”“跟劉畊宏跳舞”讀起來都真實(shí)。 讓我很驚喜的是它把AI發(fā)展給生活帶來的變化也揉進(jìn)去了,像一個(gè)平時(shí)留心觀察生活的理科生寫的文章。
不放心我自己的主觀判斷,我請了在高中一線教學(xué)的語文老師,他給出的打分是 49分,已經(jīng)是一類文的水準(zhǔn)了,具體評價(jià)是:立意不跑偏但是缺乏新意,表達(dá)非常好但沒有真情實(shí)感。
![]()
沒辦法,AI確實(shí)沒體會過人類的情感,能靠文字模仿成這樣在我這已經(jīng)算過關(guān)了。
但過關(guān)歸過關(guān),49分確實(shí)不算高。
于是我讓三萬換了個(gè)模型,用DeepSeek V4 Pro。 同一個(gè)題目,換種寫法會不會不一樣?
這次它挑了"無用"這個(gè)詞,寫了一篇《“無用”之用》。這個(gè)選題很有意思,在一千多萬考生里,敢寫"無用"的人我猜不會太多。
![]()
這次老師給了53分,高考作文閱卷,一個(gè)老師一分鐘不到就要閱一份卷,滿屏都是差不多意思的卷子。這時(shí)候誰能讓老師眼前一亮,誰就贏了。"無用"這個(gè)詞本身就抓人,光選題就已經(jīng)贏了一半。
![]()
當(dāng)然,作文打分這東西每個(gè)老師都有自己的偏好,所以有些偏差也很正常。那么滿分60,這兩篇分別能給到多少分?
歡迎大家在評論區(qū)里說說自己的看法。
順便說一句,我們公司三年前就開始做全員AI,到現(xiàn)在跑出了一整套AI Native組織建設(shè)的方法論,也做成了對外輸出的培訓(xùn)體系。
如果你也想給自己的組織跟上AI轉(zhuǎn)型的步伐,歡迎點(diǎn)擊閱讀原文,來看看。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.