亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Nat Commun | 我們能精確測(cè)量“理解”嗎?基于文本嵌入的真實(shí)世界學(xué)習(xí)追蹤

0
分享至


認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


基本信息

Title:Text embedding models yield detailed conceptual knowledge maps derived from short multiple-choice quizzes

發(fā)表時(shí)間:2026-3-24

發(fā)表期刊:Nature Communications

影響因子:15.7

獲取原文:

1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

假設(shè)一位老師能夠擁有一張完整的、可視化的“知識(shí)地圖”,上面精確標(biāo)注了某個(gè)學(xué)生對(duì)所有概念的掌握程度,教育的效率將會(huì)發(fā)生怎樣的改變?


在現(xiàn)實(shí)中,我們?cè)u(píng)估學(xué)習(xí)效果的手段通常非常單一:給出一套測(cè)試題,計(jì)算正確率,最后得出一個(gè)分?jǐn)?shù)(比如85分或B+)。然而,這種單一維度的指標(biāo)犧牲了大量關(guān)鍵信息。兩個(gè)同樣考了85分的學(xué)生,可能在知識(shí)盲區(qū)上完全不同:一個(gè)是沒(méi)掌握某個(gè)核心概念,另一個(gè)則是對(duì)三個(gè)邊緣概念一知半解。傳統(tǒng)的實(shí)驗(yàn)室記憶研究往往側(cè)重于信息的“編碼”與“提取”,難以區(qū)分機(jī)械記憶與真正的概念理解;而真實(shí)世界中的學(xué)習(xí),其核心恰恰在于將新信息編織進(jìn)已有的概念網(wǎng)絡(luò)中。

那么,我們能否從最常見(jiàn)的評(píng)估工具(如幾道簡(jiǎn)單的選擇題)中,榨取出現(xiàn)實(shí)且高分辨率的認(rèn)知狀態(tài)信息?

近期發(fā)表在《Nature Communications》上的一項(xiàng)研究提出了一種全新的計(jì)算框架。研究者借助自然語(yǔ)言處理(NLP)中的文本嵌入模型將真實(shí)的在線課程(可汗學(xué)院的物理講座)與隨堂測(cè)試題映射到同一個(gè)高維語(yǔ)義空間中。這篇工作不僅成功追蹤了學(xué)習(xí)者在觀看視頻前后的動(dòng)態(tài)知識(shí)軌跡,還證明了我們完全可以通過(guò)極少量的測(cè)試,精準(zhǔn)預(yù)測(cè)個(gè)體對(duì)特定概念的理解程度。


研究核心總結(jié)

為了在真實(shí)學(xué)習(xí)場(chǎng)景中驗(yàn)證這一框架,研究者讓50名參與者觀看了兩段可汗學(xué)院的科普視頻(《四種基本作用力》和《恒星的誕生》),并在觀看前、兩段視頻之間以及觀看后,分別完成了包含13道選擇題的簡(jiǎn)短測(cè)試。基于這些行為數(shù)據(jù),研究者得出了以下核心發(fā)現(xiàn)。

一、文本嵌入模型能精準(zhǔn)匹配測(cè)試題與課程的“高光時(shí)刻”

要評(píng)估學(xué)生學(xué)到了什么,首先需要量化課程本身的內(nèi)容。研究者沒(méi)有依賴人工標(biāo)注,而是使用主題模型(LDA)對(duì)視頻的自動(dòng)生成字幕進(jìn)行了分析。他們將字幕切分為重疊的滑動(dòng)窗口,提取出潛在的語(yǔ)義主題,從而將整段視頻轉(zhuǎn)化為一條在15維“主題空間”中隨時(shí)間移動(dòng)的軌跡。

更有趣的是,當(dāng)研究者將測(cè)試題的文本也投入這個(gè)模型時(shí),發(fā)現(xiàn)模型能夠自動(dòng)識(shí)別出每道題目究竟在考察視頻哪一分哪一秒的內(nèi)容。盡管題目和字幕往往使用了完全不同的詞匯和句式,但它們?cè)谏顚痈拍羁臻g中的坐標(biāo)高度重合。這意味著,模型超越了表面的“詞匯匹配”,真正抓住了概念的語(yǔ)義關(guān)聯(lián)。


Fig 1. 實(shí)驗(yàn)范式。參與者交替進(jìn)行三次包含13道選擇題的測(cè)驗(yàn)和觀看兩段可汗學(xué)院的物理講座視頻。測(cè)驗(yàn)題目涵蓋了講座1、講座2以及一般物理常識(shí)。


Fig 2. 課程內(nèi)容的建模過(guò)程。研究者將講座字幕分解為重疊的文本滑動(dòng)窗口,利用主題模型將其轉(zhuǎn)化為高維語(yǔ)義空間中的軌跡,并將測(cè)試題也映射到同一共享空間中。
二、僅用少量題目即可估算“逐秒級(jí)”的動(dòng)態(tài)知識(shí)軌跡

既然題目和課程時(shí)間點(diǎn)被映射到了同一個(gè)空間,研究者提出了一種巧妙的算法:利用參與者在某幾道題上的正確率,結(jié)合這些題目與課程各個(gè)時(shí)間點(diǎn)在語(yǔ)義空間中的距離(相關(guān)性),來(lái)反推參與者對(duì)課程每一秒內(nèi)容的掌握程度。

結(jié)果顯示,這種估算極其敏銳。在觀看《四種基本作用力》之前,參與者對(duì)該視頻內(nèi)容的知識(shí)估值很低;但觀看之后(測(cè)驗(yàn)2和測(cè)驗(yàn)3),對(duì)應(yīng)內(nèi)容的知識(shí)估值顯著躍升,且這種提升具有高度的內(nèi)容特異性:他們只在剛剛看過(guò)的概念區(qū)域表現(xiàn)出知識(shí)增長(zhǎng)。


Fig 3. 講座與測(cè)試題的主題重疊度。條形圖展示了不同主題在講座時(shí)間點(diǎn)和測(cè)試題中的權(quán)重變異性,證明模型在粗粒度上成功捕捉了講座與對(duì)應(yīng)問(wèn)題集之間的概念一致性。


Fig 4. 每道測(cè)試題捕捉了講座的哪些部分?時(shí)間序列圖顯示了具體某道題目的主題向量與視頻各個(gè)時(shí)間點(diǎn)主題向量的相關(guān)性,證明題目在時(shí)間線上具有高度的特異性。
三、語(yǔ)義空間中的知識(shí)具有“平滑性”與預(yù)測(cè)力

如果這個(gè)高維空間真的反映了人類組織知識(shí)的方式,那么它應(yīng)該具備預(yù)測(cè)能力。研究者使用廣義線性混合模型(GLMM)發(fā)現(xiàn),基于某幾個(gè)問(wèn)題估算出的特定坐標(biāo)點(diǎn)的“知識(shí)水平”,能夠極其可靠地預(yù)測(cè)參與者能否答對(duì)該坐標(biāo)點(diǎn)附近的另一道陌生題目。

此外,研究者還計(jì)算了知識(shí)在語(yǔ)義空間中的衰減率。他們發(fā)現(xiàn),如果一個(gè)學(xué)生掌握了概念A(yù),那么他掌握概念A(yù)附近其他概念的概率會(huì)隨著語(yǔ)義距離的增加而平滑下降。這種“平滑性”證明了概念學(xué)習(xí)不是孤立的,理解一個(gè)概念自然會(huì)輻射到相關(guān)的概念網(wǎng)絡(luò)。


Fig 5. 逐秒估算學(xué)習(xí)者對(duì)講座內(nèi)容的掌握程度。曲線展示了在不同測(cè)驗(yàn)階段,參與者對(duì)講座每一刻所呈現(xiàn)內(nèi)容的加權(quán)正確率估值,清晰反映了觀看視頻帶來(lái)的知識(shí)躍升。


Fig 6. 利用估算的知識(shí)預(yù)測(cè)對(duì)未知題目的解答成功率。模型結(jié)果表明,無(wú)論是在單次測(cè)驗(yàn)內(nèi)部,還是跨越不同講座的內(nèi)容,特定坐標(biāo)的知識(shí)估值都能顯著預(yù)測(cè)參與者答對(duì)該區(qū)域題目的概率。
四、繪制可視化的二維“知識(shí)與學(xué)習(xí)地圖”

為了更直觀地展示學(xué)習(xí)成果,研究者將高維的主題空間降維投影到了二維平面上,生成了可視化的“知識(shí)地圖”(反映特定時(shí)刻懂了什么)和“學(xué)習(xí)地圖”(反映兩次測(cè)驗(yàn)之間學(xué)到了什么)。

在這些地圖上,未受訓(xùn)前的區(qū)域是一片暗淡;而隨著視頻的播放,地圖上對(duì)應(yīng)講座軌跡的特定區(qū)域被依次“點(diǎn)亮”。這種地圖不僅能展示群體的學(xué)習(xí)軌跡,理論上也可以為每個(gè)個(gè)體生成專屬的認(rèn)知畫(huà)像,讓教育者一眼看出學(xué)生的知識(shí)盲區(qū)和優(yōu)勢(shì)所在。


Fig 7. 知識(shí)在文本嵌入空間中隨距離平滑衰減。圖表顯示,以某道答對(duì)或答錯(cuò)的題目為中心,隨著語(yǔ)義距離的增加,參與者答對(duì)周圍題目的比例逐漸趨近于其整體平均水平。


Fig 8. 知識(shí)與學(xué)習(xí)的幾何形態(tài)映射。二維地圖直觀展示了參與者在三次測(cè)驗(yàn)中的知識(shí)狀態(tài)分布(A),以及相鄰兩次測(cè)驗(yàn)之間知識(shí)的動(dòng)態(tài)增長(zhǎng)區(qū)域(B),星號(hào)標(biāo)注了特定坐標(biāo)點(diǎn)對(duì)應(yīng)的核心詞匯云(C)。


研究意義

這項(xiàng)研究在理論與應(yīng)用層面都提供了重要的啟發(fā)。

在理論層面,它為“概念學(xué)習(xí)”提供了一個(gè)可計(jì)算的幾何框架。研究證實(shí)了人類的真實(shí)世界知識(shí)在語(yǔ)義空間中是連續(xù)且平滑的:我們并非像往硬盤里存文件那樣孤立地記憶知識(shí)點(diǎn),而是以概念網(wǎng)絡(luò)的形式進(jìn)行理解。

在方法學(xué)與應(yīng)用層面,這項(xiàng)工作展示了如何從現(xiàn)有的、最基礎(chǔ)的教育評(píng)估工具(如選擇題)中提取出高維度的認(rèn)知狀態(tài)信息。它不需要復(fù)雜的腦機(jī)接口或冗長(zhǎng)的一對(duì)一面試,僅靠自然語(yǔ)言處理模型和少量測(cè)試題,就能實(shí)現(xiàn)對(duì)學(xué)習(xí)過(guò)程的高精度追蹤。值得注意的是,研究者發(fā)現(xiàn)針對(duì)特定領(lǐng)域訓(xùn)練的輕量級(jí)主題模型(如LDA),在區(qū)分具體課程概念時(shí),反而比龐大的通用大語(yǔ)言模型(如BERT)表現(xiàn)得更精準(zhǔn),這為未來(lái)開(kāi)發(fā)垂直領(lǐng)域的教育AI提供了重要參考。

當(dāng)然,該研究也有其邊界。當(dāng)前的文本嵌入模型主要捕捉概念間的“語(yǔ)義相似度”,但尚未包含更復(fù)雜的知識(shí)圖譜結(jié)構(gòu)(如概念間的因果關(guān)系或先決條件依賴)。盡管如此,這種將抽象認(rèn)知狀態(tài)可視化的嘗試,已經(jīng)為未來(lái)的個(gè)性化自適應(yīng)教育系統(tǒng)打開(kāi)了一扇極具潛力的大門。

分享人:飯鴿兒

審核:PsyBrain 腦心前沿編輯部

你好,這里是「PsyBrain 腦心前沿

專注追蹤全球認(rèn)知神經(jīng)科學(xué)的最尖端突破

視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級(jí)大刊

每日速遞「深度解讀」與「前沿快訊

科研是一場(chǎng)探索未知的長(zhǎng)跑,但你無(wú)需獨(dú)行。歡迎加入PsyBrain 學(xué)術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無(wú)垠前沿。

點(diǎn)擊卡片進(jìn)群,歡迎你的到來(lái)

一鍵關(guān)注,點(diǎn)亮星標(biāo) ? 前沿不走丟!


一鍵分享,讓更多人了解前沿

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女演員千萬(wàn)別整容《八千里路云和月》看43歲萬(wàn)茜和24歲王和就知道

女演員千萬(wàn)別整容《八千里路云和月》看43歲萬(wàn)茜和24歲王和就知道

亦暖追劇隨筆
2026-04-17 12:28:50
上海房租終于漲了

上海房租終于漲了

魔都財(cái)觀
2026-04-16 07:41:57
紐約時(shí)報(bào):40美元半只雞讓美國(guó)人震驚

紐約時(shí)報(bào):40美元半只雞讓美國(guó)人震驚

新浪財(cái)經(jīng)
2026-04-16 12:46:58
別再說(shuō)女明星靠修圖!王鷗和李小冉路人鏡頭長(zhǎng)這樣,打臉了多少人

別再說(shuō)女明星靠修圖!王鷗和李小冉路人鏡頭長(zhǎng)這樣,打臉了多少人

陳意小可愛(ài)
2026-04-17 19:14:53
云南省佛教協(xié)會(huì)副會(huì)長(zhǎng)祜巴瑪哈香圓寂,享年59歲

云南省佛教協(xié)會(huì)副會(huì)長(zhǎng)祜巴瑪哈香圓寂,享年59歲

澎湃新聞
2026-04-17 10:34:30
演員潘宏彬去世,演斯文敗類走紅,與劉德華斷交后退圈賣房謀生

演員潘宏彬去世,演斯文敗類走紅,與劉德華斷交后退圈賣房謀生

開(kāi)開(kāi)森森
2026-04-17 08:22:55
你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說(shuō)出來(lái)肯定大家要笑死

你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說(shuō)出來(lái)肯定大家要笑死

帶你感受人間冷暖
2026-01-29 00:10:05
程曉玥挺大肚為女慶生,富二代老公罕見(jiàn)同框,一家三口畫(huà)面太甜

程曉玥挺大肚為女慶生,富二代老公罕見(jiàn)同框,一家三口畫(huà)面太甜

黔鄉(xiāng)小姊妹
2026-04-15 08:49:46
俄羅斯說(shuō)卡就卡,美國(guó)說(shuō)停就停,中國(guó)的外貿(mào)生意,咋就這么難做?

俄羅斯說(shuō)卡就卡,美國(guó)說(shuō)停就停,中國(guó)的外貿(mào)生意,咋就這么難做?

領(lǐng)悟看世界
2026-04-18 00:42:04
高市早苗為何被稱為“永田町公共廁所”?真相大開(kāi)眼界!

高市早苗為何被稱為“永田町公共廁所”?真相大開(kāi)眼界!

韜聞
2026-04-17 12:55:06
1990年,作家三毛和76歲王洛賓同居

1990年,作家三毛和76歲王洛賓同居

年代回憶
2026-04-15 20:09:58
馬筱梅吐槽婆婆別墅沒(méi)處下腳,背刺蘭姐,可見(jiàn),她是真的壞

馬筱梅吐槽婆婆別墅沒(méi)處下腳,背刺蘭姐,可見(jiàn),她是真的壞

魔都姐姐雜談
2026-04-16 04:42:28
世錦賽首輪醞釀大冷,小特下下簽!2個(gè)條件下,趙心童登頂世界第1

世錦賽首輪醞釀大冷,小特下下簽!2個(gè)條件下,趙心童登頂世界第1

球場(chǎng)沒(méi)跑道
2026-04-17 11:57:10
預(yù)定2.8億超級(jí)頂薪,季后賽還能提檔!哈登奪冠希望越來(lái)越大了

預(yù)定2.8億超級(jí)頂薪,季后賽還能提檔!哈登奪冠希望越來(lái)越大了

老梁體育漫談
2026-04-17 12:53:30
廣瀨百合(熟女的魅力擋不住)

廣瀨百合(熟女的魅力擋不住)

藍(lán)色海洋009
2026-04-14 03:16:02
A股:剛剛、證監(jiān)會(huì)權(quán)威發(fā)布,釋放大信號(hào),下周大盤迎來(lái)大級(jí)別行情

A股:剛剛、證監(jiān)會(huì)權(quán)威發(fā)布,釋放大信號(hào),下周大盤迎來(lái)大級(jí)別行情

夜深愛(ài)雜談
2026-04-17 22:44:51
2名中國(guó)球員入選荷蘭國(guó)足,明確表態(tài)愿意為中國(guó)隊(duì)出場(chǎng)比賽

2名中國(guó)球員入選荷蘭國(guó)足,明確表態(tài)愿意為中國(guó)隊(duì)出場(chǎng)比賽

小犙拍客在北漂
2026-04-17 15:08:42
僅剩最后一席!奧沙利文+常冰玉分別打出2桿147分均獲14.7萬(wàn)榜

僅剩最后一席!奧沙利文+常冰玉分別打出2桿147分均獲14.7萬(wàn)榜

籃球看比賽
2026-04-17 13:03:46
新娘確實(shí)漂亮,但我更喜歡戴眼鏡那個(gè)。

新娘確實(shí)漂亮,但我更喜歡戴眼鏡那個(gè)。

動(dòng)物奇奇怪怪
2026-04-12 12:44:36
有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛(ài)雜談
2026-02-18 20:55:58
2026-04-18 01:47:00
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學(xué)新動(dòng)態(tài),聚焦認(rèn)知與神經(jīng)新研究
322文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒(méi)35.97億元

頭條要聞

特朗普:感謝伊朗開(kāi)放霍爾木茲海峽

頭條要聞

特朗普:感謝伊朗開(kāi)放霍爾木茲海峽

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂(lè)要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車要聞

又快又穩(wěn)的開(kāi)掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

藝術(shù)
本地
游戲
手機(jī)
軍事航空

藝術(shù)要聞

你絕對(duì)想不到!文森特的色粉作品竟如此驚艷!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

PS5完全獨(dú)占新作曝光!科樂(lè)美為索尼傾力打造

手機(jī)要聞

vivo萬(wàn)級(jí)電池新機(jī)曝光:10200mAh電池+90W快充,友商接得住嗎!

軍事要聞

美宣布黎以停火10天 以方稱不會(huì)撤軍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版