无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<source id="smlqo"></source>

<small id="smlqo"><tbody id="smlqo"><noframes id="smlqo"></noframes></tbody></small><source id="smlqo"></source><noscript id="smlqo"></noscript>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

瑞典國家圖書館造了個瑞典語BERT

2026-05-23 03:03:12　來源: 全棧遛狗員

北京舉報

0

分享至

2019年，當英語世界的BERT模型刷屏時，瑞典語在互聯(lián)網(wǎng)上幾乎隱形。一位研究者決定動手解決這個問題——用國家圖書館300年的文本檔案，從零訓練一個瑞典語版本。

最大的障礙不是算力，而是數(shù)據(jù)。瑞典語網(wǎng)頁內容稀少，且充斥著機器翻譯的劣質文本。研究團隊轉向圖書館的數(shù)字化檔案：報紙、書籍、政府文件，時間跨度從18世紀到現(xiàn)代。這些材料從未被用于訓練AI模型。

處理過程充滿妥協(xié)。古瑞典語的拼寫和語法與現(xiàn)代差異巨大，研究者不得不在"保留歷史語言特征"和"讓模型學會現(xiàn)代用法"之間取舍。最終方案是混合訓練：70%現(xiàn)代文本，30%歷史檔案。

模型發(fā)布后，一個意外出現(xiàn)了。圖書館員開始用它做 OCR 糾錯——識別掃描古籍中的識別錯誤。這是設計時沒考慮的場景，但恰好利用了模型對歷史語言的"記憶"。

這個項目的真正價值或許不在技術本身。它證明了一件事：小語種不必永遠依賴英語模型的機器翻譯，本地機構完全可以用自己的文化資產(chǎn)，造出可用的工具。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

俄英戰(zhàn)機"空中拼刺刀" 英稱蘇27六次橫切6米"貼臉"攔截

環(huán)球網(wǎng)資訊 2026-05-22 13:12:47
9661 跟貼 9661
有毒，千萬別摘！南京街頭已出現(xiàn)

環(huán)球網(wǎng)資訊 2026-05-22 14:47:11
126 跟貼 126

行車記錄儀時速不到60km，監(jiān)控抓拍時速卻達121km，廂貨車司機叫屈；交警：記錄儀不具備法定測速資質

大風新聞 2026-05-22 17:59:04
2203 跟貼 2203

中國迎來“天命時刻”！沈逸：成為全球戰(zhàn)略穩(wěn)定與發(fā)展的核心動力

海峽導報社 2026-05-22 17:22:28
82 跟貼 82
河南一景區(qū)現(xiàn)“爬不動了吧哈哈哈哈”標語，游客感覺不被尊重，景區(qū)：已撤除，本意是緩解爬山壓力

極目新聞 2026-05-19 14:48:26
8307 跟貼 8307

無錫一公園用墓碑鋪路，刻有“先父”“賢妻”字樣，游客直呼難以接受，公園回應

瀟湘晨報 2026-05-22 16:07:14
466 跟貼 466

第十六屆“春蘭杯”開幕，柯潔時隔16個月重返國際賽場

新京報 2026-05-22 20:58:40
96 跟貼 96
法國政府宣布新增7.1億歐元援助

每日經(jīng)濟新聞 2026-05-22 08:21:36
1944 跟貼 1944

撥打12345不再限于政務服務！江蘇這部條例6月1日起施行

現(xiàn)代快報 2026-05-22 20:21:22
55 跟貼 55
詹姆斯：馬刺的運氣好到離譜從上將到鄧肯再到現(xiàn)在的文班亞馬

北青網(wǎng)-北京青年報 2026-05-22 10:50:09
170 跟貼 170
放假通知！上海中小學2026年暑假時間在這天！

上觀新聞 2026-05-22 21:51:17
5 跟貼 5
水蜜桃飲品中水蜜桃添加量0.01克，康師傅回應稱符合標準

南方都市報 2026-05-21 19:55:57
1179 跟貼 1179
“張雪機車”車手德比斯直播首秀，張雪現(xiàn)身當“榜一大哥”并表示：“掏空家底了，老德今天夠給你面子了吧”

封面新聞 2026-05-22 10:34:44
1833 跟貼 1833
蘇超球員入選國家隊！苗潤東、宋恒達、張桐瑞入選U19國足集訓名單

現(xiàn)代快報 2026-05-22 20:21:27
84 跟貼 84
榮耀回應IPO問題：上市沒有終止開放員工減持通道

界面新聞 2026-05-22 20:41:21
82 跟貼 82
C羅梅開二度，首奪沙特聯(lián)賽冠軍，職業(yè)生涯已斬獲37冠

大象新聞 2026-05-22 08:46:04
472 跟貼 472
山姆會員費成自助餐費？貨架現(xiàn)骨頭殘渣和空瓶，在華67家店被呼吁約束“薅羊毛”

界面新聞 2026-05-22 13:50:31
1 跟貼 1
瑞幸咖啡酒精特調上架初中生輕松買到

界面新聞 2026-05-19 22:04:05
361 跟貼 361
小區(qū)入戶門私自改向！鄰里十幾年和睦，一朝整改鬧矛盾

物業(yè)管理的那些事 2026-05-23 07:47:08
0 跟貼 0
嶗山景區(qū)云霧繚繞

半島官網(wǎng) 2026-05-20 09:29:18
0 跟貼 0
60歲阿姨在蘋果手機下載“指南針”后馬上卸載，半年被扣1608元

大象新聞 2026-05-23 07:54:22
0 跟貼 0
男子龍斗峰徒步失聯(lián)！有人勸下山，遭當場拒絕，網(wǎng)友：不值得同情

青橘罐頭 2026-05-23 07:39:16
0 跟貼 0

炸了！周也戀情曝光，對象身份不簡單

炸了！周也戀情曝光，對象身份不簡單

黎兜兜

2026-05-22 12:29:13

請5萬員工帶薪玩迪士尼，預計花費八千萬！老板豪氣回應：公司掙了錢就是要跟員工一起花

請5萬員工帶薪玩迪士尼，預計花費八千萬！老板豪氣回應：公司掙了錢就是要跟員工一起花

新浪財經(jīng)

2026-05-22 21:20:17

半夜轉雨明顯降水在下周一前后！

半夜轉雨明顯降水在下周一前后！

上海預警發(fā)布

2026-05-22 17:21:52

“午晚餐都被中企吃掉”，德國工業(yè)巨頭崩潰：歐洲快成中國一省了

“午晚餐都被中企吃掉”，德國工業(yè)巨頭崩潰：歐洲快成中國一省了

潮鹿逐夢

2026-05-22 18:17:08

女子網(wǎng)購4300元iPad，到貨發(fā)現(xiàn)外殼寫著“Aqqle”，商家回應：官方標配版，包裝盒是后配的

女子網(wǎng)購4300元iPad，到貨發(fā)現(xiàn)外殼寫著“Aqqle”，商家回應：官方標配版，包裝盒是后配的

深圳晚報

2026-05-22 23:04:41

北京輸球后疑似內訌？許利民已被架空了：李楠越權指揮球員都懵了

北京輸球后疑似內訌？許利民已被架空了：李楠越權指揮球員都懵了

籃球快餐車

2026-05-23 02:25:59

周琦斗志遭質疑：最后兩場僅7分與6分下半場0分提前下場認輸

周琦斗志遭質疑：最后兩場僅7分與6分下半場0分提前下場認輸

醉臥浮生

2026-05-22 21:40:17

四川一國企退休職工幫同事維權與董事長爭執(zhí)后猝死，董事長建議去起訴

四川一國企退休職工幫同事維權與董事長爭執(zhí)后猝死，董事長建議去起訴

澎湃新聞

2026-05-22 14:58:28

30萬臨時工被清退，執(zhí)法遮羞布徹底撕下

30萬臨時工被清退，執(zhí)法遮羞布徹底撕下

匹夫來搞笑

2026-05-22 14:51:39

奔馳碾貓男已社死！賬號被扒官方出手，“鐵飯碗”也要保不住了

奔馳碾貓男已社死！賬號被扒官方出手，“鐵飯碗”也要保不住了

青梅侃史啊

2026-05-22 19:22:59

教育部：擬設34所本科高等學校

教育部：擬設34所本科高等學校

界面新聞

2026-05-22 21:01:51

大瓜！一互聯(lián)網(wǎng)大廠曝出地下車庫出軌，涉事女子丈夫凌晨大群舉報

大瓜！一互聯(lián)網(wǎng)大廠曝出地下車庫出軌，涉事女子丈夫凌晨大群舉報

火山詩話

2026-05-22 11:34:53

《歌手2026》首播全是驚喜！齊豫第一實至名歸，庾澄慶意外被淘汰

《歌手2026》首播全是驚喜！齊豫第一實至名歸，庾澄慶意外被淘汰

水中燒烤的娛

2026-05-22 23:08:35

美俄剛走，荷蘭就“憋不住”，光刻機巨頭，公開給中國遞了句軟話

美俄剛走，荷蘭就“憋不住”，光刻機巨頭，公開給中國遞了句軟話

清沐執(zhí)筆

2026-05-22 16:14:17

山姆會員費成自助餐費？貨架現(xiàn)骨頭殘渣和空瓶，在華67家店被呼吁約束“薅羊毛”

山姆會員費成自助餐費？貨架現(xiàn)骨頭殘渣和空瓶，在華67家店被呼吁約束“薅羊毛”

界面新聞

2026-05-22 13:50:31

一口氣簽完！中俄這次不繞彎子了，兩塊寶地拿到手，徹底告別困局

一口氣簽完！中俄這次不繞彎子了，兩塊寶地拿到手，徹底告別困局

素衣讀史

2026-05-22 21:19:27

又變臉？特朗普做出涉臺最新表態(tài)，中方直接叫停美副防長訪華

又變臉？特朗普做出涉臺最新表態(tài)，中方直接叫停美副防長訪華

縱擁千千晚星

2026-05-22 04:09:01

天生一張娃娃臉都已經(jīng)46了，你敢想？

天生一張娃娃臉都已經(jīng)46了，你敢想？

起喜電影

2026-05-21 05:50:49

諷刺！出局賽后陳盈駿悲傷到暈厥，周琦陷入自閉，趙睿卻笑開了花

諷刺！出局賽后陳盈駿悲傷到暈厥，周琦陷入自閉，趙睿卻笑開了花

后仰大風車

2026-05-23 07:10:10

悲哀！10人小群里剩自己“干凈”，30歲女生稱身體忠于丈夫被孤立

悲哀！10人小群里剩自己“干凈”，30歲女生稱身體忠于丈夫被孤立

番外行

2026-05-20 08:19:19

全棧遛狗員

白天跟需求對線，晚上在小區(qū)遛狗。

3584文章數(shù) 67關注度

往期回顧全部

教育要聞

從“俯視”到“平視”：淺談“蹲下來”的教育學

頭條要聞

76歲馬英九親筆信：外界謠傳我失智聽了覺得可笑

頭條要聞

76歲馬英九親筆信：外界謠傳我失智聽了覺得可笑

體育要聞

最糟糕裁判？他想要退役當市長

娛樂要聞

周也戀情曝光！對象身份不簡單

財經(jīng)要聞

富途擬被罰18.5億元老虎長橋也回應了

科技要聞

雷軍：輸給特斯拉不丟人

汽車要聞

11萬級直接上四驅銀河星耀7限時權益價9.88萬起

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

手機

親子

房產(chǎn)

數(shù)碼

外泌體 ≠ 生長因子！它們之間究竟有何區(qū)別？

手機要聞

榮耀首款磁吸副屏功能揭秘：15米實時預覽拍照續(xù)航可連拍5小時

親子要聞

雙兒夫婦糖糖天天惦記她阿公，今天終于可以接他出院回家休養(yǎng)了

房產(chǎn)要聞

瘋搶511輪！今年海南最魔幻的地塊，被福建能源企業(yè)搶了！

數(shù)碼要聞

OPPO Enco Air5s耳機規(guī)格公布，5月25日發(fā)布

© 1997-2026 網(wǎng)易公司版權所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<td id="fudgr"></td>