網易首頁 > 網易號 > 正文 申請入駐

性能超越DeepSeek-OCR2,百度發布并開源新一代SOTA OCR模型

0
分享至

1月29日,百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5。該模型以僅0.9B參數的輕量架構,在全球權威文檔解析評測榜單OmniDocBench V1.5中取得全球綜合性能第一成績,整體精度達到94.5,超過Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2等模型。

值得關注的是,PaddleOCR-VL-1.5 全球首次實現OCR模型的“異形框定位”能力,使機器能夠精準識別傾斜、彎折、拍照畸變等非規則文檔形態,首次讓“歪文檔”實現穩定、可規模化解析。該技術解決了傳統OCR模型在移動拍照、掃描件變形、復雜光照等真實場景中因文檔形變導致的識別失敗問題,可廣泛應用于金融票據處理、檔案數字化、政務文檔流轉等場景。

PaddleOCR-VL-1.5 基于文心大模型進行開發,在 OmniDocBench V1.5多個關鍵指標上取得領先表現。其中,表格結構理解(92.8 分)和閱讀順序預測(95.8 分)兩項核心指標上均位列第一,分別領先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文檔閱讀順序預測任務中,其版面邏輯解析錯誤率僅為同類其他模型約一半。這表明,PaddleOCR-VL-1.5 在復雜文檔結構還原與版面邏輯理解方面具備更高穩定性,在合同、財報等高復雜度業務場景中擁有更高可用性。



2025年10月16日,百度首次發布并開源 PaddleOCR-VL模型,在 OmniDocBench V1.5 榜單中取得全球SOTA成績,并連續五天登頂 HuggingFace全球模型總趨勢榜與ModelScope全球模型總趨勢榜雙榜第一。

相比于上代,在功能層面,PaddleOCR-VL-1.5 進一步集成印章識別、文本檢測與識別等任務能力,關鍵指標持續領跑;同時針對特殊場景與多語種識別進行系統優化,在生僻字、古籍文獻、多語種表格、下劃線與復選框等復雜結構識別方面顯著提升,并新增對藏語、孟加拉語等語種的支持。模型還支持跨頁表格自動合并與跨頁段落標題識別,有效解決長文檔解析中的結構斷裂問題。

近半年來,全球主流模型廠商密集布局 OCR 領域。1月27日,深度求索發布新一代 OCR 模型 DeepSeek-OCR-2,引入“因果流查詢”機制,并將語言模型融入視覺編碼,在OmniDocBench V1.5中實現91.09%精度。與此同時,Mistral AI、字節跳動、騰訊等企業也相繼推出新一代 OCR 模型,行業競爭持續加劇。

業內分析認為,隨著大模型加速進入金融、政務、制造等高復雜度業務流程,文檔解析能力正從“能用”走向“穩定可規模化落地”。PaddleOCR-VL-1.5 在精度、復雜場景適應性與工程化能力上的系統突破,有望進一步降低產業應用門檻,推動 OCR 技術在真實生產環境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面開源,開發者可通過GitHub、Hugging Face獲取,并在 PaddleOCR 官網進行在線體驗或通過百度智能云千帆平臺調用API接口。

  • 在線使用/API:https://www.paddleocr.com?
  • 開源項目地址:https://github.com/PaddlePaddle/PaddleOCR?
  • 模型下載地址:https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
歐美著名大碼模特,這是歐美最受歡迎的身材

歐美著名大碼模特,這是歐美最受歡迎的身材

TVB的四小花
2026-04-25 16:31:58
7nm芯片量產了,沒有EUV光刻機,誰在撐著這條產線?

7nm芯片量產了,沒有EUV光刻機,誰在撐著這條產線?

粵語音樂噴泉
2026-04-25 12:26:24
女子疑似在公交站臺阻止男子抽煙,用飲料將男子的煙澆滅后起沖突,律師:路人只能舉報、勸阻吸煙者

女子疑似在公交站臺阻止男子抽煙,用飲料將男子的煙澆滅后起沖突,律師:路人只能舉報、勸阻吸煙者

觀威海
2026-04-25 17:56:08
4月25日上午消息:52家發布重大利空消息,8家戴帽st,14家業績大降

4月25日上午消息:52家發布重大利空消息,8家戴帽st,14家業績大降

股市皆大事
2026-04-25 08:53:17
洗腦、性侵、亂倫,全球頭號變態復出了

洗腦、性侵、亂倫,全球頭號變態復出了

獨立魚
2026-04-23 22:35:39
再見,曼聯!9000萬“大核”決定離隊!斥資2.4億簽下“新中軸”

再見,曼聯!9000萬“大核”決定離隊!斥資2.4億簽下“新中軸”

頭狼追球
2026-04-25 13:27:55
巴基斯坦總理與伊朗外長舉行會談

巴基斯坦總理與伊朗外長舉行會談

新華社
2026-04-25 19:21:34
羅馬諾爆料:曼聯5000萬鎖定中場新核,隱藏協議曝光,只差3條件

羅馬諾爆料:曼聯5000萬鎖定中場新核,隱藏協議曝光,只差3條件

體壇鑒春秋
2026-04-25 18:11:36
寒武紀Day 0適配DeepSeek V4意味著什么

寒武紀Day 0適配DeepSeek V4意味著什么

經濟觀察報
2026-04-24 20:58:03
市盈率5倍,每股凈資產20,股價6.8,兩只下跌11年的中字頭!

市盈率5倍,每股凈資產20,股價6.8,兩只下跌11年的中字頭!

八斗小先生
2026-04-25 16:23:10
北控出局賽后,京媒罕見點名批評1人,京迷喊話:集體給張帆道歉

北控出局賽后,京媒罕見點名批評1人,京迷喊話:集體給張帆道歉

后仰大風車
2026-04-25 07:10:13
妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

千秋文化
2026-03-25 21:49:57
機關事業單位人員大清理,這 5 類人員將被清退

機關事業單位人員大清理,這 5 類人員將被清退

細說職場
2026-04-25 13:38:47
爆大瓜!霍姆格倫公開戀情,對象竟是英超利物浦悍將前女友!

爆大瓜!霍姆格倫公開戀情,對象竟是英超利物浦悍將前女友!

聽我說球
2026-04-25 10:58:14
2026年5月起!若不出意外,中國房價、樓市可能迎來“四大轉變”

2026年5月起!若不出意外,中國房價、樓市可能迎來“四大轉變”

云鵬敘事
2026-04-23 20:32:38
抑郁癥有望得到突破性治療!這種藥物的起效和持續情況提升了10多倍

抑郁癥有望得到突破性治療!這種藥物的起效和持續情況提升了10多倍

三言四拍
2026-04-25 18:35:36
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
八十歲后,老人能活到以下狀態,就是人生贏家,便是圓滿!

八十歲后,老人能活到以下狀態,就是人生贏家,便是圓滿!

小談食刻美食
2026-04-22 07:33:20
3萬人堵門三星工廠!員工要求瓜分AI暴利:人均獎金40萬美元,否則5月停工18天

3萬人堵門三星工廠!員工要求瓜分AI暴利:人均獎金40萬美元,否則5月停工18天

CSDN
2026-04-24 18:44:38
28歲華裔天才成百億富豪,建議美國封鎖中國AI技術,網友:太壞了

28歲華裔天才成百億富豪,建議美國封鎖中國AI技術,網友:太壞了

毒sir財經
2026-04-05 21:07:06
2026-04-25 19:55:00
貝克街探案官 incentive-icons
貝克街探案官
洞察科技和商業領域的一切秘密
326文章數 851關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

現場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

頭條要聞

現場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

藝術
旅游
數碼
公開課
軍事航空

藝術要聞

安德烈·皮安科夫斯基:當代俄羅斯畫家

旅游要聞

去馬登鄉尋找杜鵑花海,結果誤打誤撞,領略了數千畝蘋果花的風韻

數碼要聞

雷達感應自動開關燈,Yeelight新品來了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美防長:戰事不會“沒完沒了”

無障礙瀏覽 進入關懷版