網易首頁 > 網易號 > 正文 申請入駐

性能超越DeepSeek-OCR2,百度發布并開源新一代SOTA OCR模型

0
分享至

1月29日,百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5。該模型以僅0.9B參數的輕量架構,在全球權威文檔解析評測榜單OmniDocBenchV1.5中取得全球綜合性能第一成績,整體精度達到94.5%,超過Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2等模型。

值得關注的是,PaddleOCR-VL-1.5全球首次實現OCR模型的“異形框定位”能力,使機器能夠精準識別傾斜、彎折、拍照畸變等非規則文檔形態,首次讓“歪文檔”實現穩定、可規模化解析。該技術解決了傳統OCR模型在移動拍照、掃描件變形、復雜光照等真實場景中因文檔形變導致的識別失敗問題,可廣泛應用于金融票據處理、檔案數字化、政務文檔流轉等場景。

PaddleOCR-VL-1.5基于文心大模型進行開發,在OmniDocBenchV1.5多個關鍵指標上取得領先表現。其中,表格結構理解(92.8分)和閱讀順序預測(95.8分)兩項核心指標上均位列第一,分別領先Gemini-3-Pro、DeepSeek-OCR等主流模型2–5分不等。在文檔閱讀順序預測任務中,其版面邏輯解析錯誤率僅為同類其他模型約一半。這表明,PaddleOCR-VL-1.5在復雜文檔結構還原與版面邏輯理解方面具備更高穩定性,在合同、財報等高復雜度業務場景中擁有更高可用性。



2025年10月16日,百度首次發布并開源PaddleOCR-VL模型,在OmniDocBenchV1.5榜單中取得全球SOTA成績,并連續五天登頂HuggingFace全球模型總趨勢榜與ModelScope全球模型總趨勢榜雙榜第一。

相比于上代,在功能層面,PaddleOCR-VL-1.5進一步集成印章識別、文本檢測與識別等任務能力,關鍵指標持續領跑;同時針對特殊場景與多語種識別進行系統優化,在生僻字、古籍文獻、多語種表格、下劃線與復選框等復雜結構識別方面顯著提升,并新增對藏語、孟加拉語等語種的支持。模型還支持跨頁表格自動合并與跨頁段落標題識別,有效解決長文檔解析中的結構斷裂問題。

近半年來,全球主流模型廠商密集布局OCR領域。1月27日,深度求索發布新一代OCR模型DeepSeek-OCR-2,引入“因果流查詢”機制,并將語言模型融入視覺編碼,在OmniDocBenchV1.5中實現91.09%精度。與此同時,MistralAI、字節跳動、騰訊等企業也相繼推出新一代OCR模型,行業競爭持續加劇。

業內分析認為,隨著大模型加速進入金融、政務、制造等高復雜度業務流程,文檔解析能力正從“能用”走向“穩定可規模化落地”。PaddleOCR-VL-1.5在精度、復雜場景適應性與工程化能力上的系統突破,有望進一步降低產業應用門檻,推動OCR技術在真實生產環境中的深度落地。

目前,PaddleOCR-VL-1.5已全面開源,開發者可通過GitHub、HuggingFace獲取,并在PaddleOCR官網進行在線體驗或通過百度智能云千帆平臺調用API接口。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
太瘆人!男子曬小區電梯圖,網友調侃豪華火化爐,評論區毛骨悚然

太瘆人!男子曬小區電梯圖,網友調侃豪華火化爐,評論區毛骨悚然

譚談社會
2026-04-23 01:58:02
今夜,直線拉升!美伊談判,重大突發

今夜,直線拉升!美伊談判,重大突發

中國基金報
2026-04-26 00:24:15
反對穆帥回皇馬被批評,古蒂:面對非議,最好方式是微笑致謝

反對穆帥回皇馬被批評,古蒂:面對非議,最好方式是微笑致謝

懂球帝
2026-04-26 07:58:08
球迷與勒布朗·詹姆斯在湖人隊的尷尬瞬間:球迷意外“撞臉”

球迷與勒布朗·詹姆斯在湖人隊的尷尬瞬間:球迷意外“撞臉”

好火子
2026-04-26 00:47:02
五五分流為什么分不下去了?背后的真相

五五分流為什么分不下去了?背后的真相

楓冷慕詩
2026-01-24 13:09:19
單身越久,死亡風險越高?中國科學家:每周2次性生活是安全線

單身越久,死亡風險越高?中國科學家:每周2次性生活是安全線

思思夜話
2026-04-23 11:30:19
浪姐史上翻車最快的人出現了,網友:人不紅果然是有原因的!

浪姐史上翻車最快的人出現了,網友:人不紅果然是有原因的!

兩只米老鼠
2026-04-14 03:27:12
伊朗巴斯基被投毒:100人中毒倒下

伊朗巴斯基被投毒:100人中毒倒下

桂系007
2026-04-25 17:29:24
小玥兒 12 歲生日,沒了馬筱梅精心策劃,連一句公開祝福都沒有

小玥兒 12 歲生日,沒了馬筱梅精心策劃,連一句公開祝福都沒有

萌姐
2026-04-24 22:15:51
美國果然中計了?毛焦爾一上臺就變了個人,匈牙利在中國尋找機遇

美國果然中計了?毛焦爾一上臺就變了個人,匈牙利在中國尋找機遇

訊崽侃天下
2026-04-26 07:38:33
彭總在哈軍工用餐時,一學員同坐,責問陳賡:他有什么資格坐這?

彭總在哈軍工用餐時,一學員同坐,責問陳賡:他有什么資格坐這?

小莜讀史
2026-04-20 15:17:58
陳羽凡現狀:50歲一身腱子肉,還在泰國演出,兒子跟著媽過的很好

陳羽凡現狀:50歲一身腱子肉,還在泰國演出,兒子跟著媽過的很好

冷紫葉
2026-04-25 14:26:16
27+10+92.2%!效率逆天!最可怕的是,他連球隊老三都算不上

27+10+92.2%!效率逆天!最可怕的是,他連球隊老三都算不上

阿浪的籃球故事
2026-04-25 16:01:55
35歲離婚,因嗜酒家財散盡,50歲中年又喪女,如今66歲騰格爾如何

35歲離婚,因嗜酒家財散盡,50歲中年又喪女,如今66歲騰格爾如何

白面書誏
2026-04-25 15:13:17
為什么仕佳光子比源杰科技更可能成為國產光芯片新霸主

為什么仕佳光子比源杰科技更可能成為國產光芯片新霸主

風風順
2026-04-26 04:05:03
尼日爾撕毀4億美元合同,驅逐中國高管,我方暗藏后手,給它狠狠教訓

尼日爾撕毀4億美元合同,驅逐中國高管,我方暗藏后手,給它狠狠教訓

詭譎怪談
2025-04-30 23:32:55
再見,曼聯!9000萬“大核”決定離隊!斥資2.4億簽下“新中軸”

再見,曼聯!9000萬“大核”決定離隊!斥資2.4億簽下“新中軸”

頭狼追球
2026-04-25 13:27:55
鏈家悄悄上線新功能,買房賣房都坐不住了

鏈家悄悄上線新功能,買房賣房都坐不住了

大川東山再起
2026-04-25 23:06:28
毛主席去世前,留下兩大謎團,一個至今無人知曉

毛主席去世前,留下兩大謎團,一個至今無人知曉

幽州校尉
2026-03-29 08:12:28
臺媒:毛里求斯表態戳破臺當局謊言

臺媒:毛里求斯表態戳破臺當局謊言

參考消息
2026-04-25 19:55:46
2026-04-26 09:40:49
產業家
產業家
產業互聯網第一媒體
1133文章數 1339關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

手機
旅游
親子
本地
公開課

手機要聞

停更一年憋大招!小米大折疊攜玄戒O3回歸,系統也是新的

旅游要聞

打卡淄博:從千年文脈到市井煙火

親子要聞

喂得她自己都咽口水了!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版