亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中科院軟件所開源首個本地通用幻燈片智能體,9B參數(shù)打平GPT-5

0
分享至



天下苦 PPT 久矣。

體驗過市面上各種 AI 生成 PPT 工具的人,往往都會遇到同樣的痛點:排版崩壞、內容空洞、經(jīng)不起推敲。 為什么會這樣?因為目前的通用大語言模型(LLM)寫 PPT,本質上是在對話框里 “盲寫” 代碼或文本。它們既沒有真正的 “手” 去查閱權威文獻,也沒有真正的 “眼睛” 去審視自己排版出來的最終效果。

近日,中國科學院軟件研究所中文信息處理實驗室開源了第二代 PPTAgent --DeepPresenter。這是業(yè)界首次將幻燈片智能體模型與完整的智能體沙箱環(huán)境一同開源,更能支持在單張 3090/MAC 上一鍵部署。它徹底重構了 AI 制作 PPT 的邏輯,讓智能體不僅能 “深度探索”,還能 “親眼所見”。



  • GitHub 鏈接: https://github.com/icip-cas/PPTAgent
  • HuggingFace鏈接: https://huggingface.co/collections/ICIP/deeppresenter
  • 論文鏈接: https://arxiv.org/abs/2602.22839

核心破局點:給智能體裝上 “眼睛” 與 “手”

DeepPresenter 放棄了傳統(tǒng)的 “語言模型直接生成” 路徑,而是將智能體置入了一個全功能的 Docker 沙箱環(huán)境(Shared Agent Environment)中,直接切中目前 AI 辦公的兩大痛點:

痛點一:內容全是 “車轱轆話” 和幻覺?

解決:構建強大的智能體環(huán)境,賦予其研究和閱讀的 “手”。

在 DeepPresenter 中,智能體手握 20+ 種專業(yè)工具。它不僅能通過 MinerU 深度解析復雜的 PDF 文獻,還能實時連接 arXiv 和 Google Scholar 進行有據(jù)可查的深度調研(DeepResearch),甚至可以直接運行 Python 代碼來繪制數(shù)據(jù)圖表,確保 PPT 內容的專業(yè)度與數(shù)據(jù)準確性。



痛點二:排版錯亂、文字擋圖?

解決:環(huán)境感知反思機制(Environment-Grounded Reflection),給它加上 “眼睛”。

以往的模型不知道自己生成的排版長什么樣。而 DeepPresenter 形成了一套 “寫→看→改” 的視覺閉環(huán)。Presenter 智能體每寫完一頁代碼,都會調用沙箱內的瀏覽器將其渲染成真實圖片,然后 “親眼” 檢查這張截圖。標題被擋住了?對比度不夠?它會像人類設計師一樣立即進行自適應調整并回爐重造,直到視覺效果完美。



案例演示

只需一行極其簡單的指令,即可體驗這種全新的 Agentic 工作流:

接收指令后,DeepPresenter 會立即啟動:Researcher在自動檢索相關的相關資料和高清圖片;隨后交棒給Presenter,根據(jù)呈現(xiàn)主題設計相稱的風格,最終輸出一份內容扎實、樣式精美的幻燈片。



幫我做一個小米 SU7 的 PPT



制作一份4:3幻燈片,以美國自由漫畫師視角分享創(chuàng)作《超級戰(zhàn)隊》與《假面騎士》同人作品的實用技巧,涵蓋理解原作、發(fā)展風格、捕捉角色、編寫故事及建立粉絲社群



幫我做一份關于羅賓漢(Robin Hood)的介紹 PPT,包含歷史背景、傳奇故事和文化影響。

更重要的是,所有生成內容均為 .pptx 可編輯格式,支持自由修改與二次創(chuàng)作,徹底擺脫類似 nanobanana 那樣 “生成后無法編輯” 的困擾,讓 PPT 創(chuàng)作真正可控、高效、靈活。



核心技術:如何煉成 “最強 PPT 智能體”?

DeepPresenter 之所以能以 9B 參數(shù)實現(xiàn) “下克上”,核心在于其創(chuàng)新的訓練流水線(Pipeline):



1.數(shù)據(jù)構建:團隊基于 PersonaHub 與 arXiv 等多源數(shù)據(jù)集構建了高多樣性的任務數(shù)據(jù)。通過在指令中顯式定義頁數(shù)限制、長寬比及語言策略等細粒度約束條件,確保模型在訓練階段即建立了對復雜用戶意圖的深度語義表征。

2.外在驗證引導:為了打破智能體 “自我感覺良好” 的驗證偏差(Self-verification Bias),團隊引入了獨立評審機制。在訓練數(shù)據(jù)合成階段,由獨立模型作為 “獨立評估者” 指出生成產(chǎn)物中的排版或邏輯缺陷,引導智能體產(chǎn)生高質量的執(zhí)行軌跡

3.多級軌跡過濾:團隊從 1,152 個任務中篩選出 802 條頂級質量的智能體軌跡進行 SFT 訓練。這些軌跡涵蓋了中英雙語、多種寬高比及復雜的指令約束。

性能實測:消費級顯卡下的極限表現(xiàn)

為了全面驗證 DeepPresenter 的實際效果,作者在預留的 128 個任務上使用 PPTEval 進行了系統(tǒng)評測,并與三種主流幻燈片生成方案進行了對比。



在此基礎上,作者進一步分析了不同模型設置下的成本 — 性能表現(xiàn),從 “效果” 和 “成本” 兩個維度進行綜合評估。



結果表明:DeepPresenter-9B 取得了 4.19 的高分,表現(xiàn)與閉源模型 GPT-5(4.22)幾乎持平,并且 DeepPresenter 顯著優(yōu)于其他的幻燈片生成方案。

更值得關注的是,在成本 — 性能曲線中,DeepPresenter-9B 位于前沿的 “突變點” 位置,意味著在性能與價格之間達到了極具競爭力的平衡。

換句話說,它用GPT-5 幾十分之一的算力成本,實現(xiàn)了同等級別的智能表現(xiàn)。這也意味著 —— 在消費級顯卡上,我們就能夠運行一個媲美頂級閉源模型的 PPT 智能體。

目前,DeepPresenter 項目已完全開源,歡迎開發(fā)者共同構建 Presentation Agent 的未來。

作者介紹:

本開源項目以及論文作者均來自中國科學院軟件研究所中文信息處理實驗室孫樂研究員、韓先培研究員團隊,主要作者包括鄭昊、莫國釗、陳軒昂、陸垚杰及林鴻宇。實驗室的主要研究領域包括大模型和大模型驅動智能體的知識機制、知識能力增強及應用。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
4月20日人民幣對美元中間價調貶26個基點

4月20日人民幣對美元中間價調貶26個基點

證券時報
2026-04-20 09:33:02
趕回家見病危兒子最后一面 62歲大叔在火車上泣不成聲! 同車男子買來盒飯默默安慰

趕回家見病危兒子最后一面 62歲大叔在火車上泣不成聲! 同車男子買來盒飯默默安慰

閃電新聞
2026-04-20 13:11:13
恒大暴雷之前,許家印為什么沒有跑?

恒大暴雷之前,許家印為什么沒有跑?

擔撲
2026-04-19 13:40:25
恩德里克:我一直對曼聯(lián)很有好感,因為C羅曾在那里踢球

恩德里克:我一直對曼聯(lián)很有好感,因為C羅曾在那里踢球

懂球帝
2026-04-20 11:31:03
舒淇不再隱瞞!多年無子的她終于承認:我們不是丁克,是生不出來

舒淇不再隱瞞!多年無子的她終于承認:我們不是丁克,是生不出來

長歌侃娛
2026-04-19 09:54:43
瓜迪奧拉:我要哭了!哈蘭德:他TM就是卡納瓦羅!

瓜迪奧拉:我要哭了!哈蘭德:他TM就是卡納瓦羅!

硯底沉香
2026-04-20 09:03:22
你做初一,我做十五!日艦過航臺海三天后,052D沖向橫當水道

你做初一,我做十五!日艦過航臺海三天后,052D沖向橫當水道

烈史
2026-04-20 12:04:36
貴州一地突降冰雹最厚處30厘米,當?shù)厥褂苗P車清理,部分農(nóng)作物受損,鄉(xiāng)政府:正統(tǒng)計受災情況

貴州一地突降冰雹最厚處30厘米,當?shù)厥褂苗P車清理,部分農(nóng)作物受損,鄉(xiāng)政府:正統(tǒng)計受災情況

極目新聞
2026-04-20 11:15:09
CBA最新消息!上海男籃大將常規(guī)賽報銷,北京首鋼簽約頂級后衛(wèi)

CBA最新消息!上海男籃大將常規(guī)賽報銷,北京首鋼簽約頂級后衛(wèi)

金風說
2026-04-20 13:19:23
重磅!美媒稱哈登就是NBA從未奪冠的最偉大球員,沒有之一

重磅!美媒稱哈登就是NBA從未奪冠的最偉大球員,沒有之一

銜春信
2026-04-20 08:04:19
悲劇!廣東96年女生開會時心梗猝死 為2萬月薪半年熬夜硬扛

悲劇!廣東96年女生開會時心梗猝死 為2萬月薪半年熬夜硬扛

老貓觀點
2026-04-20 06:01:26
比失業(yè)更可怕的是工資倒退,深圳的工資已經(jīng)降到了10年前

比失業(yè)更可怕的是工資倒退,深圳的工資已經(jīng)降到了10年前

細說職場
2026-04-07 11:32:47
碾壓珠穆朗瑪峰!火星上的山為何能長到2萬米?重力不是唯一原因

碾壓珠穆朗瑪峰!火星上的山為何能長到2萬米?重力不是唯一原因

半解智士
2026-04-18 18:44:07
丈夫駐邊20年不回家,我?guī)е⒆忧Ю锾接H,部隊:他壓根沒入伍

丈夫駐邊20年不回家,我?guī)е⒆忧Ю锾接H,部隊:他壓根沒入伍

紅豆講堂
2025-10-14 16:22:44
穆里尼奧神換人:替補神兵補時絕殺,30輪不敗,升到聯(lián)賽第2名

穆里尼奧神換人:替補神兵補時絕殺,30輪不敗,升到聯(lián)賽第2名

足球狗說
2026-04-20 07:28:31
央視離職者傳十年換五任妻子,私生活現(xiàn)狀引關注

央視離職者傳十年換五任妻子,私生活現(xiàn)狀引關注

暖心萌阿菇?jīng)?/span>
2026-04-19 13:19:26
57歲歌手陳紅近況曝光!離婚后被前夫拿走12億,兒子成為她的驕傲

57歲歌手陳紅近況曝光!離婚后被前夫拿走12億,兒子成為她的驕傲

代軍哥哥談娛樂
2026-04-18 09:57:07
特朗普下令開火攔船:美軍擊穿伊朗貨船機艙,直接登船接管

特朗普下令開火攔船:美軍擊穿伊朗貨船機艙,直接登船接管

桂系007
2026-04-20 05:10:26
路易十六哀歌:善良是大革命的最大原罪

路易十六哀歌:善良是大革命的最大原罪

朝廷心腹
2026-04-16 14:20:31
不再為美兜底!中國拒絕美8500億債務,救美國就是救中國時代落幕

不再為美兜底!中國拒絕美8500億債務,救美國就是救中國時代落幕

阿器談史
2026-04-18 11:27:57
2026-04-20 14:35:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12809文章數(shù) 142632關注度
往期回顧 全部

科技要聞

藍色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

媒體:伊朗剛說不談 美國立即開打

頭條要聞

媒體:伊朗剛說不談 美國立即開打

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

鹿晗生日上熱搜,被關曉彤撕下體面

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

家居
教育
手機
本地
軍事航空

家居要聞

自然慢調 慢享時光

教育要聞

都說慣子如殺子,這3種隱形溺愛,希望你一件都沒做過……

手機要聞

蘋果iOS 27曝光:主屏幕編輯菜單新增“撤銷”與“重做”按鈕

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關懷版