无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

ollama v0.17.6 發布:重大解析修復與 Qwen3.5 完整支持,全鏈路優化模型渲染與工具調用

0
分享至




2026 年 3 月 5 日,Ollama 正式發布了v0.17.6版本。這是一次極具實用價值的改進版本,在保持系統穩定的基礎上,重點修復了多個長期存在的細節性問題,包括GLM-OCR 的 Prompt 渲染錯誤Qwen 3.5 工具調用與解析邏輯, 并帶來了對模型渲染、工具鏈、配置兼容性等方面的進一步完善。

本篇文章將全面解析 v0.17.6 的變更列表、核心代碼結構調整、測試覆蓋改進及潛在影響,幫助開發者清晰理解此次升級的深度與意義。

一、版本概覽

發布日期:2026 年 3 月 5 日
版本號:v0.17.6
更新重點:

  1. 1. 修復GLM-OCR模型因 prompt 渲染錯誤導致無法工作的問題

  2. 2. 修復Qwen 3.5模型工具調用的解析與渲染問題

  3. 3. 優化模型配置文件命名兼容,例如Ollama (local)自動遷移為Ollama

  4. 4. 移除舊版本imagegenLLM 模型與peak memoryAPI 字段

  5. 5. 引入全新的 Qwen3.5 渲染及解析模塊,全面支持thinking模式

此次更新共包含12 次提交、修改51 個文件,由 7 名開發人員完成。從 diff 記錄看,涉及到新增代碼超過 3900 行,同時刪除舊邏輯 4010 行,可見是一次覆蓋范圍較大的“重構 + 修復”整合版本。

二、總體改動組成 1. API 層變化:移除PeakMemory字段

api/types.go文件中刪除了Metrics結構體中的PeakMemory相關字段與輸出邏輯。
其原始功能用于在模型推理時統計峰值內存占用,但由于mlx(Memory Layout Executor)層的 API 已移除此項指標,因此不再返回該值。

舊結構:

type Metrics struct {
TotalDuration time.Duration `json:"total_duration,omitempty"`
PeakMemory uint64 `json:"peak_memory,omitempty"`
}

刪除后:

type Metrics struct {
TotalDuration time.Duration `json:"total_duration,omitempty"`
}

同時刪除了相關的格式化函數formatPeakMemory、控制臺輸出內容,更新后的日志輸出更加簡潔,避免“空指標”誤導用戶。

這也意味著未來 Ollama 將更聚焦性能時間維度指標,而非硬件狀態統計。

2. 命令行層更新:移除imagegen運行參數

cmd/cmd.go文件中刪除了--imagegen標志相關邏輯,不再通過 CLI 參數控制圖像生成模型使用內部 Runner。

這體現了 v0.17.6 開始逐步統一模型調用接口,將生成型與多模態模型整合至統一 runner 體系中,從設計上簡化用戶調用路徑。

3. 配置遷移優化:Ollama (local) → Ollama

在配置管理模塊cmd/config/opencode.go中新增了名稱遷移邏輯,解決了配置兼容問題。
許多開發者此前使用本地 provider 時,其配置如下:

{
"provider":{
"ollama":{
"name":"Ollama (local)",
"npm":"@ai-sdk/openai-compatible",
"options":{"baseURL":"http://localhost:11434/v1"}
}
}
}

新版本中,當檢測到Ollama (local)名稱時會自動遷移為Ollama,保證現有配置無需手動修改即可被識別。

同時,新單元測試驗證邏輯如下:

  • ? 自動遷移本地 provider 名稱。

  • ? 保留自定義 provider 名稱(即不會覆蓋非默認配置)。

  • ? 刪除模型時保留非 Ollama 模型的子項。

這確保了升級后配置文件兼容性 100%,不會破壞舊有項目結構。

三、模型解析層全面升級:Qwen 3.5 Parser

v0.17.6 最為關鍵的更新在于模型解析器部分。
新增文件model/parsers/qwen35.go(238 行新增)正式引入了Qwen3.5 專屬解析器 Qwen35Parser,取代原有的通用Qwen3Parser

(1) 核心特性

  • ? 完整支持thinking推理標簽 ...

  • ? 增強對分塊流式輸出的識別能力(跨 token stream 漸進渲染)

  • ? 可區分思考內容(thinking content)與輸出內容(response content)

  • ? 在思考區間不解析 ,避免錯把 reasoning 內部結構誤識別為工具調用

(2) 狀態機設計

新增狀態:

const (
qwen35ParserStateCollectingThinking
qwen35ParserStateThinkingDoneEatingWhitespace
qwen35ParserStateCollectingContent
)

解析邏輯以有限狀態機(FSM)形式實現。當遇到 起始標簽進入思考模式,遇到切換到內容模式。
與此同時,對流式數據的分段處理更加精準,支持不完整的關閉標簽(如+nk>分兩次到達),確保輸出不會斷裂。

(3) 異常情況處理

  • ? 若 未關閉,自動將后續內容視為思考過程輸出;

  • ? 若 Assistant 消息為續寫(帶 prefill),默認跳過起始思考階段;

  • ? 處理 嵌套、空格、換行符自動剔除,輸出純凈的 reasoning 文本。

(4) 測試覆蓋 (model/parsers/qwen35_test.go)

測試文件新增382 行,覆蓋以下場景:

  • ? 工具調用 XML 格式識別;

  • ? 含顯式 標簽的 reasoning 內容提取;

  • ? Assistant 預填充(prefill)場景;

  • ? 思考階段中誤判工具調用;

  • ? 標簽被分片情況;

  • ? 未閉合標簽情況下的安全輸出。

這些測試使 Qwen 3.5 解析流程從多線程推理到斷流恢復都具備強魯棒性。

四、模型渲染層優化:全面更新 Qwen3.5 與 GLM-OCR Renderer

渲染器層:model/renderers/目錄新增了兩大核心組件:

1.Qwen35Renderer

文件model/renderers/qwen35.go,新增 389 行。
該渲染器對應 Qwen3.5 模型 prompt 生成邏輯,旨在讓模型完全遵循 XML 函數調用格式與 思考框架。

功能亮點:

  • ? 支持 指令區塊嵌入,格式嚴格遵循模型需求;

  • ? 自動拼接系統提示與函數聲明;

  • ? 支持生成 塊,帶

  • ? 邏輯層支持多工具順序調用,多次 塊組裝;

  • ? 思考與輸出完美分離,緊密銜接模型訓練格式。

渲染示例結構:

<|im_start|>assistant

I need to fetch the data first.

Here is my analysis.



42

<|im_end|>
其他改進:
  • ? 支持useImgTags圖片標記嵌入([img-0], [img-1]),兼容多模態;

  • ? 提供emitEmptyThinkOnNoThink參數,用于未啟用思考模式時補充空 模塊;

  • ? 對工具多次調用場景支持批量寫入;

  • ? 對assistant prefill保留最后階段輸出,不關閉<|im_start|>塊。

測試文件model/renderers/qwen35_test.go共新增 389 行,涵蓋:

  • ? 多輪對話、函數調用遞歸;

  • ? Back-to-back 工具響應;

  • ? 思考與工具交錯場景;

  • ? Assistant 預填充完整性校驗。

該模塊的引入使得 Ollama 在多模型推理框架下更貼合阿里 Qwen3.5 推理接口的真實結構。

2.GLM-OCR Renderer 大幅修復

文件model/renderers/glmocr.go修改 99 行。
這次修復針對核心問題:GLM-OCR 模型無法正確渲染帶圖像的 prompt

更新要點:

  • ? 新增GlmOcrRenderer結構體屬性useImgTags

  • ? 引入內部函數renderContent(),根據配置動態選擇是否添加[img-x]標記;

  • ? 改善 ImageOffset(圖片計數偏移)管理;

  • ? 用戶消息按[img-0][img-1]順序標識多圖輸入;

  • ? 流程中修正原先message.Content與圖片塊拼接順序。

渲染前后差異:

舊版輸出(無法識別圖片位):

<|user|>請識別圖片內容。

新版輸出(帶多圖標記):

<|user|>
[img-0][img-1]請識別圖片內容。

同時新增glmocr_test.go文件(99 行),驗證包括以下 5 種情況:

  1. 1. 單張圖片;

  2. 2. 多張圖片;

  3. 3. 多輪對話圖像偏移;

  4. 4. 默認模式不添加圖像標簽;

  5. 5. 無圖像場景內容保持一致。

這意味著以后 GLM-OCR 模型將可以在多圖輸入下穩定進行 OCR 推理,輸出定位將完整無誤。

3. 渲染器選擇邏輯更新

model/renderers/renderer.go中更新了模型映射:

case "qwen3.5":
renderer := &Qwen35Renderer{isThinking: true, emitEmptyThinkOnNoThink: true, useImgTags: RenderImgTags}
case "glm-ocr":
return &GlmOcrRenderer{useImgTags: RenderImgTags}

即:

  • ? 將原來的Qwen3VLRenderer替換為新的Qwen35Renderer

  • ? 為GLM-OCR渲染器開啟全局圖片標簽選項。

這使兩個模型在渲染階段均獲得一致的上下文構造與多模態支持。

五、服務器邏輯補充更新

server.go中,刪除了CompletionResponse返回體的PeakMemory字段,使 API 輸出與 Metrics 同步調整。
這確保了傳輸數據更輕量化、字段結構一致。

六、測試體系增強

此次更新新增測試覆蓋超過 1000 行,主要針對以下方向:

  • ?配置遷移測試
    確保舊配置自動升級為標準名稱;

  • ?GLM-OCR 多圖輸入測試
    確認每張圖片得到正確索引;

  • ?Qwen3.5 渲染與解析系統測試
    模擬思考場景、函數嵌套、流式數據拼接;

  • ?工具調用與 reasoning 多階段測試
    驗證多工具連續調用的 XML 結構合法性;

  • ?Streaming 行為測試
    分塊輸入下保持狀態一致性。

針對復雜推理模型,如 Qwen3.5 這種包含 的混合流式結構,此輪測試確保無論在并發推理還是斷流恢復場景下都不丟失內容。

七、移除舊模型與無效依賴

本次更新清理了歷史遺留的imagegen LLM模型,以及云模型拉取過程中的存根要求,進一步簡化了部署過程。
Revert提交中體現了多次回滾與重放操作,表明研發團隊對云端模型加載機制進行深度優化與驗證。

八、總結與展望

Ollama v0.17.6 是一次結構性的重要版本更新。它沒有去追求新增功能,而是聚焦于底層穩定性、模型兼容與推理一致性的打磨,體現出平臺從實驗型向工業化過渡的信號。

核心收益總結:

  1. 1.GLM-OCR修復后,OCR 模型可穩定處理多圖輸入。

  2. 2.Qwen3.5渲染與解析系統配套上線,支持完整 思考標簽鏈路。

  3. 3.配置文件自動遷移,升級成本為零。

  4. 4.API 數據結構簡化,輸出更清晰、兼容性更高。

  5. 5.測試覆蓋度大幅提升,確保行為穩定與準確。

通過對 v0.17.6 的更新,可以預見 Ollama 在未來版本中將繼續強化多模態與 reasoning 模式集成,為 LLM 本地部署與企業多模型協作提供更堅實的基礎。

結語

代碼地址:github.com/ollama/ollama

Ollama v0.17.6 雖非大版本跳躍,但卻在細節上體現了極高的工程重視度。
從配置遷移到渲染邏輯,再到工具調用與流式解析,幾乎每個子模塊都在朝著更統一、更可靠、更智能的方向演進。

我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
印度首富一家集體露面:太太戴1億九寶項鏈,62歲比兩個兒媳都美

印度首富一家集體露面:太太戴1億九寶項鏈,62歲比兩個兒媳都美

照見古今
2026-05-12 15:50:13
巨大遺憾!19歲新星落選巴西55人名單:11場5球 無緣世界杯

巨大遺憾!19歲新星落選巴西55人名單:11場5球 無緣世界杯

葉青足球世界
2026-05-12 07:41:17
伊朗官員:若再次遭襲,伊方或選擇將濃縮鈾豐度提升至90%

伊朗官員:若再次遭襲,伊方或選擇將濃縮鈾豐度提升至90%

界面新聞
2026-05-12 14:55:29
時隔13年回歸!曝63歲穆帥執教皇馬已達協議,下周官宣+本月亮相

時隔13年回歸!曝63歲穆帥執教皇馬已達協議,下周官宣+本月亮相

我愛英超
2026-05-12 19:25:44
曾因綜藝爆紅,廣州東山口“明星老洋房”6310萬元流拍

曾因綜藝爆紅,廣州東山口“明星老洋房”6310萬元流拍

中國房地產報官方號
2026-05-12 17:05:35
俄羅斯無人機核心負責人科扎連科被捕!曾親自向普京匯報

俄羅斯無人機核心負責人科扎連科被捕!曾親自向普京匯報

項鵬飛
2026-05-11 20:08:25
誰能晉級CBA總決賽?西熱力江看好2支球隊,無廣東和北京隊

誰能晉級CBA總決賽?西熱力江看好2支球隊,無廣東和北京隊

體育哲人
2026-05-12 18:22:37
村民被眼鏡王蛇咬傷打13支血清 專家:我國尚無專門血清,可用抗銀環蛇毒血清加抗眼鏡蛇毒血清

村民被眼鏡王蛇咬傷打13支血清 專家:我國尚無專門血清,可用抗銀環蛇毒血清加抗眼鏡蛇毒血清

封面新聞
2026-05-11 19:00:03
外交部回應普京最新涉華表態

外交部回應普京最新涉華表態

中國網
2026-05-11 16:22:47
周星馳又做短劇了!與抖音集團短劇版權中心聯手,翻拍《食神》

周星馳又做短劇了!與抖音集團短劇版權中心聯手,翻拍《食神》

新腕兒
2026-05-11 19:13:21
徐帆澄清離婚僅7個月,馮小剛近況曝光,曾與養女徐朵貼臉惹爭議

徐帆澄清離婚僅7個月,馮小剛近況曝光,曾與養女徐朵貼臉惹爭議

黎兜兜
2026-05-11 21:20:14
晚清最慘絞肉戰:七位頂級提督殞命 左宗棠為何三日不眠不食?

晚清最慘絞肉戰:七位頂級提督殞命 左宗棠為何三日不眠不食?

掠影后有感
2026-05-10 10:43:55
秦始皇子孫后代被找到,這四個姓氏都是他的后裔,有你的姓氏嗎?

秦始皇子孫后代被找到,這四個姓氏都是他的后裔,有你的姓氏嗎?

興趣知識
2026-05-11 18:04:48
日本大型電機制造企業尼得科公司被曝大規模造假

日本大型電機制造企業尼得科公司被曝大規模造假

澎湃新聞
2026-05-12 21:33:09
毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

書畫相約
2026-05-11 10:09:02
蚌埠演唱會驚天騙局?成龍20 分鐘撈金離場?觀眾花千元看場笑話

蚌埠演唱會驚天騙局?成龍20 分鐘撈金離場?觀眾花千元看場笑話

做一個合格的吃瓜群眾
2026-05-12 15:10:23
美總統出訪為何連排泄物都要打包帶回?

美總統出訪為何連排泄物都要打包帶回?

觀星賞月
2026-05-12 02:38:46
劉曉彤當選!惠若琪在列,徐云麗無緣,中國排協公布完整名單

劉曉彤當選!惠若琪在列,徐云麗無緣,中國排協公布完整名單

跑者排球視角
2026-05-12 16:49:17
離婚后住浙江娘家,親媽和繼父給帶孩子,她卻在娛樂圈闖出一片天

離婚后住浙江娘家,親媽和繼父給帶孩子,她卻在娛樂圈闖出一片天

阿鳧愛吐槽
2026-05-11 22:13:02
陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

杰絲聊古今
2026-05-03 13:35:27
2026-05-13 00:12:49
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1223文章數 67關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

體育要聞

騎士終于玩明白了?

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

利潤再腰斬 京東干外賣后就沒過過好日子

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

游戲
藝術
本地
公開課
軍事航空

LPL第二賽段:又是讓一追二,BLG三局戰勝IG

藝術要聞

這位畫家的油畫美人讓人驚嘆不已!

本地新聞

用蘇繡的方式,打開江西婺源

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

知情人士披露:美國或考慮恢復對伊朗軍事行動

無障礙瀏覽 進入關懷版