內羅畢的街頭,一位焊工接過顧客遞來的手機。屏幕上是一張Pinterest截圖,一道鐵藝大門。"這個多少錢?"顧客問。焊工瞇眼看了幾秒,心算一陣,隨手在紙板上寫了個數字。沒有材料明細,沒有分項價格。顧客點點頭,轉身去找看起來更"正規"的作坊。
這種場景每天在肯尼亞重復成千上萬次。當地人稱這些戶外工匠為"jua kali"——斯瓦希里語的"烈日之下"。1500萬非正式手藝人靠這門營生:焊鐵門、打家具、做窗框、裝櫥柜。他們手藝過硬,卻因為拿不出一份像樣的現場報價單,眼睜睜看著訂單流失。
![]()
一位開發者用谷歌最新開源模型Gemma 4做了件小事,試圖改變這個局面。
![]()
手機拍照,一分鐘出報價單
這款名為Jua Kali Quote的工具邏輯極其簡單。工匠用手機拍下顧客帶來的任何參考圖——手繪草圖、Instagram截圖、鄰居家的成品門——Gemma 4 26B A4B(混合專家架構版本)分析圖像內容,識別結構類型,估算尺寸規格,自動生成包含材料、用量、人工費用的完整報價單,貨幣單位為肯尼亞先令。
工匠可以點擊任意項目手動調價。系統實時重算總價。一鍵分享至WhatsApp,顧客聊天窗口里立刻收到一份格式規范的PDF報價。整個流程控制在60秒內完成。所有記錄本地存儲,方便回頭客詢價或同類項目參考。
系統 upfront 顯示置信度提示:"材料費±15%,人工費±20%"。哪些數字是估算,哪些相對精確,一目了然。
為什么選Gemma 4的MoE版本
開發者解釋了三條技術選型理由。
第一,視覺理解不止于像素。模型不是簡單識別"一個帶豎線的矩形",而是推斷出"這是約12英尺寬的門板設計",進而判斷需要四個鉸鏈而非兩個。手繪草圖和手機翻拍圖都能處理。
![]()
第二,推理鏈能拆解復雜結構。面對多層貨架或帶裝飾線條的櫥柜,模型逐步分析組件關系,而非給出籠統總價。
第三,26B激活參數在本地可部署。肯尼亞的網絡基礎設施不穩定,MoE架構的稀疏激活特性讓邊緣運行成為可能。
技術棧相當樸素:Python+FastAPI后端,Gemma 4通過Google AI Studio API調用,前端純HTML/CSS/JS移動優先適配,本地存儲用localStorage。沒有花哨的中臺,沒有復雜的用戶系統。
覆蓋六種工種
當前版本支持焊接、木工、泥瓦、管道、電氣、油漆六類作業。開發者開源了完整代碼,配置流程只有四步:建虛擬環境、裝依賴、復制環境變量文件、填入API密鑰。本地運行命令是一行uvicorn。
這個項目的特殊之處在于問題定義的精準。它沒有試圖做"非洲版SAP"或"工匠數字化平臺"這種宏大敘事,而是鎖定一個具體場景:街頭交易中的信任建立。一份格式專業的報價單,在肯尼亞的語境里不只是效率工具,更是職業身份的視覺證明。
谷歌AI Studio提供免費API額度,意味著單個工匠的試用成本趨近于零。這是開源模型+云API組合在新興市場落地的典型路徑:技術門檻由開發者承擔,終端用戶只需一部能拍照的智能手機。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.