8月21日,在2024火山引擎AI創新巡展上海站的采訪環節,火山引擎總裁譚待用上面這句話,談到了大模型與云之間的關系。
他表示,無論是公有云,還是私有云,本質上大模型都是其中的一部分,大模型私有化也是私有云的一部分;在公有云中,調用大模型,本質上是在調用云上的一個PaaS服務,只不過這個PaaS服務特別重要。
也因此,譚待強調,沒有必要把AI和云對立來看——而火山引擎作為云服務廠商的定位,是沒有變化。
不過,不得不承認的是,大模型的加持,讓火山引擎看到了它在云計算市場的未來機遇。所以,借重于這個千載難逢的機遇,火山引擎作為字節跳動的云計算業務板塊,正在花大力氣推動旗下豆包大模型的技術突破、成本降低和應用拓展,并且面向不同的行業尋找落地機遇。
從目前的情況來看,火山引擎已經取得了具備巨大可能性的突破。
進擊的大模型:不僅僅是技術
作為火山引擎旗下的破局利器,豆包大模型的進化速度令人刮目相看。
這其中,一個典型且容易被外界感知的數據是:根據公開及內部測評集顯示,最新版豆包大語言模型相比發布初期綜合能力提升了20.3%。
從具體的細分能力來看,豆包大模型實現了如下方面的提升:
- 角色扮演能力提升了38.3%,具備了更強的上下文感知,讓對話情境更連貫、角色更擬人化。
- 語言理解能力提升了33.3%,讓豆包大模型在信息分類、抽取、摘要、理解和問答等NLP方面都有了顯著提升,能夠在更多生產力場景中得到應用。
- 此外,模型在長文任務、數學、專業知識、代碼能力上也有不同程度的增強。
基于這些技術能力的升級,火山引擎還在本次活動中公布了多個豆包垂類模型的最新升級,具體來說:
- 豆包·文生圖模型對長文本有更精準的圖文匹配能力,多主體、多位置、手部結構等復雜場景的生圖能力更強,更善于理解中國特色元素,創造更具美感的中國風圖片。
- 豆包·語音識別模型基于大語言模型豐富的知識和推理能力,通過上下文感知,提升語音識別準確性,在多個公開測試集中,與國內公開發布的語音識別大模型相比,錯誤率最高降低40%;支持一個模型識別普通話和粵語、上海話、四川話、西安話、閩南語等方言。
- 豆包·語音合成模型升級了流式語音合成能力,能夠實時響應、精準斷句,支持「邊想邊說」。
另外,基于上述能力,火山引擎還專門發布了對話式AI實時交互解決方案,該方案整合了豆包大模型和實時音視頻(RTC)技術,提供端到端的大模型實時對話方案。
基于該方案,企業可以輕松地在自己AI應用中嵌入該實時語音功能,用戶不僅能用語音與AI進行交談,還能像平時說話一樣,在對話過程中適時打斷或插話,經過升級后的AI聲音具備較好表現力和感情色彩,對話更自然、更真實、更流暢。
另外,除了模型效果,針對企業生產環境對AI高并發需求出發,豆包通用模型pro提供了國內最高標準的800k初始TPM(每分鐘處理tokens數量)。基于這樣的能力,火山引擎可以在客戶高并發的對話場景要求下,幫助客戶完成多輪提示詞的優化,并且提供充分的高并發保障,幫助客戶應對高峰場景。
總體來看,經過技術能力的持續迭代,豆包大模型在三個月的時間里,已經完成了新一輪肉眼可見的能力進化,涵蓋了基礎能力提升、垂類模型優化、實時對話方案、高并發場景保障等多個與客戶關聯密切的方面。
除了能力本身,我們還也注意到,火山引擎還在活動現場介紹了一系列面向客戶的大模型相關產品升級點,比如說火山方舟最新推出的全周期安全可信方案、扣子專業版、HiAgent的最新能力等。
這背后,自然也離不開字節跳動本身在AI領域的深厚技術積累。
值得一提的是,除了技術開發,火山引擎也尤其注重于降低豆包大模型的成本,從而使得它的快速走向「價值創造階段」。實際上,在5月15日的活動上,豆包主力模型面向企業市場就掀起了一場價格戰,并由此掀起了行業里的大模型降價風潮。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.