文 | Judy
一家來(lái)自中國(guó)杭州、成立不到兩年的初創(chuàng)企業(yè)DeepSeek,以前所未有的速度觸及了全球大模型界敏銳的神經(jīng)。
風(fēng)險(xiǎn)投資機(jī)構(gòu)a16z創(chuàng)始人安德森將DeepSeek最新的推理模型R1描述為「人工智能的斯普特尼克時(shí)刻」,斯普特尼克是蘇聯(lián)在1957年先于美國(guó)發(fā)射的人造衛(wèi)星,英偉達(dá)高級(jí)研究科學(xué)家Jim Fan則認(rèn)為“Deepseek作為一家非美國(guó)公司真正踐行著 OpenAI最初的使命”。
DeepSeek還引發(fā)了華爾街的震動(dòng),從股市到科技巨頭的財(cái)報(bào)電話會(huì)上,分析師迫切想知道DeepSeek所帶來(lái)的影響。據(jù)「硅基研究室」不完全統(tǒng)計(jì),DeepSeek 在本周至少九次在財(cái)報(bào)電話會(huì)議上被提及,微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)承認(rèn)DeepSeek「確實(shí)有一些創(chuàng)新」,Meta創(chuàng)始人扎克伯格則在電話會(huì)上將這家中國(guó)公司視為新的競(jìng)爭(zhēng)對(duì)手。
事實(shí)上,作為中國(guó)大模型玩家,DeepSeek的出圈并非是孤例。2024年至今,「神秘的東方力量」已經(jīng)在硅谷AI圈多次受到關(guān)注。正如AI領(lǐng)域泰斗吳恩達(dá)所言:
“DeepSeek的創(chuàng)新表明,中美在生成式AI領(lǐng)域的差距正在迅速縮小,在某些領(lǐng)域中國(guó)已現(xiàn)領(lǐng)先跡象。”
本文主要論述三個(gè)核心趨勢(shì):
1、反擊OpenAI,「中國(guó)AI復(fù)仇者聯(lián)盟」已經(jīng)崛起
2、AI領(lǐng)域的「中國(guó)式創(chuàng)新」有三大核心關(guān)鍵詞
3、2025,中美AI競(jìng)逐或迎來(lái)新敘事
一、反擊OpenAI,「中國(guó)AI復(fù)仇者聯(lián)盟」正在崛起
在全球目光聚焦DeepSeek的出圈背后,事實(shí)上,過(guò)去一段時(shí)間內(nèi),在追趕和反擊OpenAI這件事上,從大廠到創(chuàng)業(yè)公司,在多個(gè)技術(shù)領(lǐng)域里,「中國(guó)AI復(fù)仇者聯(lián)盟」已經(jīng)在崛起。
比如在多模態(tài)領(lǐng)域的文生視頻上,去年2月,OpenAI發(fā)布Sora,但推動(dòng)AI視頻真正落地的卻來(lái)自中國(guó)科技大廠——快手的可靈,可靈甚至在內(nèi)測(cè)期就引發(fā)海外用戶(hù)集體跪求「中國(guó)賬號(hào)」;語(yǔ)音方面,字節(jié)跳動(dòng)豆包的實(shí)時(shí)語(yǔ)音功能就曾以驚人的擬人效果,實(shí)現(xiàn)了GPT-4o想要追求語(yǔ)音助手「Her」的效果。
在更關(guān)鍵的大模型「幻覺(jué)」問(wèn)題上,以百度為主的中國(guó)公司更是貢獻(xiàn)出明顯優(yōu)于OpenAI的更優(yōu)解決方案,以RAG(Retrieval-Augmented Generation檢索增強(qiáng)生成)技術(shù)為例,如今已成為主流大模型提升性能的共識(shí)。但實(shí)際上,早在2023年3月,百度發(fā)布文心一言時(shí),就已提到了RAG是百度大模型的特色,而兩年過(guò)去,百度特色已成為行業(yè)追逐更優(yōu)模型效果的共識(shí)。
實(shí)測(cè)文心一言和OpenAI也可能清晰地看到中國(guó)AI的能力躍升。我們以熱門(mén)春節(jié)檔電影為話題,分別問(wèn)了文心一言和chatGPT兩個(gè)問(wèn)題:在“做藕粉的過(guò)程中,出現(xiàn)了哪些讓哪吒感覺(jué)不適的操作?”和“在徐克的射雕電影中,黃蓉給歐陽(yáng)鋒的九陰真經(jīng),是用什么語(yǔ)言寫(xiě)的?”實(shí)測(cè)結(jié)果可以發(fā)現(xiàn),文心一言都給出了詳細(xì)正確的解答,但chatGPT即便在聯(lián)網(wǎng)下也并未給出正確或詳細(xì)的解答。
這背后其實(shí)是百度針對(duì)RAG構(gòu)建了一整套「理解-檢索-生成」的協(xié)同優(yōu)化技術(shù),百度CTO王海峰曾拆解過(guò)這一技術(shù)實(shí)現(xiàn)過(guò)程。所謂的「理解」就是拆解知識(shí)點(diǎn),充分理解用戶(hù)的需求;「檢索」則是先找到最合適的信息,然后進(jìn)行搜索排序優(yōu)化,并將搜索返回的異構(gòu)信息統(tǒng)一表示,再送給大模型;而「生成」則是會(huì)綜合不同來(lái)源的信息做出判斷,并基于大模型邏輯推理能力,解決信息沖突等問(wèn)題,最終生成準(zhǔn)確率高、時(shí)效性好且高質(zhì)量的答案。
從構(gòu)建更低成本的模型,到RAG、多模態(tài)、語(yǔ)音交互等多個(gè)技術(shù)領(lǐng)域的追趕超越,無(wú)論是DeepSeek此類(lèi)創(chuàng)企,還是百度等科技大廠,可以肯定的是,在全球大模型競(jìng)逐中,「中國(guó)AI復(fù)仇者聯(lián)盟」已經(jīng)上桌了。
二、AI領(lǐng)域的「中國(guó)式創(chuàng)新」
墻內(nèi)開(kāi)花墻外也香,一系列中國(guó)AI玩家出圈背后,其實(shí)是AI領(lǐng)域「中國(guó)式創(chuàng)新」的復(fù)現(xiàn)。
我們可以將「中國(guó)式創(chuàng)新」總結(jié)為三個(gè)關(guān)鍵詞:應(yīng)用優(yōu)先、形態(tài)豐富、務(wù)實(shí)優(yōu)先。
一是應(yīng)用優(yōu)先。百度創(chuàng)始人李彥宏曾說(shuō):“模型本身不產(chǎn)生直接價(jià)值,只有在模型之上開(kāi)發(fā)各種各樣應(yīng)用,在各種場(chǎng)景找到所謂的‘PMF’,才能真正產(chǎn)生價(jià)值。 ”這種「應(yīng)用優(yōu)先」的認(rèn)知也隨著中國(guó)大模型玩家的洗牌和分化逐步成為關(guān)鍵共識(shí)。在廣闊的應(yīng)用土壤中,中國(guó)AI更容易發(fā)現(xiàn)用戶(hù)實(shí)際需求、迅速迭代,找到OpenAI們不容易看到的創(chuàng)新落腳點(diǎn)。
二是形態(tài)豐富。對(duì)比海外大模型應(yīng)用層的表現(xiàn),隨著中國(guó)AI的應(yīng)用形態(tài)的不斷豐富和能力迭代,跨越從「能用到好用」的鴻溝。 「AI產(chǎn)品榜」此前曾發(fā)布一份關(guān)于《2024全球AI產(chǎn)品付費(fèi)用戶(hù)規(guī)模》的榜單,其中微軟Copilot以5574萬(wàn)付費(fèi)用戶(hù)規(guī)模位列全球第一,而中國(guó)AI產(chǎn)品百度文庫(kù)以4000萬(wàn)規(guī)模位列全球第二,第三、第四為Canva和ChatGPT,而百度文庫(kù)的付費(fèi)用戶(hù)規(guī)模是它們的2-4倍。
與免費(fèi)用戶(hù)不同,付費(fèi)用戶(hù)是愿意為企業(yè)成本買(mǎi)單的真用戶(hù),而以百度文庫(kù)為代表的中國(guó)AI的上榜也印證了在中國(guó)AI的真價(jià)值。
三是務(wù)實(shí)優(yōu)先。以O(shè)penAI為代表的海外大模型企業(yè)擅長(zhǎng)用「暴力美學(xué)」追求AGI,但中國(guó)AI企業(yè)在「有限資源」下,追求的是一條務(wù)實(shí)主義的路。
中國(guó)創(chuàng)企中DeepSeek就是務(wù)實(shí)的典型代表,R1它通過(guò)混合專(zhuān)家模型(MoE)、多頭潛在注意力極致(MLA)、多令牌預(yù)測(cè)(MTP)、長(zhǎng)鏈?zhǔn)酵评?CoT)等多種技術(shù)組合,且只進(jìn)行了RL訓(xùn)練,在數(shù)據(jù)精度、底層通信上做優(yōu)化,最終實(shí)現(xiàn)了模型訓(xùn)練高效率和低API成本。
李彥宏也曾對(duì)比國(guó)內(nèi)和海外生態(tài),他提到,“很多美國(guó)同行,他們做法是當(dāng)做一個(gè)science,有一個(gè)AGI終極目標(biāo),就想盡各種辦法解決它”,但中國(guó)公司也有AGI夢(mèng)想,但不同的是,中國(guó)AI是邊做邊解決問(wèn)題,“我更多希望盡早接觸場(chǎng)景及接觸應(yīng)用,在這個(gè)過(guò)程當(dāng)中大家遇到的最多的問(wèn)題,就是我們優(yōu)先解決的問(wèn)題。”
更多的投入并不代表就有更多的創(chuàng)新,百度和DeepSeek的諸多實(shí)踐成果其實(shí)都是中國(guó)技術(shù)公司工程能力優(yōu)勢(shì)的體現(xiàn)。
三、2025,中美AI競(jìng)逐或迎來(lái)新敘事
2023年,當(dāng)OpenAI攜chatGPT橫空出世時(shí),一位谷歌研究員曾發(fā)布一句流傳網(wǎng)絡(luò)的預(yù)測(cè):“谷歌沒(méi)有護(hù)城河,OpenAI也沒(méi)有。”
如今隨著中國(guó)AI的崛起,這句話的含金量仍在上升。梁文鋒也曾說(shuō)過(guò):“技術(shù)沒(méi)有什么秘密,但重置需要時(shí)間和成本。”
而在今天,隨著大模型競(jìng)逐正式進(jìn)入第三年,中國(guó)AI一面專(zhuān)注模型迭代,一面聚焦成本效率優(yōu)化,親手打破了「中國(guó)AI只跟隨、無(wú)創(chuàng)新」的質(zhì)疑。
創(chuàng)新的落腳點(diǎn)可以是多方面的,中國(guó)的科技公司們已經(jīng)在走這條路:一方面我們可以利用有限資源的極致高效利用,繞開(kāi)「算力暴力美學(xué)」,實(shí)現(xiàn)彎道超車(chē);另一面,豐富的實(shí)體產(chǎn)業(yè)應(yīng)用場(chǎng)景和高質(zhì)量的數(shù)據(jù),都利于中國(guó)AI公司更務(wù)實(shí)的探索,通過(guò)讓AI落地千行百業(yè),實(shí)現(xiàn)真正的「平權(quán)」,這將是中國(guó)公司的機(jī)會(huì)。
一位大模型產(chǎn)業(yè)人士認(rèn)為,DeepSeek的出圈的最大意義在于,讓外界看到了中國(guó)AI的爆發(fā)能力,以及中國(guó)正在加速縮短與美國(guó)AI的差距,速度比人們想象中要更快。
新的中美大模型競(jìng)逐還在繼續(xù),OpenAI深夜推出o3-mini新模型已印證了這一點(diǎn),但「DeepSeek風(fēng)暴」也只是中國(guó)AI崛起的開(kāi)始,CNBC的Jim Cramer就猜測(cè)百度是否會(huì)成為下一個(gè)吸引市場(chǎng)關(guān)注的中國(guó)科技巨頭。他在X上提出了這個(gè)問(wèn)題,“首先是DeepSeek,然后是BABA,接下來(lái)可能是百度?”據(jù)「硅基研究室」了解,春節(jié)過(guò)后,百度或?qū)⑼瞥鑫男哪P偷男掳姹尽?/p>
一切跡象都在表明,2025年,AI領(lǐng)域的「中國(guó)式創(chuàng)新」也將會(huì)發(fā)揮更大的作用,中國(guó)的AI的創(chuàng)新價(jià)值,也在加速被世界重估。
偉大無(wú)法被計(jì)劃,真正的創(chuàng)新也不會(huì)因「出口管制」而停止,2025,不妨給中國(guó)AI多一點(diǎn)信心。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.