手傷眼疾尚未修復(fù),手進(jìn)入恢復(fù)階段反而更酸痛了;眼科看完了,等明兒看完中醫(yī),再談?wù)勼w會(huì),總的來(lái)說(shuō),小鎮(zhèn)覺(jué)得這次眼疾是大好事。寫(xiě)這篇時(shí)只能每寫(xiě)20分鐘休息5分鐘,公號(hào)就先緩緩了。
本文發(fā)在星球,對(duì)個(gè)人、企業(yè)、城市或地區(qū)都挺重要的,也有助于進(jìn)一步理解未來(lái)AI的發(fā)展方向,全文5000字,慣例發(fā)前50%。
如果只想記住結(jié)論也行,小鎮(zhèn)一直覺(jué)得結(jié)論的價(jià)值最多占三成,如何論證并得出這個(gè)結(jié)論,才是最關(guān)鍵的。
結(jié)論是:未來(lái)Token也就是“詞元”的消耗量,不僅適用于企業(yè)內(nèi)部考核個(gè)人,還可以成為AI相關(guān)企業(yè)橫向?qū)Ρ取⒌貐^(qū)GDP和社會(huì)經(jīng)濟(jì)指標(biāo)完成情況乃至中美等國(guó)家間橫向?qū)Ρ鹊暮诵闹笜?biāo),其重要性將隨著AI發(fā)展,越來(lái)越重。
總之,Token消耗量,就是AI時(shí)代的用電量指標(biāo)。大家覺(jué)得十年增速多少比較可能?百倍、千倍、萬(wàn)倍?還是十萬(wàn)、百萬(wàn)倍?
星球文章題目為:《Token詞元,很可能成為國(guó)家關(guān)注的核心考核指標(biāo)》,配套輔助閱讀文章為《》一文重點(diǎn)介紹的2020年中國(guó)統(tǒng)計(jì)方式的全面改革,也就是“下算一級(jí)”。
以下正文前50%:
開(kāi)始本篇之前,小鎮(zhèn)先提兩個(gè)問(wèn)題:
問(wèn)題一:為什么國(guó)家會(huì)優(yōu)先命名Token為“詞元”?而不是其他AI相關(guān)英文詞語(yǔ)?
問(wèn)題二:在傳統(tǒng)情境下,美國(guó)絕無(wú)可能在算力上追上中國(guó),馬斯克的“太空算力”能否成為美國(guó)彎道超車的可能途徑?
由這兩個(gè)問(wèn)題,幫助理解“Token”這個(gè)新事物的重要性。小鎮(zhèn)判斷:詞元消耗量或者說(shuō)調(diào)用量,在不久的將來(lái),很可能成為中美AI競(jìng)爭(zhēng)、國(guó)內(nèi)地區(qū)和企業(yè)競(jìng)爭(zhēng)乃至GDP核算的關(guān)鍵指標(biāo),借助中國(guó)完善的規(guī)劃執(zhí)行體系,持久的加速推進(jìn)中國(guó)AI進(jìn)程。
為什么這么說(shuō)呢?這就是今天要談的。
因?yàn)槭謧奂惨呀?jīng)耽擱了好幾天,今天開(kāi)始要好好談?wù)劇笆逦濉币?guī)劃,不過(guò)大家也不用太著急,因?yàn)槟壳爸还剂俗詈诵牡膰?guó)家“十五五”規(guī)劃綱要,還有幾十個(gè)國(guó)家層面的專項(xiàng)配套規(guī)劃未公布。
地方層面,還有10萬(wàn)級(jí)數(shù)量的各類配套規(guī)劃,就算只統(tǒng)計(jì)到省級(jí)和較發(fā)達(dá)城市,也以千計(jì),整個(gè)2026年都是“十五五”規(guī)劃體系快速完善的一年,尤其2026年3月12日起,發(fā)展規(guī)劃法正式施行。
任何規(guī)劃,最核心的就是考核指標(biāo)。
國(guó)家“十五五”規(guī)劃綱要中分為約束性和預(yù)期性兩類指標(biāo)。
約束性就是強(qiáng)制需要完成的,一般是生態(tài)環(huán)境和民生類,但并不意味著一定能完成,比如“十四五”規(guī)劃綱要確定的節(jié)能降碳約束性指標(biāo)就沒(méi)有完成。
預(yù)期性主要是經(jīng)濟(jì)指標(biāo),考慮為實(shí)際執(zhí)行留下更多靈活空間,所以預(yù)期性指標(biāo)一般制定的比較穩(wěn)妥、保守。比如“十四五”數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)占比,目標(biāo)是從7.8%提高到10%,目標(biāo)提高2.2個(gè)百分點(diǎn),實(shí)際超過(guò)10.5%,提高了2.7個(gè)百分點(diǎn);然而在這一背景下,“十五五”目標(biāo)卻只是從10.5%提高到12.5%,增幅僅為2個(gè)百分點(diǎn),這就體現(xiàn)了預(yù)期性目標(biāo)的穩(wěn)妥性。
可能有朋友好奇為啥“十五五”期間增幅目標(biāo)比“十四五”少了0.2個(gè)百分點(diǎn),有什么復(fù)雜考量?
這就想得太復(fù)雜啦,不過(guò)是在保守穩(wěn)妥的基礎(chǔ)上湊整罷了。“十四五”制定目標(biāo)的時(shí)候,數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)占比是7.8%,要湊整無(wú)非以0或者5結(jié)尾,也就是在9.5%、10%、10.5%之間選一個(gè),9.5%太保守、10.5%感覺(jué)太激進(jìn),于是就選了10%;而“十五五”目標(biāo)從10.5%提高到12.5%也是同樣的道理,無(wú)非12%、12.5%、13%選一個(gè),而考慮到之前基數(shù)比較高,自然就選擇了12.5%。
這就是預(yù)期性目標(biāo)設(shè)置有意思的地方,多少有點(diǎn)湊整。類似的人均預(yù)期壽命目標(biāo)從79.25歲提高到80歲,常住人口城鎮(zhèn)化率從67.9%提高到71%。
不過(guò)除了在綱要最開(kāi)頭經(jīng)濟(jì)社會(huì)發(fā)展主要指標(biāo)列表標(biāo)明的指標(biāo),綱要正文中還分散了明確了其他指標(biāo)。
分散在正文中的指標(biāo),有的比開(kāi)頭列表里的還重要。“十四五”規(guī)劃綱要,開(kāi)頭列表共20個(gè)指標(biāo),后面正文還提出了20個(gè)其他指標(biāo),“十五五”仍然如此,小鎮(zhèn)還沒(méi)來(lái)得及細(xì)數(shù),目前看起碼額外有十幾個(gè)指標(biāo)。
比如農(nóng)作物耕種收綜合機(jī)械化率提高到80%,大陸自然岸線保有率不低于35%;學(xué)前教育毛入園率提高到95%,高中階段教育完成率達(dá)到88%,高等教育毛入學(xué)率達(dá)到65%;重大慢性病過(guò)早死亡率下降到13%以下,經(jīng)常參加體育鍛煉人數(shù)比例達(dá)到40%左右;單位GDP能耗下降10%左右,氮氧化物、揮發(fā)性有機(jī)物排放量分別下降8%以上,化學(xué)需氧量、總磷排放量分別下降6%;單位GDP用水量下降10%,農(nóng)田灌溉水有效利用系數(shù)提高到0.6,等等。
上述這些指標(biāo)看起來(lái)都要比數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)占比這個(gè)預(yù)期性指標(biāo)更剛性,剛性就在于目標(biāo)明確、責(zé)任明確、統(tǒng)計(jì)口徑明確,不像數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)占比還是有一定的操作空間。
以上簡(jiǎn)單梳理了下五年規(guī)劃綱要的目標(biāo)設(shè)置,作為背景。
“十五五”規(guī)劃綱要已經(jīng)確定,但并不意味著接下來(lái)五年沒(méi)有任何調(diào)整,實(shí)際工作中,也會(huì)隨著現(xiàn)實(shí)需要,進(jìn)行靈活調(diào)整,這些調(diào)整未必通過(guò)官方文件進(jìn)行明確,而是以“白皮書(shū)”等更加靈活的準(zhǔn)官方形式,但千萬(wàn)不要低估這種非正式途徑的權(quán)威性。
舉個(gè)例子,小鎮(zhèn)剛才說(shuō)數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)占比統(tǒng)計(jì)有一定操作空間。當(dāng)年這個(gè)指標(biāo)到底應(yīng)該怎么核算,就費(fèi)了很大工夫,直到目標(biāo)公布之后兩年多,才確定到底應(yīng)該如何核算,并下文到各地進(jìn)行統(tǒng)計(jì),實(shí)際統(tǒng)計(jì)過(guò)程中也有很多模糊的地方。
這兩年一直有聲音建議調(diào)整統(tǒng)計(jì)口徑,尤其AI備受關(guān)注后,就建議將“數(shù)字經(jīng)濟(jì)”修改為“數(shù)智經(jīng)濟(jì)”,一些在人工智能發(fā)展上占據(jù)領(lǐng)先位置的省份和城市呼聲尤為強(qiáng)烈。
但想要調(diào)整難度還是挺大的,一個(gè)關(guān)鍵原因是統(tǒng)計(jì)口徑就是權(quán)力,如果調(diào)整統(tǒng)計(jì)口徑,很可能意味著原本管理這塊的部門(mén)丟了管理權(quán),至少要把部分管理權(quán)轉(zhuǎn)移出去。所以更加務(wù)實(shí)的做法,就是通過(guò)白皮書(shū)的形式進(jìn)行完善,提供新的統(tǒng)計(jì)口徑,但是名字還是不變。
這個(gè)做法并非罕見(jiàn),比如“十五五”規(guī)劃綱要第四篇,還是“數(shù)字中國(guó)”的老提法,但是仔細(xì)看內(nèi)容,跟“十四五”內(nèi)涵大不一樣。
在“十五五”規(guī)劃制定中,也有人提議是不是把“數(shù)字中國(guó)”改為“數(shù)智中國(guó)”,但考慮來(lái)考慮去還是覺(jué)得不改為好,起碼“數(shù)字中國(guó)”更加順口,但注意,“十五五”規(guī)劃綱要中,具體內(nèi)容大量出現(xiàn)“數(shù)智”,一共26處,而“數(shù)字”才25處,而且相對(duì)更加具體化。
鋪墊有點(diǎn)久,說(shuō)了些規(guī)劃編制的閑談,方便理解,接下來(lái)就得進(jìn)入正題了。
小鎮(zhèn)之前寫(xiě)過(guò)好幾篇文章,如果按照目前既定模式,也就是基于電力、芯片等基礎(chǔ)上在地球大規(guī)模興建算力設(shè)施,美國(guó)沒(méi)有半分取勝的可能,一定在算力競(jìng)爭(zhēng)中被中國(guó)壓在下面,中國(guó)領(lǐng)先優(yōu)勢(shì)還會(huì)非常大,兩會(huì)期間王堅(jiān)院士就非常自信的表達(dá)了這一點(diǎn)。
但美國(guó)真的完全沒(méi)有彎道超車的可能嗎?雖然概率很小,但也不至于為零,馬斯克的“太空算力”就是一種可能。
小鎮(zhèn)之前也說(shuō)過(guò),馬斯克放著更容易的地面算力不搞,非要在更難以散熱的太空搞算力,這個(gè)邏輯不對(duì)。但小鎮(zhèn)的否定觀點(diǎn),是基于傳統(tǒng)算力擴(kuò)張的主流模式,如果不從純粹算力角度,而是AI整體角度,那就不一樣了,關(guān)鍵是Token詞元的調(diào)用量。
AI有三大基座:算法、算力、數(shù)據(jù)。
中國(guó)AI大模型研發(fā),頂著一軟一硬兩大負(fù)面壓力。一硬就是算力不足,一軟是公開(kāi)可訓(xùn)練數(shù)據(jù)不足。
中國(guó)AI大模型研發(fā)在數(shù)據(jù)上很吃虧,并非中國(guó)數(shù)據(jù)少,更不是所謂謠傳的“中國(guó)互聯(lián)網(wǎng)數(shù)據(jù)只占全球的1%”,關(guān)鍵在于中國(guó)快速進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,海量數(shù)據(jù)被封閉在大小APP中,數(shù)據(jù)私有化極為嚴(yán)重,缺乏開(kāi)放的優(yōu)質(zhì)訓(xùn)練用公共數(shù)據(jù)集。這就導(dǎo)致中國(guó)AI公司不得不使用英文訓(xùn)練數(shù)據(jù)集,就出現(xiàn)了對(duì)英文提示詞更加敏感的現(xiàn)象,以至于有不少人以為是套殼抄襲國(guó)外AI大模型。
不過(guò)有利有弊,算力和可訓(xùn)練公共數(shù)據(jù)的不足,也促使中國(guó)AI公司更加注重算法的提升,典型就是催生了DeepSeek。
但未來(lái)AI的發(fā)展,肯定是三者協(xié)同,任何一個(gè)短板都會(huì)卡住AI的發(fā)展進(jìn)程。
做個(gè)類比,就好理解了。
對(duì)比汽車,算法就好比發(fā)動(dòng)機(jī),算力好比燃料,數(shù)據(jù)好比打磨一輛好車的經(jīng)驗(yàn)積累。
無(wú)論單體方面如何優(yōu)秀,一輛車歸根到底就是要以更低成本、更高效、更安全的把人和物從A點(diǎn)帶到B點(diǎn),而這個(gè)里程就是Token詞元。
總之,無(wú)論一家汽車公司說(shuō)自己的造車經(jīng)驗(yàn)多么豐富、發(fā)動(dòng)機(jī)打磨的多好、使用的燃油多么充足,在一場(chǎng)拉力賽中,還是要看最終實(shí)現(xiàn)的里程有多少,而這個(gè)里程數(shù)體現(xiàn)了方方面面的綜合成績(jī)。
Token是一個(gè)絕妙的指標(biāo)。
......(省略1638字)。
面對(duì)如此令人心動(dòng)的未來(lái),所以為AI發(fā)展確定一個(gè)便于綜合評(píng)估的核心指標(biāo)很有必要;也更需要一個(gè)強(qiáng)大的政府進(jìn)行相應(yīng)的社會(huì)改革,最大限度彌合AI爆發(fā)發(fā)展對(duì)社會(huì)帶來(lái)的沖擊。
這就是小鎮(zhèn)說(shuō)的,中美AI競(jìng)爭(zhēng)最關(guān)鍵的不是技術(shù),而是政府治理能力。
其他文章推薦
(中篇)
(上篇)
如果喜歡,還請(qǐng)點(diǎn)贊、“在看”和關(guān)注吧
歡迎分享,讓更多人發(fā)現(xiàn)“大樹(shù)鄉(xiāng)談”
備用:大樹(shù)鄉(xiāng)談2022、大樹(shù)鄉(xiāng)談2023
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.