“一個微妙但重要的洞察是:你猜的詞不一定非得是最可能的答案,只要它的信息量夠大就行了。”說這句話的,是紐約州立大學賓漢姆頓分校的博士生唐納德·斯蒂芬斯。他口中的游戲,就是每天讓上百萬人抓耳撓腮的拼字挑戰。他和導師、助理教授吳聰宇(大家都叫他“彼得”)所在的團隊,最近研究出一套聽起來頗為反直覺的東西——一種能以99%成功率破解該游戲的數學方法。而整套思路,偏偏是讓你別那么急著去找正確答案。
有些人可能會覺得,這無非就是個猜詞挑戰:六個回合猜一個五個字母組成的單詞,字母位置對了就綠,字母有但位置不對就黃,字母完全沒出現就灰。要贏,不就是先把英語里最常見的字母——比如A、E、R、T——往上懟,然后再拼湊嗎?很多人也確實這么玩。這種“常用字母優先”的策略,在計算機模擬里能搞定大約90%的題目。聽起來不錯了,對吧?但彼得團隊用信息論調教出來的方法,直接把成功率拉到了99%。差別就在于,當你拼命去找哪個詞“最像答案”的時候,他們正在算:哪個詞能幫你一下子排除掉最多的可能性,哪怕這個詞本身看起來簡直像在胡說八道。
如果要把這項研究的核心畫成一張對比圖,它大概長這樣:上面是傳統路線——玩家看到一個滿是空格子的界面,腦子里蹦出的全是“AEIOU該上場了”,然后一路圍繞常見字母組合去試。下面是信息論路線——玩家每猜完一個詞,都把系統返回的顏色提示先喂給一個分析工具,工具迅速演算后,吐出一個你平時可能根本不會選的詞。比如當答案幾乎鎖定在“BRAVE”和“GRAVE”之間時,它卻讓你先去猜“PLUMB”。你照著做了,然后仿佛突然開了天眼,剩下的那條窄路一下子敞亮了。
這張假想圖里最惹眼的,是策略背后那個閃著金光的模塊——香農熵。信息論創始人克勞德·香農提出,一個系統的混亂程度(或者說你有多不確定)可以用“熵”來度量。拿猜詞來說,你面對的可能答案越多,你的處境就越“高熵”;每獲得一點新信息,熵就降低一點,直到你完全確定。彼得他們的想法就是:別老想著這一猜正好撞上正確答案的概率有多大,而要關心這一猜做完,那個龐大的候選詞名單能縮水多少。只要熵降得夠快,你離謎底就近得更快。
說人話的版本是這樣的:假設你去參加一個離譜的尋寶游戲,裁判心里想好了一個數字,讓你猜。你可以直接猜“是128嗎?”,但裁判只告訴你是“大了”還是“小了”。一個聰明的玩家不會一開始就逮著一個可能正確的數字亂喊,而是先問“大于50嗎?”。這樣一來,不管答案是“大”還是“小”,你都立刻砍掉了一半的可能性。這個“對半砍”的提問,本身一點離正確答案更近的感覺都沒有,但它帶來的信息量最大。這款游戲里的情形當然更復雜——你面對的不是一維的數字線,而是一個上千個單詞的候選池,每個猜詞給出的顏色反饋都是一個更細的分類器。香農熵的任務,就是在這種高維空間里找出那把能切出最均勻、最能消滅不確定性的“手術刀”。
在具體規則下,信息如何一來一回傳遞,可能很多人已經熟悉了,但為了讓這張腦內圖解更清晰,我們再把它擺明一遍。游戲開始,你眼前只有五個空白格,沒有任何提示。你輸入第一個猜測,比如恰好就是論文里舉的那個例子——“BRAVE”。系統會把每個字母的方框涂上顏色:字母位置完全正確就綠,字母在答案里但放錯了位置就黃,如果答案里壓根沒有這個字母就灰。假設真正的答案是“CRANE”,那么你猜的“BRAVE”就會回傳一個灰色B、灰色R、綠色A、灰色V、黃色E。你從這五個小色塊里讀出的信息是:B、R、V這三個字母完全不用想了,A就在第三個位置,E應該在別的某個地方。就這樣,撲朔迷離的可能性之海被你掃掉了一大片。
傳統玩家看到這一串顏色后,會順著A和E的線索,去嘗試那些符合已有提示的高頻詞,比如接著猜“PLANE”或者“SHALE”。這么做很符合直覺,也的確常常管用,畢竟英文單詞的拼寫規律就擺在那兒。可萬一那天的答案是一個結構冷門的詞,比如“JUDGE”或者“VIVID”,一路追著常見字母跑的選手很容易在最后幾步陷入“字母全知道,位置全亂套”的窘境。這也就是為什么傳統策略在模擬中留下大約10%的失敗率——它不是不努力,而是在某些局里,它的猜法沒能最有效地壓縮剩余的未知數。
信息論策略的玩法就有點“渣男心態”——暫時不急著確定關系,先把底細摸清楚。按照吳聰宇的解釋,你每猜完一個詞,前面幾輪積累的線索已經把一大堆候選詞排除掉了。在剩余的那個縮小了的名單里,有些猜詞能一下子把你帶進“信息增長更迅猛的軌道”。也就是說,在這個關卡,也許有兩個詞讓你選:一個看上去和已經揭示的線索高度吻合,另一個則顯得八竿子打不著。普通人的本能是選前者,而香農熵推著你選后者。因為后者一旦給出反饋,你剩下的可能路徑會瞬間收窄,原本還要繞三四步的局,一下子就被縮短了。
論文作者斯蒂芬斯直言,很多玩家之所以屢屢與答案失之交臂,恰恰是因為太想把每一猜都押在“對的”上,結果反而在關鍵節點錯過了那個能一錘定音的信息“開關”。當你真正理解這套算法的心思后,會發現自己過去猜詞時的那種“求對”沖動,正是勝率卡在90%就上不去的癥結所在。而99%的門檻,靠的不是更準的直覺,而是更聰明地利用每一次反饋,把不確定性切得粉碎。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.