昨天Google I/O發布會,熱度還是挺高的,我們的發布會總結文章也10萬+了。
全網都在聊Gemini 3.5,聊Gemini Omni等等。
但是有一個小東西,是我覺得可以拎出來單獨寫一篇的,因為我覺得這個東西可能比其他的所有新模型新功能,對于大眾和我們這些普通人的影響,都要重要。
那就是,OpenAI官宣選擇與Google合作,接入Google SynthID,完善AI圖片檢測鏈路,然后推出了一個AI圖片檢測的工具,來強化內容溯源,盡可能用最低的成本,讓每一張AI生成的圖片,都可以被識別出來。
![]()
關注我比較久的老粉絲可能都知道,我非常非常關注這一塊的東西。
上個月GPT-image-2剛上線的時候,我寫過一篇文章,叫
那篇文章里我說了一個判斷,就是當造假的成本趨近于零,且沒有有效的識別手段的時候,信任的成本就趨近于無窮大。
然后過去其實還寫過一些這樣的社會現象,比如去年雙十一寫的
很多的商家,可能萬萬沒想到,現在的薅羊毛的買家,會惡心到,直接用AI來P圖,然后發一張殘次品的圖片過去,跟買家申請僅退款。
比如這個。
![]()
商家放大一看。
一臉懵逼的發現,哥們甚至水印都忘了P掉。
![]()
有商家就一臉懵逼的收到了鞋子的退款。
![]()
然后點開詳情圖一看。
得,又是一個忘記裁掉水印的。
![]()
商家直接飛龍騎臉問,是豆包弄的?
![]()
對方還振振有詞:
![]()
這都是去年雙十一,發生的真實案例。
而且要知道,這都是去年的技術了,如果是今年的GPT-image-2,那個造假的逼真程度,不要說很多的普通用戶,我坦誠的講,我自己看了這么多圖片,我自己也生了這么多圖片,但是我也沒有任何信心,可以確切的評估一張圖是不是AI造假的。
就比如這種東西。
![]()
所以,當OpenAI和Google這兩死對頭決定合作,選擇把Google SynthID圖像水印也引入到GPT-image-2里面去,然后推出一個OpenAI自己做的AI圖片檢測工具的時候,我覺得未來的互聯網黑暗森林,還是有救的。
網站在此:
https://openai.com/zh-Hans-CN/research/verify/
![]()
無需登錄,直接把圖扔進去就可以了。
扔進去以后就會開始驗證。
![]()
大概等個幾秒鐘,就會出來驗證結果。
![]()
并且我測試了一些常見方法,比如發送到微信里,重新保存,依然還是會被檢測出來。
甚至我直接局部截圖然后改掉格式,再發到微信里重新保存,再扔到檢測網站里,依然顯示還是由AI生成的。
![]()
小紅書上的帖子,我直接截屏扔進去,也可以識別出來。
![]()
同時,一些看著很離譜的像AI生成的真實照片,也不會被誤測。
比如這張照片。
![]()
看著就非常的像AI,但其實不是的。
這是蒙特利爾藝術團隊The Dorothy Project發起的名為Mission TARONI的藝術項目。藝術家與工程師一起合作,使用高空氣球將一個包裹著深藍色絲綢的人體模特送入了距離地面約33至35公里的平流層。
然后在設備艙上安裝了Insta360,全方位記錄下了這個藍色身影在黑色宇宙背景、地球弧線與白云之間共舞的震撼畫面。
你把這張圖扔到網站里面之后。
![]()
OpenAI為了保險,其實不太敢直接說這不是AI生成的,所以說的還是未檢測的OpenAI信號,目前也只判斷是不是OpenAI自家的GPT-image-2生成的。
我測試了把NanoBanana生成的圖片扔給OpenAI檢測,其實也會顯示未檢測到OpenAI信號。
![]()
只能在Gemini自己的產品里去檢測,才可以。
比如我還是直接局部截圖然后微信保存再扔過去,也是可以被Gemini檢測出來的。
![]()
所以大家手段其實都有,只是目前處于一個時代的進程中,老的圖像模型等等問題還是比較多,大家也還比較分散,沒有形成一個統一的集合體。
目前那個網站也是,只能驗證OpenAI自己生成的圖片,但OpenAI說了,后續會擴展到跨行業驗證,也就是說,其他AI公司生成的圖,只要也接入了同樣的標準,也能查。
![]()
我可能未來也會做一個公益的小東西,接入這些平臺,來幫大家進行遍歷檢測,不過會復雜一點,因為還需要考慮前幾代AI圖片模型的檢測。
不過在這個時代,未來C2PA元數據+Google SynthID水印的方式,確實幾乎可以讓絕大多數的AI圖片,無所遁形了,雖然還是有辦法去除,但是成本還是會比較高的。
目前的技術棧和架構大概是這樣的。
![]()
也給大家簡單科普一下C2PA元數據+Google SynthID水印這兩個名詞,到底是個啥東西。
首先是C2PA元數據。
這玩意的全稱叫Coalition for Content Provenance and Authenticity。
![]()
翻譯成人話就是內容來源和真實性聯盟。
它是一個跨行業的開放技術標準,2021年成立的,什么Adobe、微軟、Google、BBC、索尼、Intel這些公司都在里面。
它做的事情,用一句話概括就是,給每一張圖片發一張證明。
這個證明在技術上叫C2PA Manifest,翻譯過來的話,可能清單的意思稍微準確一點。
這個清單里面,一共放了三層數據。
第一層叫Assertions,這是一組關于這張圖的聲明,比如「這張圖是由ChatGPT生成的」「生成時間是2026年5月19日」「使用的模型是gpt-image-2」等等。
當然如果是AI的就是上面那些,如果是相機拍的照片,Assertions里面就會是「這張圖是Nikon Z9拍攝的」「GPS坐標是xxx」「光圈f/2.8快門1/500」這些信息。
第二層叫Claim,就是把上面這些玩意打包在一起,形成了一個完整的聲明。
第三層叫Claim Signature,大概就是簽名的意思,這一步會用生成這張圖的那個軟件或硬件的私鑰,對整個聲明進行加密簽名。同時會對圖片本身做一次哈希運算,把圖片內容和清單綁在一塊。
這個簽名其實就是防造假,如果有人事后篡改了圖片的哪怕一個像素,哈希值就對不上了,驗證的時候就會報錯。
然后這整個清單會被打包成一個叫JUMBF的容器格式,直接嵌入到圖片文件里面,你用肉眼看這張圖,什么都看不出來,但是用C2PA的驗證工具打開,就可以看到所有的過去的一些信息了。
![]()
大概就是這樣,這套東西OpenAI從2024年就自己在開始做了,最早是給DALLE 3加的,后來給Sora也加上了,這次的升級是,OpenAI正式成為了C2PA的合規生成器產品,也就是說,其他平臺可以標準化地讀取、保留、傳遞OpenAI附加在圖片上的這些加密元數據了。
![]()
而且其實不只是AI公司在搞這個,相機廠商也在搞。
Leica的M11-P,2023年就成為了全世界第一臺支持C2PA的量產相機。
![]()
你拿這臺相機拍一張照片,快門按下的那一刻,相機就會自動往JPEG文件里嵌一個C2PA清單,用Leica自己的證書簽名。Nikon的Z9和Z8也在2024年通過固件更新加了C2PA。
再后來Sony、Canon啥的也都跟進了,Google的Pixel 10甚至是第一款默認給所有照片都打C2PA簽名的消費級手機,用的是Titan M2安全芯片的硬件級密鑰。
未來大概率就會形成了一個雙向的體系,AI生成的圖有標簽,真實拍攝的照片也有標簽,截圖其實也可以有標簽,這些的溯源,我感覺還是會有必要的。
因為現在去除C2PA還是比較簡單的,但是篡改很難,所以如果未來的世界,一切的內容都有C2PA,那其實反而是,誰沒有標簽誰尷尬。
不過那畢竟是未來,在這個階段,單獨的C2PA還是不夠的,所以OpenAI這次才原則跟Google合作,把SynthID也引入進來了。
SynthID是Google DeepMind搞的一個技術,2023年就有了,但一直在Google自己的體系里用。這次Google I/O上,Pichai就宣布了,SynthID要擴展到Google搜索和Chrome瀏覽器里,而且,OpenAI、Nvidia、Kakao、ElevenLabs等等,都要接入。
![]()
如果非要用一個比喻去來說C2PA和SynthID的區別,那我覺得就是,C2PA是給你貼了個外部標簽,SynthID是直接往你的DNA里直接寫東西。
SynthID 會在 AI 生成的圖像(或視頻片段)中添加一個不可見的數字水印這個水印不會改變圖像或視頻的質量。
它會在內容創建的瞬間添加,設計上能夠抵抗裁剪、添加濾鏡、更改幀率或有損壓縮等修改。
整個工作原理其實非常的硬核,我盡可能簡單描述一下。
就是當你在AI生成圖片的那一刻,會有一個嵌入器開始工作。它會在圖像的頻率分量和顏色通道上做極其細微的調整,調整的幅度在人眼感知的閾值之下,你肉眼看到的圖和沒有水印的圖,完全一模一樣。
但這些調整在數學上是有意義的,它們構成了一種分布在整張圖上的隱形簽名。
![]()
關鍵在于這個簽名的分布方式。它不是像傳統水印那樣只是集中在某個角落或者某一塊區域,會彌散在整張圖片的每一個部分。
所以你裁剪掉任何一個區域,剩下的部分依然包含足夠的信號。你壓縮、加濾鏡、調色、旋轉、截圖、轉格式,水印都還在。
然后會有一個對應的檢測器來專門識別這些隱形的簽名,非常的準。
而且他們之前還發過一個用SynthID來給AI生成的文字打水印的論文,不過比較早了,2024年。
![]()
之前我就在那個黑暗森林文章里面提過,SynthID一直是我認為最好的AI檢測效果的方式,不過之前最大問題就是只有Google他們自己玩。
現在,OpenAI帶頭表率,加入生態,我覺得這個信號本身,就是一個非常重要的事。
未來可以預期到,有越來越多的廠商,會加入這個生態里面去,因為你只要做多模態,你就逃不開內容追溯的問題。
最后,我想用OpenAI在Blog中說的話來結尾。
沒有任何單一的內容溯源技術能夠孤軍奮戰。
同樣的,整個互聯網的生態,在AI的沖擊之下。
也沒有任何單一的公司,能夠孤軍奮戰。
OpenAI和Google今天做了一個好的表率。
接下來,就看其他人了。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.