網易首頁 > 網易號 > 正文 申請入駐

慢一點、深一點|藏師傅帶你看清 Gemini3 真實實力

0
分享至

從昨晚到早上大家應該看了很多 Gemini 3 的相關信息了,藏師傅這里就不廢話了。

簡單說一下它有多強,從測試基準來看直接在幾乎所有基準上都達到了 SOTA,同時相當一部分大幅領先第二名,當然除了 SWE-Bench 這個。

用來驗證 AI 是否脫離了“概率模仿”并開始產生“真正思考”的測試集 ARC-AGI v2 的得分上,甚至超過了現在最強模型的兩倍以上,看看 Gemini 3 孤零零在的位置。

從昨晚發布開始我就用 Gemini 3 做了相當多的測試。

同時測試內容依舊秉承藏師傅一貫的觀點,除了測試能力以外也盡可能都是對大家有用的。

我也會開放這些提示詞,由于谷歌一貫的財大氣粗,所以你幾乎在 AI Studio 和谷歌新發布的 AI IDE Antigravity上可以免費用 Gemini 3,只有你自己的看法才是最客觀的,建議多試試。

Gemini 剛發布的時候我最關注的還是多模態的理解能力,畢竟這個一直是谷歌的看家本事,先拿了兩個視頻試了一下。

第一個是 AI 藝術家 852話 做的 AI MV 視頻,里面有相當多的快閃效果,分鏡變化也很頻繁,非常適合用來分析模型對于視頻細節的分析能力。

提示詞是:幫我詳細分析這個視頻的每個分鏡內容,確保我可以讓設計師復刻它

可以看到他幾乎按每秒鐘說了每個動畫效果表現的細節和畫面主體內容,前面加上了總的風格描述,最后加上了如果要用 AE 做的話用哪些插件才行,非常細了。

接下來剛好要發谷歌新發布的 AI IDE 的介紹,索性直接把他們的宣傳視頻扔給了 Gemini 3,讓他幫我總結。

整體非常有條理,產品的核心定位、宣傳主題以及產品的詳細功能都分析到了,我直接就發了,結果數據還行。

提示詞為:幫我詳細總結視頻內容,介紹這個產品。

然后就來到了我們的重頭戲,編碼能力上,現在 AI Studio 里面的 Build 模式是真的頂,居然生成的網頁也可以直接調用谷歌所有 AI 能力。

于是就想能不能讓他幫我直接實現一個設計 Agent 產品,可以幫我思考設計方案,完善之后自己寫提示詞作圖。

提示詞:幫我實現一個功能完整的視頻和圖片Agent 平臺,支持自主完成圖像編輯和設計任務

沒想到真的可以,支持對話,他詳細詢問你的需求,然后幫你用 Nano 生成設計圖,真的一句話一次就搞定了,我甚至沒說什么是設計 Agent 以及應該如何實現這些能力。

這個 Logo 設計圖和基于 Logo 設計的月餅包裝袋都是它幫忙設計的,以前哪敢想啊,朋友們,需求和實現方案都不管,一句話需求,說句不好聽的,實習生肯定搞不定。

然后我們來試一下 Gemini 3 的設計稿還原能力。

我找了一張自己收藏夾里相對復雜的設計圖,里面細節挺多的,讓他完美還原這個設計稿,圖片可以用占位圖。

沒想到直出效果這么好,尤其是頭部這部分的排版細節,比如字號、字體顏色以及行間距等。

而且右邊那本書他找不到圖片,直接自己用代碼寫了一本,還補全了設計稿中不存在的的內容。

昨天有朋友說,這個細節還是有問題,我還開玩笑說,沒 AI 的時候一些大廠程序員拿著 figma 設計稿第一版能做到這個水平,我就已經燒高香了。

然后我就想,圖片 Agent 做了,那要不整一個視頻 Agent?

但是 AI Studio 里面沒有內置 Veo 3.1 視頻模型,于是我就到 Youware 用 Gemini 3 試了一下,也是簡單說了一下。

提示詞:幫我做一個設計 Agent 網頁工具,它可以幫我自動地迭代和優化,并且生成設計圖和設計視頻,調用所有相關的設計 AI API。

第一次他生成的視頻只有一個分鏡,于是又讓他加了多個分鏡編排的能力,讓他調用 LLM 生成提示詞和劇本。

然后搞定了,真離譜啊,選擇故事模式后他會自己生成劇本以及每個分鏡的提示詞然后調用 Veo 生成多段視頻。

然后我才反應過來,我這不是做了一個 Krea 那種 AI 聚合應用嗎,基本功能都有了,于是直接把 Krea 的界面截圖扔給他,連界面也復刻了,哈哈。

早上起來刷到一個,那種宣傳產品功能的用 AE 做的快閃動畫,然后就想這里面都是前端界面的元素嗎,能不能讓 Gemini 3 用代碼給我整一個。

整理了一下提示詞之后,他還真的整了一個出來,現在會以之前非常流行的滾動敘事網頁的形式表現,如果你想做自己的產品網站的話可以參考這個提示詞,還是很吸睛的。

Gemini 3 滾動敘事網頁生成提示詞:

請你扮演一位擅長創意交互的前端開發專家。我要做一個類似 Apple 產品頁風格的“Scrollytelling(滾動敘事)”網頁 Demo。

技術棧要求:

使用 HTML、CSS 和 GSAP (GreenSock) 配合 ScrollTrigger 插件。

交互邏輯:

頁面高度要設置得很長(如 5000px),建立一個全屏固定的視口(Pinned Container)。用戶的滾動動作不移動頁面,而是作為進度條(Scrub: 1)直接控制整個動畫的時間軸播放。

視覺與動畫流程(請按順序實現以下 Timeline):

開場: 屏幕中心只有簡潔的文字 Slogan,隨著滾動,文字放大并漸隱消失。

UI 演示: 隨后,模擬“手機通知彈窗”和“郵件列表卡片”從不同方向平滑飛入屏幕中心。

堆疊特效: 繼續滾動,這些分散的卡片要通過 3D 變換,自動吸附堆疊在一起(Stacking Effect)。

高潮: 出現一個“Unsubscribe All”的按鈕,當滾動經過它時,堆疊的所有卡片瞬間向四周炸開/飛走(Explosion Effect)。

結尾: 露出最后的 Logo。

風格要求:

極簡主義、圓角卡片設計、陰影柔和、動畫曲線要非常有彈性(Elastic/Spring)。請直接給我可運行的完整代碼文件

從三秒開始的動畫真的很頂,這個3D 卡片的旋轉懸浮然后再排列整齊的動畫非常的流暢而且豐富。

而且美學表現也很強,標題的漸變色、描邊以及后面卡片的細節,你真的可以用這套邏輯讓 Gemini 幫你用前端寫一個宣傳視頻出來,這是一個很大的機會,可以填補目前的 AI 視頻模型做不了的部分。

上面的離譜嗎?還有更離譜的,早上看見朋友向陽喬木想用 Gemini 生成短劇點子,于是優化了一下,看看能不能讓 Gemini 3 直接生成互動式游戲。

沒想到在 AI Studio 里面簡單調整了兩次就搞定了,Gemini 3 會根據你提供的文本生成互動式游戲,很像 GalaGame 常見的形式。

區別就是里面所有的素材都是隨著劇情的推進實時生成的,包括:對話文案、語音對話、人物頭像、畫面背景以及章節信息。

上面這是個很好的機會,人人只要有好劇本會打字就可以做互動內容和互動游戲,再搭配蘋果前幾天給類似小程序這種產品松綁和降低分成,里面可能醞釀著一個新的頂級內容消費平臺的機會。

你用下面這個提示詞在 AI Studio 里面的 Build 模式可以直接生成類似游戲,記得在第四步把文案放進去,老板以后靠這個提示詞發財了,可千萬記得點我。

Gemini 3 互動漫劇生成提示詞:

Act as a World-Class Frontend Engineer and UI/UX Designer.

Create a "High-Fidelity Interactive Visual Novel" web application using React (es6 modules), Tailwind CSS, and the Google Gemini API (@google/genai).

1. Design Philosophy & UI Style (Crucial)

The UI must strictly follow a "Japanese Commercial Galgame (Visual Novel)" aesthetic.

  • Vibe: Dark Fantasy, Cyberpunk, Polish, High-End.
  • Art Style for AI Generation: Enforce "Japanese Celluloid Anime Style (賽洛魯/平涂)" for all generated images.
  • Dialogue Box: NOT a simple rectangle. It must feature:
    • A "Glassmorphism" background (dark, blurred).
    • Decorative Tech/Fantasy borders (double lines, glowing neon accents in Cyan/Gold).
    • A dedicated, stylized "Nameplate" attached to the top-left of the box.
    • A large, rectangular Character Avatar (3:4 ratio) on the left side with a decorative frame.
  • Typography: Clean, readable serif or sans-serif with typing writer effects.
  • Animations: Smooth fade-ins for backgrounds/characters, shake effects for intense scenes, flash effects for combat.
2. Core Features
  1. 1.Story Engine: Iterate through a predefined script (I will provide the story content below).
  2. 2.AI Image Generation (Gemini Nano/Flash):
    • Backgrounds: Automatically generate scene backgrounds based on the current plot location using gemini-2.5-flash-image.
    • Character Tachie (Portraits): Automatically generate character standees. Apply a "Card" style frame (rounded corners, inner shadow, border) so they look like polished assets, not raw photos.
    • Prompt Engineering: Automatically append "Japanese Celluloid Anime Style, masterpiece, flat color" to all image prompts to ensure consistency.
  3. 3.Text-to-Speech (TTS): Use the Web Speech API to read dialogue. Assign different pitch/rate to different characters (e.g., Deep/Slow for the Monster, Normal for the Protagonist).
  4. 4.Gemini Insight: A button to analyze the current scene's sentiment and lore using gemini-2.5-flash.
3. Data Structure
  • Use a constant file to store the Story Script.
  • Define Characters with properties: id, name, visualDescription (for AI generation), voicePitch, voiceRate.
  • Define Backgrounds with properties: type, visualDescription.
4. Story Content (The Novel)

Please parse the following novel content into the structured script.

[在此處粘貼你的小說正文內容]

5. Technical Requirements

  • Use process.env.API_KEY for Gemini.
  • Handle async image generation gracefully (show a "Generating..." loader in the UI).
  • Single file structure preferred or standard modular structure (App, components, services).
  • Ensure the layout is responsive but optimized for Landscape viewing.

Generate the complete code now.

最后是一個很好玩的案例,可以同時表現 Gemini 3 的多模態能力以及代碼能力,它可以直接從一張圖片幫你生成 3D 的體素圖像動畫,還原度很高。

提示詞:I have provided an image. Code a beautiful voxel art scene inspired by this image. Write threejs code as a single-page

剛好刷到一個很好看的賽博風格圣誕樹圖片就扔個 Gemini 3 了。

沒想到它這么懂,帶縮放動畫的星星、閃光特效和旋轉的點狀發光絲帶,給整個動畫增加了非常多的表現力。順便用這玩意提前祝大家圣誕快樂了。

好了這期內容就這樣了,希望這些玩法和測試能給你帶來一些啟發。

DeepMind 的人說今晚還有大的,不知道是不是昨天試的 Nano Banana Pro 模型,谷歌怕不是要熬死我們這幫人。

如果你覺得這些內容對你有幫助的話,可以幫我點個贊或者,也可以轉發??給你需要的朋友們,我們評論區見。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
爭議?19歲王鈺棟提前結束謝場+怒摔水瓶!5場0球后他5次情緒失控

爭議?19歲王鈺棟提前結束謝場+怒摔水瓶!5場0球后他5次情緒失控

我愛英超
2026-04-26 14:15:58
白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

爆角追蹤
2026-04-26 12:16:15
月入過萬!“崩老頭”登上熱搜,80后90后男性,成為年輕女性目標

月入過萬!“崩老頭”登上熱搜,80后90后男性,成為年輕女性目標

火山詩話
2026-04-26 15:18:10
太狠了!OpenClaw之父一夜屠光5000 Issue,GitHub服務器先跪了

太狠了!OpenClaw之父一夜屠光5000 Issue,GitHub服務器先跪了

新智元
2026-04-26 11:29:22
一場難看的1比0,能找到多少阿森納的爭冠希望?

一場難看的1比0,能找到多少阿森納的爭冠希望?

體壇周報
2026-04-26 16:47:23
伊朗最高領袖明確下令,霍爾木茲海峽突傳大消息!伊朗總統、革命衛隊發聲

伊朗最高領袖明確下令,霍爾木茲海峽突傳大消息!伊朗總統、革命衛隊發聲

每日經濟新聞
2026-04-26 14:16:05
真相大白!那臺拉缸的張雪820RR返廠,經拆解后本人公布故障原因

真相大白!那臺拉缸的張雪820RR返廠,經拆解后本人公布故障原因

一盅情懷
2026-04-26 15:32:03
掘金主帥:我不喜歡麥克丹尼爾斯的行為,但這就是他的為人

掘金主帥:我不喜歡麥克丹尼爾斯的行為,但這就是他的為人

懂球帝
2026-04-26 12:45:19
小米:李某華已被行拘

小米:李某華已被行拘

南方都市報
2026-04-26 12:01:47
10年前,易建聯花1000萬在洛杉磯買下豪宅,如今出售市值多少?

10年前,易建聯花1000萬在洛杉磯買下豪宅,如今出售市值多少?

阿庫財經
2026-04-24 14:26:45
色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

知識圈
2026-04-26 09:35:01
華為余承東:尊界新車價格在200萬左右

華為余承東:尊界新車價格在200萬左右

界面新聞
2026-04-26 13:08:56
當面亮劍!1.7萬聯軍三面圍堵,解放軍萬噸大驅直插呂宋島,寸步不讓

當面亮劍!1.7萬聯軍三面圍堵,解放軍萬噸大驅直插呂宋島,寸步不讓

頭條爆料007
2026-04-26 15:46:14
廣西一縣級人民醫院原院長收受900多萬元“好處費”,愛好攝影和機車,供應商全滿足;把患者當成牟利工具,最終被判刑14年6個月

廣西一縣級人民醫院原院長收受900多萬元“好處費”,愛好攝影和機車,供應商全滿足;把患者當成牟利工具,最終被判刑14年6個月

極目新聞
2026-04-26 17:34:27
伊朗動蕩:軍閥割據的前兆出現

伊朗動蕩:軍閥割據的前兆出現

高博新視野
2026-04-26 07:30:11
老外震驚!中國饅頭橫掃歐美!不是文化輸出,是中國供應鏈贏麻了

老外震驚!中國饅頭橫掃歐美!不是文化輸出,是中國供應鏈贏麻了

魔都姐姐雜談
2026-04-24 11:56:08
4個去中國化最徹底的國家,一個已全盤西化,一個正試圖恢復漢字

4個去中國化最徹底的國家,一個已全盤西化,一個正試圖恢復漢字

你是我心中最美星空
2026-04-26 07:15:09
戰與和的拉扯:美國無限反轉在消磨什么?日本擴軍狂飆想干什么?

戰與和的拉扯:美國無限反轉在消磨什么?日本擴軍狂飆想干什么?

上觀新聞
2026-04-25 18:49:05
特朗普內閣又一個女部長落馬,各種丑聞之丑令人作嘔……

特朗普內閣又一個女部長落馬,各種丑聞之丑令人作嘔……

新民周刊
2026-04-26 15:07:25
白宮晚宴槍擊案全網最全細節:特工疑與槍手互開數槍,特朗普在臺上十分淡定

白宮晚宴槍擊案全網最全細節:特工疑與槍手互開數槍,特朗普在臺上十分淡定

爆角追蹤
2026-04-26 10:29:13
2026-04-26 18:12:49
歸藏的AI工具箱 incentive-icons
歸藏的AI工具箱
關注人工智能、LLM 、 AI 圖像視頻和設計
294文章數 46關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

美國網民質疑:為什么先救萬斯

頭條要聞

美國網民質疑:為什么先救萬斯

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

中辦、國辦:加強新就業群體服務管理

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

教育
本地
旅游
親子
時尚

教育要聞

四年級數學:簡便計算,難住不少數學老師

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

旅游要聞

游客在山頂打架,景區又能怎么辦

親子要聞

給寶寶的輔食太精細,危害不是一般大,家長們早了解早安心

IU的臉,真的有自己的時間線

無障礙瀏覽 進入關懷版