![]()
最近一直在體驗(yàn)一個(gè)非常好玩的 AI 生圖模型——阿里前陣子發(fā)布的Qwen-Image-2.0,從年前玩到了年后,這對(duì)于日拋新鮮感的 AI 來(lái)說(shuō),已經(jīng)很神奇了。
我興奮的點(diǎn)在于,不僅是免費(fèi)好用,而是更懂中文和中文意境的模型能力。
現(xiàn)在這款模型已登陸千問(wèn) App,我總結(jié)了幾種超好玩的實(shí)用玩法,看完你也可以去 App 里復(fù)刻同款。
![]()
1、趣味信息圖一鍵生成
九宮格表情包,千問(wèn)App玩起來(lái)可謂是得心應(yīng)手,并且文字生成也不會(huì)亂碼。這是鯨哥做的貓女九宮格表情包,描白和文字讓這張圖看起來(lái)很靈動(dòng)。
![]()
去旅游發(fā)小紅書,想不想更有逼格。
現(xiàn)在也很簡(jiǎn)單,把你手機(jī)中多張照片上傳到千問(wèn)App,提示做一張索爾巴斯和安迪沃霍爾的藝術(shù)風(fēng)格旅游攻略圖,效果如下。
![]()
泛黃的紙張上面有多張照片,而且還蓋上了郵票戳,這要是自己動(dòng)手設(shè)計(jì)可得費(fèi)一番功夫。
想做美食攻略,千問(wèn)AI圖片的多步驟任務(wù)鏈的邏輯推理能力也很強(qiáng)。從步驟 1 分析牛肉特征 → 步驟 2 基于分析選 4 種小眾菜系變體 → 步驟 3 可視化為 2x2 網(wǎng)格場(chǎng)景。AI 必須確保邏輯連貫,不能遺忘前面的分析結(jié)果。
扮演全球美食推薦引擎 + 微縮廚房場(chǎng)景藝術(shù)家的角色。
步驟 1:分析、牛肉——風(fēng)味特征、文化淵源、質(zhì)地對(duì)比、辣度、感官體驗(yàn)。
步驟 2:從不太知名的菜系中選擇 4 種具有相似核心元素的獨(dú)特地域性變體。
步驟 3:一個(gè) 2x2 的網(wǎng)格。每個(gè)網(wǎng)格都是一個(gè)微型木制砧板作為“舞臺(tái)”,上面擺放著由超逼真可食用微縮模型搭建的成品菜肴的 3D 立體模型;來(lái)自該地區(qū)的微型廚師使用符合時(shí)代特征的工具進(jìn)行烹飪;蒸汽通過(guò)淡淡的干冰霧氣升騰;背景是該國(guó)的褪色地圖。每個(gè)網(wǎng)格下方都貼有標(biāo)明香料的標(biāo)簽,并寫明“國(guó)家 - 菜肴名稱”。
風(fēng)格:溫暖的廚房窗光,食物微距攝影,鮮艷的色彩,誘人的光澤和蒸汽。4k超高清
同時(shí)也在測(cè)試世界美食文化的深度知識(shí),視覺(jué)層面還要處理微縮 3D 場(chǎng)景。如果是美食博主,這生成的圖可以直接拿來(lái)當(dāng)封面了。
![]()
接著我做了一張“MacBook Pro 的品牌技術(shù)信息圖”。過(guò)去做產(chǎn)品宣傳,經(jīng)常要生成類似 Apple 官網(wǎng)規(guī)格圖或 iFixit 爆炸視圖的技術(shù)藍(lán)圖風(fēng)格。
MacBook Pro 寫實(shí)產(chǎn)品圖居中置于純白背景上,設(shè)備清晰銳利、金屬質(zhì)感真實(shí),呈現(xiàn) 1:1 實(shí)際比例。左上角顯示粗體標(biāo)題 ‘MacBook Pro’,左下角標(biāo)注 ‘SCALE 1:1’,所有文字使用極細(xì)黑色發(fā)絲字體(0.5pt 線寬),無(wú)襯線、無(wú)描邊。
設(shè)備表面疊加白色發(fā)絲細(xì)線(0.25pt)構(gòu)成的線條風(fēng)格技術(shù)注釋系統(tǒng):
- 關(guān)鍵組件標(biāo)簽:‘Liquid Retina XDR 顯示屏’、‘Apple M4 Pro 芯片’、‘鋁合金一體機(jī)身’、‘散熱系統(tǒng)(主動(dòng)風(fēng)扇+石墨烯導(dǎo)熱)’、‘三揚(yáng)聲器系統(tǒng)(支持空間音頻)’,每項(xiàng)均以細(xì)線引出并精準(zhǔn)指向?qū)?yīng)區(qū)域;
- 功能指示箭頭:白色細(xì)線箭頭分別指向:‘Thunderbolt 4 / USB-C 接口(3 個(gè))’、‘HDMI 端口’、‘SDXC 卡槽’、‘MagSafe 3 磁吸充電接口’、‘揚(yáng)聲器聲波方向’、‘Force Touch 觸控板’、‘Touch ID 電源鍵’;
- 材料說(shuō)明:‘100% 回收鋁合金機(jī)身’、‘Liquid Retina XDR mini-LED 顯示屏’、‘藍(lán)寶石水晶觸控 ID 傳感器’、‘MagSafe 3 磁吸充電接口’,全部帶細(xì)線引注至對(duì)應(yīng)物理位置;
- 測(cè)量標(biāo)注:三組精確尺寸數(shù)據(jù) ‘312.6 mm’(長(zhǎng))、‘221.2 mm’(寬)、‘15.5 mm’(厚),配細(xì)長(zhǎng)垂直/水平引導(dǎo)線,標(biāo)注于設(shè)備輪廓外側(cè)留白區(qū);
- 內(nèi)部爆炸視圖:沿設(shè)備右側(cè)垂直排列,自上而下分層展示:‘納米紋理可選顯示屏’、‘M4 Pro 芯片邏輯板’、‘可充電鋰聚合物電池’、‘鋁合金底盤’、‘鍵盤背光層’,各層間保留微小間隙,用白色細(xì)線連接示意裝配關(guān)系;
- 底部橫幅區(qū)含兩個(gè)原理圖:左側(cè)為‘電源與數(shù)據(jù)流向’方框圖——白色細(xì)線連接四個(gè)黑色方框:‘MagSafe → 電池 → M4 Pro → 顯示/端口’;右側(cè)為‘顯示屏分層截面圖’——垂直堆疊標(biāo)注:‘mini-LED 背光’、‘ProMotion 120Hz 驅(qū)動(dòng)層’、‘Liquid Retina XDR 面板’。整體構(gòu)圖平衡,設(shè)備為中心視覺(jué)錨點(diǎn),所有注釋嚴(yán)格對(duì)齊、間距均勻,留白充分。風(fēng)格為極客向技術(shù)藍(lán)圖美學(xué):零陰影、零漸變、零色彩,僅用純白背景 + 純黑文字 + 白色細(xì)線,強(qiáng)調(diào)工業(yè)精度與電子工程理性感。
輸出規(guī)格:1080×1080 像素,超高清,社交媒體優(yōu)化。
![]()
難點(diǎn)在于 極細(xì)線條的矢量級(jí)精度,同時(shí)精準(zhǔn)對(duì)齊指向設(shè)備的真實(shí)位置。現(xiàn)在把上面的提示詞輸入進(jìn)去,就能直接生成效果圖了。
現(xiàn)在AI生圖強(qiáng)大后,有一個(gè)很重要的場(chǎng)景就是科普教學(xué)。
對(duì)場(chǎng)景的還原、原理的解析以及文字的描述,以前中文繪畫模型都存在一點(diǎn)問(wèn)題,現(xiàn)在方便了,一次性出圖,文字也沒(méi)有亂碼。
![]()
這種 圖文并茂的知識(shí)卡片圖,國(guó)產(chǎn)模型目前做起來(lái)還是有難度,千問(wèn)是我體驗(yàn)下來(lái)直出效果最好的。
2、做復(fù)雜文字的梗圖Qwen-Image2.0可能是最好的中文生成模型,現(xiàn)在只要涉及中文生成的圖,我的第一反應(yīng)就是打開(kāi)千問(wèn) App。 1、霓虹夜景:
主角:一個(gè)20多歲的女性,短發(fā)染成銀灰色,穿著機(jī)能風(fēng)外套(黑色多口袋設(shè)計(jì),反光條細(xì)節(jié)),內(nèi)搭灰色連帽衫。她坐在城市天臺(tái)邊緣,雙腿懸空,手里拿著一杯透明杯裝的珍珠奶茶,珍珠沉在杯底。
界面元素:- 左上角小字:"CONNECTION: SECURE — ENCRYPTED"
- 中央地圖標(biāo)記:"TARGET DISTANCE: 470m"- 右側(cè)滾動(dòng)日志:
"03:47 AM — Signal detected"
"03:49 AM — Decoding..."
"03:52 AM — Access granted"
背景城市:遠(yuǎn)處的賽博朋克都市夜景,雨夜。建筑物的霓虹燈牌有大量文字:
- 左側(cè)高樓紅色霓虹:"龍虎樓 DRAGON TIGER LOUNGE — 24H"
- 中間大廈粉色閃爍:"『夜蝶』MIDNIGHT BUTTERFLY — Bar & Lounge"
- 右側(cè)矮樓藍(lán)燈:"CYBER-NET CAFé — 第二分店"
- 地面層某個(gè)小店黃燈招牌:"老李拉面 LAO LI NOODLES — 自1972年"
天臺(tái)細(xì)節(jié):- 主角坐的水泥欄桿上有涂鴉,用噴漆字體寫著:
- 左邊:"城市在沉睡 CITY SLEEPS"
- 右邊更小字體的簽名:"AKIRA 2140.03.15"
- 欄桿外側(cè)掛著一面破旗,邊緣有磨損和撕裂,上面印著模糊的文字:"RESISTANCE IS NOT A CRIME"光線和氛圍:- 雨絲斜著下,遠(yuǎn)處有雨霧- 霓虹燈的彩色光暈在雨霧中擴(kuò)散- 主角被遠(yuǎn)處的光從背后照亮,邊緣有逆光輪廓- 全息終端的藍(lán)光打在她臉上,形成冷暖對(duì)比- 珍珠奶茶的杯子有反光,珍珠可見(jiàn)顆粒感細(xì)節(jié)要求:- 所有霓虹燈牌文字清晰可讀,字體有風(fēng)格區(qū)分(中文書法、英文字體)- 全息UI的英文信息準(zhǔn)確,地圖標(biāo)記和日志有層次- 涂鴉噴漆字要有"噴上去"的質(zhì)感(邊緣擴(kuò)散、重疊感)- 破旗的撕裂邊緣、磨損紋理要真實(shí)- 主角外套的反光條細(xì)節(jié)、連帽衫的褶皺- 雨絲、光暈、水杯反光的光線邏輯統(tǒng)一
![]()
你看這張圖里有多少文字元素:全息 UI 界面的英文系統(tǒng)信息、霓虹燈招牌的中英文混合、欄桿上的涂鴉噴漆、甚至還有破旗上的標(biāo)語(yǔ)。而且每種文字的質(zhì)感 還 都不一樣 !
以前的 AI 遇到這種需求,要么文字全是亂碼,要么所有字都是一種字體、一種質(zhì)感,完全沒(méi)有細(xì)節(jié)區(qū)分。但Qwen-Image-2.0 做到了。
更牛的是,它還要同時(shí)處理賽博朋克風(fēng)格的光影:雨夜的霓虹光暈、全息界面的藍(lán)光、逆光的輪廓光、珍珠奶茶的反光……
2、創(chuàng)意融合:真實(shí)攝影 + 手繪涂鴉
過(guò)生日 想 做一張 祝福 或者 感悟 滿滿的 賀卡 , AI 能把 真實(shí)人像攝影和手繪涂鴉元素?zé)o縫融合 的能力 ,可以說(shuō)是非常實(shí)用了。
![]()
第一張是寫實(shí)風(fēng)格的生日派對(duì)場(chǎng)景,第二張則在寫實(shí)基礎(chǔ)上添加了手繪風(fēng)格的涂鴉裝飾(彩帶、愛(ài)心、星星等)。
![]()
難點(diǎn)在于兩種風(fēng)格的邊界處理——涂鴉不能看起來(lái)像是“貼上去”的,而要有手繪的隨意感,同時(shí)又要和真實(shí)場(chǎng)景的光影、透視保持一致。
3、中華文化傳播圖
如果你喜歡傳統(tǒng)文化,希望做一些懂中文意境的傳播圖。那現(xiàn)在千問(wèn)更適合你。
1、紅樓夢(mèng)的解讀圖
《紅樓夢(mèng)》人物關(guān)系知識(shí)繪本圖:豎版構(gòu)圖,古典工筆重彩風(fēng)格,融合清代仕女畫與現(xiàn)代信息圖解邏輯。畫面中央為大觀園立體微縮全景——朱欄曲徑、沁芳閘橋、瀟湘館竹影、蘅蕪苑藤蘿、怡紅院海棠,建筑細(xì)節(jié)考據(jù)清中期江南園林形制。核心人物以等身比例工筆繪制:賈寶玉(月白繡玉蘭直裰、金螭瓔珞)、林黛玉(淡青蹙煙眉、素綃垂珠釵、手持詩(shī)稿倚欄而立)、薛寶釵(蜜合色云肩褙子、金鎖隱現(xiàn)頸間)、王熙鳳(桃紅撒花襖配石青刻絲比甲、丹鳳眼含威帶笑);四人呈環(huán)形布局,衣袂間以金線勾勒的“情榜”卷軸連接,卷軸上以楷書題寫“金陵十二釵正冊(cè)”名錄。
外圍分八區(qū)輻射式展開(kāi)關(guān)系網(wǎng)絡(luò):
1. 賈府宗法脈絡(luò)(左側(cè)):樹(shù)狀圖呈現(xiàn)寧榮二府世系,用朱砂標(biāo)注“敕造榮國(guó)府”匾額,箭頭標(biāo)注“賈代善→賈赦/賈政→賈璉/賈寶玉/賈環(huán)”等關(guān)鍵承嗣關(guān)系; 2. 婚姻聯(lián)結(jié)(右上):以并蒂蓮紋飾連接賈王史薛四大家族,薛蟠持“豐年好大雪”扇面、史湘云佩金麒麟、王夫人戴赤金點(diǎn)翠頭面; 3. 丫鬟譜系(右下):晴雯撕扇、襲人捧藥、紫鵑執(zhí)燕窩盞、平兒理妝匣,各持象征物指向主子; 4. 詩(shī)詞交游(左上):大觀園詩(shī)社場(chǎng)景,黛玉題《葬花吟》卷軸、寶釵詠《詠絮詞》團(tuán)扇、湘云醉臥芍藥裀,詩(shī)句以泥金小楷浮于云氣之上; 5. 僧道讖語(yǔ)(頂部):警幻仙姑持薄命司冊(cè)籍,空空道人攜《石頭記》青埂峰石碑,太虛幻境對(duì)聯(lián)“假作真時(shí)真亦假”以篆書鐫刻于琉璃匾; 6. 現(xiàn)實(shí)暗線(底部):烏進(jìn)孝交租單、甄士隱葫蘆廟火災(zāi)、劉姥姥打秋風(fēng)等場(chǎng)景以淡墨界畫穿插于園林基座; 7. 意象符號(hào)(四角):風(fēng)月寶鑒(正面美人/背面骷髏)、通靈寶玉(鐫“莫失莫忘”)、冷香丸瓷罐、茄鲞食盒; 8. 時(shí)空注腳(邊框):外圈嵌十二時(shí)辰紋(對(duì)應(yīng)元春省親、黛玉葬花等關(guān)鍵情節(jié)時(shí)刻),內(nèi)圈環(huán)列二十四節(jié)氣花神(黛玉為芙蓉、寶釵為牡丹、湘云為海棠)。整體設(shè)色遵循《紅樓夢(mèng)》色彩哲學(xué):主調(diào)取自“軟煙羅”四色(雨過(guò)天青、秋香色、松綠、銀紅),人物膚色采用礦物顏料蛤粉提亮,背景暈染仿宋絹本肌理。畫面右下角鈐朱文印“大觀萬(wàn)象”,左上角題小楷“此圖據(jù)庚辰本脂批及清人繪《紅樓十二釵圖》考訂而成”。
![]()
《紅樓夢(mèng)》是咱們的文化瑰寶。其中復(fù)雜的人物關(guān)系、建筑布局、服飾細(xì)節(jié)、詩(shī)詞意象,都要求基于真實(shí)的紅學(xué)考據(jù)(庚辰本脂批、清人繪《紅樓十二釵圖》)。
![]()
這種對(duì)本土文化的深度理解,是目前絕大多數(shù)海外模型的盲區(qū)——它們可能知道“紅樓夢(mèng)”三個(gè)字,但根本不知道“沁芳閘橋”什么樣、“天青色”是什么色、“假作真時(shí)真亦假”是什么意思。
2、手辦圖升級(jí)
在Nano banana帶火的手辦圖前,給Qwen-Image-2.0加大難度。我們來(lái)看看千問(wèn)的 AI 文化理解能力 + 多字體排版 + 產(chǎn)品攝影質(zhì)感的綜合表現(xiàn)。
![]()
難點(diǎn)不在于“畫個(gè)卡通人物”,而在于整個(gè)場(chǎng)景的文化細(xì)節(jié)把控:
首先是字體的多樣性,各種不同的中文字體要同時(shí)呈現(xiàn),而且每種字體的氣質(zhì)也符合傳統(tǒng)書畫的審美。
最細(xì)節(jié)的是那個(gè)“真實(shí)可掃二維碼”——AI 生成的二維碼如果是亂碼就掃不出來(lái),但 Qwen-Image-2.0 能做到二維碼結(jié)構(gòu)正確(雖然不一定真的能掃,但視覺(jué)上是可識(shí)別的二維碼圖案)。
作為一個(gè)從 2022 年就開(kāi)始玩 AI 生圖的老用戶,我見(jiàn)證了 Stable Diffusion 的開(kāi)源爆發(fā)、Midjourney 的審美統(tǒng)治、DALL-E 的便捷……但 Qwen-Image-2.0 給我的感覺(jué)不太一樣。
它不像是在“追趕”國(guó)外模型,而是在做一件別人沒(méi)做好的事——真正理解中文、真正解決中文創(chuàng)作者的需求。
這可能就是國(guó)產(chǎn)AI的意義吧——不是一味地跟在別人后面跑,而是做出真正適合我們用的東西。
如果你還沒(méi)試過(guò),真的建議去千問(wèn)App上玩一玩,說(shuō)不定就真香了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.