无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

會寫字、懂排版、能分鏡:HiDream-O1-Image-1.5 全能圖像生成能力解析

0
分享至

近日,智象未來(HiDream.ai) 全新推出的商用版圖像生成模型 HiDream-O1-Image-1.5 再次實現 SOTA,在全球知名獨立 AI 模型評測與分析平臺 Artificial Analysis的文生圖榜單(Text to Image Leaderboard)上,一舉登上中國圖像生成模型第一,成為評分僅次于OpenAI的中國大模型公司,超越Google Nano Banana 2(Gemini 3.1 Flash Image Preview)、NVIDIA Cosmos3-Super-Text2Image 和字節跳動的Seedream 4.0等國內外大廠的主流圖像生成模型。



半個月前,智象未來 HiDream-O1 系列的開源模型 HiDream-O1-Image-Dev-2604 剛剛登頂文生圖榜單開源模型全球第一。數周之后,HiDream-O1-Image-1.5再次進入全球文生圖大模型榜單前三,連續登頂不僅印證了智象未來在圖像生成大模型上的硬核實力,更標志著其已在視覺生成大模型的角逐中穩居全球第一梯隊陣營。

Artificial Analysis 的 Text to Image Leaderboard 采用匿名對比、用戶投票和ELO動態排名機制,盡量減少品牌認知對評測結果的影響,更接近真實用戶在開放生成場景中的偏好判斷,在這一專業評測體系下,HiDream-O1-Image-1.5在超過4000 個樣本對比中取得1265 ELO。HiDream-O1-Image-1.5 的表現不僅體現了模型在圖像質量上的競爭力,也反映出其在語義遵循、復雜畫面生成、文字渲染和多主體控制等綜合能力上的提升。

HiDream-O1-Image-1.5 的再度 SOTA, 不只是中國領先大模型公司的又一次全球榜單領先,它更標志著智象未來在業內率先把創新的原生全模態架構Unified Transformer (UiT)從“技術驗證”推進到“生產驗證”,是 HiDream將底層架構優勢轉化為視覺生產力工具的關鍵一步:開源版本證明了像素級原生全模態架構可以在開放評測和開發者社區中跑通,HiDream-O1-Image-1.5 商用版本則進一步面向廣告營銷、品牌設計、電商視覺、游戲內容、影視分鏡、IP 創作等更高要求的商業場景,全面展示了強化的圖像質量、文字渲染、復雜排版、多主體一致性和視覺敘事能力。

接下來,真正值得關注的,是它在真實內容生產任務中的表現。

01 會寫字、懂排版、能分鏡,HiDream-O1-Image-1.5 展現全能圖像生成能力

1. 人像攝影生圖實例:攝影級畫質與多風格表達

在人像生圖場景中,HiDream-O1-Image-1.5 展現出穩定的攝影級畫質和多風格適配能力。從魔幻光影、雙人互動到人物特寫,模型在皮膚質感、服飾紋理、肢體關系和環境虛化等細節上表現自然;即使面對廣角、低機位、室內暖光等復雜構圖,也能保持人物比例、空間透視與畫面敘事的協調。體現出面向商業人像、品牌視覺和影視分鏡等高要求場景的強交付能力。


2. 動物生圖實例:運動形態與自然環境的精細建模

在動物生圖場景中,HiDream-O1-Image-1.5 展現出對主體形態、運動狀態與自然環境的精細建模能力,在動物結構、皮毛質感、動態表現及復雜光照、水下折射等高難度畫面中保持真實感與視覺沖擊力,體現出面向自然影像、品牌視覺、游戲資產和創意內容生產等場景的生產級交付能力。


3. 自然風光生圖實例:空間與光影變化的精細捕捉

在自然生圖場景中,HiDream-O1-Image-1.5 展現出對大場景空間層次、光影變化與環境氛圍的精準控制能力,在雪山湖泊、沙漠駝隊、晶體洞穴等復雜地貌與多光源場景中保持縱深感、電影感和細節表現,體現出面向旅游視覺、影視概念圖、游戲場景和品牌傳播等復雜商用場景的穩定交付能力。


4. 多種藝術風格:精確的風格理解與視覺表達

在多風格藝術生成場景中,HiDream-O1-Image-1.5 展現出優秀的風格理解、語義遵循與視覺表達能力,可在日系插畫、動漫戰斗、卡通海報和國風武俠等風格間準確切換,并保持角色造型、構圖關系、動作節奏與畫面氛圍統一,同時在復雜姿態、動態特效和基礎文字渲染上具備較強穩定性。可為 IP 創作、漫畫分鏡、游戲美術、品牌創意視覺提供高效的生產支持。


5. 電商海報生圖實例:復雜畫面與文字信息無縫融合

在電商海報生成場景中,HiDream-O1-Image-1.5 展現出對商品主體、版式結構與文字信息的綜合把控能力,可針對不同品類快速匹配視覺風格,并自然融合商品、場景、裝飾元素與營銷文案;在中英文混排、多層級賣點和復雜排版任務中,仍能保持較高的文字可讀性、畫面完整度與商業質感,顯著提升廣告營銷、電商上新、社媒種草和品牌物料制作效率。


6. IP形象設計:多視角生成與角色一致性

在 IP 形象設計場景中,HiDream-O1-Image-1.5 展現出對角色設定、表情變化與多視角一致性的穩定控制能力,可圍繞同一角色生成多角度視圖和多種情緒表情,并保持五官、發型、服飾與整體風格統一,呈現豐富的性格與表現力,可顯著提升 IP 設定、角色三視圖、動畫前期、美術資產和品牌吉祥物開發的效率。


7. 多宮格/分鏡設計圖:穩定敘事理解與連續畫面生成

在多宮格與分鏡設計場景中,HiDream-O1-Image-1.5 展現出對連續敘事、畫面順序與信息層級的理解能力,可在工具流程、任務推進、兒童繪本和冒險故事等多畫面內容中生成邏輯連貫的分鏡畫面,并保持角色、場景與視覺風格統一;同時對宮格布局、編號、標題和關鍵文字具備較強組織能力,可為影視分鏡、漫畫創作、廣告腳本、教育內容和短視頻腳本視覺化提供高效支持。


8. 多層次復雜文字渲染能力:多語言,多結構的綜合生成能力

在多層次復雜文字渲染任務中,HiDream-O1-Image-1.5 展現出對多語言文本、信息結構與視覺場景的綜合生成能力,可將海報、計劃書、結構拆解圖、課堂白板、直播界面和數據看板等內容自然嵌入對應場景,并兼顧排版秩序、圖文關系與整體美感;面對中英文混排、數字公式、圖表信息和多級標題等復雜需求,仍能保持較好的可讀性與版面穩定性,拓展了其在廣告設計、辦公協作、電商詳情頁和教育培訓等場景的實用價值。


02 原生全模態進入生產驗證階段,HiDream-O1-Image-1.5持續放大UiT 架構優勢

HiDream-O1-Image-1.5 的表現,進一步證明了智象未來在原生全模態路線上的架構創新優勢和快速迭代能力,HiDream-O1 系列(8B 開源版、Pro 版到 1.5 商用版)已經形成清晰而高效的能力演進曲線。

傳統文生圖模型通常采用“文本編碼器 + VAE + DiT / 擴散模型”的模塊化路徑,其形態更像一棵不斷分叉生長的樹:文本有自己的 tokenizer,圖像和視頻有各自的 encoder / decoder,音頻、動作、空間關系也往往沿著不同路徑被處理,模塊之間需要多次轉換信息。在文字密集排版、UI 頁面、多主體生成、多參考圖控制、多分鏡敘事等復雜任務中,也更容易帶來細節損耗、語義錯位和結構不穩定。

HiDream-O1 原生全模態架構走的是另一條路線:真正的“原生全模態”,不是各個模態長大之后二次拼接,而是從原生初始階段就像“青梅竹馬”一般在模型底層水乳相融。HiDream-O1 的 Image系列模型剔除了傳統路徑中的 VAE 和獨立文本編碼器,將圖像像素、文本 Token、視頻體素以及音頻、動作、空間關系等原始信號映射進同一個共享 Token 空間,直接與同一套 UiT——像素級統一的 Unified Transformer 交互,在統一表征系統中完成理解、生成和推理。

以下為X平臺Artificial Analysis 官方賬號發布的一組對比效果圖:





這也是 HiDream-O1 能夠在復雜圖文融合、文字渲染、多主體一致性和分鏡敘事等任務中持續進階的關鍵。當所有模態在底層被真正打通,模型才有可能走向真正的“Any to Any”:任意輸入支持任意輸出。這不僅是圖像生成模型的能力升級,也是世界模型所需要的基礎能力——在統一架構中理解、生成并預測現實世界的不同狀態。HiDream-O1-Image-1.5 的快速進階,正是對原生全模態這一路線可擴展性的堅實驗證。

03 持續架構創新,構建原生全模態世界模型

智象未來始終認為,圖像是通向視頻生成和全模態世界建模的重要入口。一張圖像承載著現實世界某一時刻的主體、空間、材質、光影、文字和關系;只有穩定理解并生成這些狀態,模型才有可能進一步處理連續時間中的運動、因果、鏡頭和敘事。

HiDream-O1-Image-1.5強勢表現說明,基于像素級原生統一架構的路線,正在把圖像生成模型的競爭從“更大參數”和“更好看畫面”,推進到由架構能力、生產效率和工作流價值共同決定高度的新階段。它不僅提升了單圖生成效果,也為多圖一致性、分鏡生成、視頻首幀、圖像編輯乃至未來長視頻生成提供了更穩定的底層能力,進一步證明了中國大模型企業參與全球頂級打模型競爭的實力,也驗證了 UiT 原生統一架構作為下一代多模態模型堅實底座的可行性。

面向未來,智象將繼續沿著原生全模態技術路線推進模型迭代,加速圖像、視頻、動作等多模態能力的融合,推動生成式人工智能技術深入落地到內容創作、商業營銷、影視創作、游戲生產等全模態智能體的真實應用場景。從單張圖像生成的入口到連續世界建模,智象未來正在以持續的底層架構創新,構建下一代內容生產與智能交互的人工智能基礎設施。

歡迎通過以下鏈接體驗HiDream-O1-Image-1.5 :

https://vivago.ai/

https://hiharness.ai/

開源模型HiDream-O1-Image下載地址:

GitHub:https://github.com/HiDream-ai/HiDream-O1-Image

Huggingface:https://huggingface.co/HiDream-ai/HiDream-O1-Image

和Nano Banana 2對比

Prompt:一張高端中國白酒的奢華電商海報。正中央矗立著一個純凈、半透明的羊脂玉瓷瓶。在瓶身的曲面上直接浮雕著一首八句中文古詩:“昔人已乘黃鶴去,此地空余黃鶴樓。黃鶴一去不復返,白云千載空悠悠。晴川歷歷漢陽樹,芳草萋萋鸚鵡洲。日暮鄉關何處是?煙波江上使人愁。”雕刻的文字內部鑲嵌著精致、閃爍的金箔,正捕捉著光線。酒瓶放置在一塊粗糙的黑板巖上,半浸在清澈見底的淺水池中,水面蕩漾著柔和的同心漣漪。美麗的液體焦散光影和反光在瓶底跳躍。在深度虛化的背景中,有微型盆景松樹和薄霧。戲劇性的邊緣輪廓光,商業產品攝影。


Prompt: An adorable, candid photograph of a curious kitten exploring a lush, green garden, with oversized flowers and foliage creating a whimsical, fairy-tale atmosphere.


Prompt: 在一個燈光昏暗、煙霧彌漫的審訊室里,一張氣氛緊張的過肩鏡頭(OTS)電影劇照。在極度靠前的前景中,占據畫面左側三分之一的是偵探肩膀和側臉的嚴重失焦剪影。相機的焦點完全鎖定在背景中坐在金屬桌對面的嫌疑人身上。嫌疑人是一個疲憊的賽博格,擁有發光的紅色光學植入物,被頭頂搖晃的刺眼聚光燈照亮。極淺的景深在模糊的前景審訊者和細節銳利、滿頭大汗的嫌疑人面部之間形成了強烈的光學分離。85mm鏡頭,f/1.4大光圈。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
誰愿做第一個冤大頭?等全國都普及了我們再跟風

誰愿做第一個冤大頭?等全國都普及了我們再跟風

時光慢旅人
2026-06-10 01:45:31
“機密”文件竟在微信群中傳播!查明:檔案局服務人員發現涉密文件與兒子工作有關,遂拍照發家庭群,已被辭退;相關負責人被黨內嚴重警告

“機密”文件竟在微信群中傳播!查明:檔案局服務人員發現涉密文件與兒子工作有關,遂拍照發家庭群,已被辭退;相關負責人被黨內嚴重警告

揚子晚報
2026-06-03 07:37:03
特朗普騙了全世界?英媒爆料,美軍終于承認,在中方手里吃了大虧

特朗普騙了全世界?英媒爆料,美軍終于承認,在中方手里吃了大虧

老頭的傳奇色彩
2026-06-10 21:47:33
伊朗伊斯蘭革命衛隊:如果以色列的侵略行為再次發生 伊朗回應的范圍將更加廣泛

伊朗伊斯蘭革命衛隊:如果以色列的侵略行為再次發生 伊朗回應的范圍將更加廣泛

財聯社
2026-06-08 03:57:04
到了高中,你會發現:就算是重點高中,普通班能上985的也沒幾個

到了高中,你會發現:就算是重點高中,普通班能上985的也沒幾個

好爸育兒
2026-05-09 15:11:13
阿根廷小組賽就是苦戰 若小組第2大概率碰西班牙 需全力爭小組第1

阿根廷小組賽就是苦戰 若小組第2大概率碰西班牙 需全力爭小組第1

智道足球
2026-06-10 16:07:33
自費也被追責?多省開始查自費項目

自費也被追責?多省開始查自費項目

醫脈圈
2026-06-10 20:25:59
大清洗!利物浦官宣12人離隊,三大主力各尋新東家

大清洗!利物浦官宣12人離隊,三大主力各尋新東家

夜白侃球
2026-06-10 10:11:09
寧波舟山港重要人事變動,朱苗任黨委書記、董事長,江濤任黨委副書記、董事、總經理?|?港口圈

寧波舟山港重要人事變動,朱苗任黨委書記、董事長,江濤任黨委副書記、董事、總經理?|?港口圈

港口圈
2026-06-10 18:38:41
明后年,手握“定期存款”的家庭,或將面臨3大挑戰,太現實了

明后年,手握“定期存款”的家庭,或將面臨3大挑戰,太現實了

時尚的弄潮
2026-06-10 20:56:30
布萊德利·庫珀與吉吉周末約會出街,對視滿是寵溺氛圍感十足

布萊德利·庫珀與吉吉周末約會出街,對視滿是寵溺氛圍感十足

述家娛記
2026-06-10 15:29:18
今日!CCTV5直播NBA總決賽G4馬刺客戰尼克斯,文班亞馬繼續爆發?

今日!CCTV5直播NBA總決賽G4馬刺客戰尼克斯,文班亞馬繼續爆發?

晚池
2026-06-11 01:30:31
中東局勢大亂,川普和內塔尼亞胡演雙簧,穆杰塔巴臨時來客串?

中東局勢大亂,川普和內塔尼亞胡演雙簧,穆杰塔巴臨時來客串?

壹家言
2026-06-10 08:13:48
長期跑步的人,會失去“肉欲”?網友:經常跑的人,那方面都不行

長期跑步的人,會失去“肉欲”?網友:經常跑的人,那方面都不行

馬拉松跑步健身
2026-05-29 21:25:54
結婚一月丈夫裝癱瘓!趁妻子睡著,他用10厘米大鋼釘敲入她腦袋

結婚一月丈夫裝癱瘓!趁妻子睡著,他用10厘米大鋼釘敲入她腦袋

深夜探案館
2026-06-10 09:39:31
特斯拉高管抨擊雙層夾膠玻璃,雷軍回應:小米和特斯拉一樣

特斯拉高管抨擊雙層夾膠玻璃,雷軍回應:小米和特斯拉一樣

明鏡pro
2026-06-08 15:35:33
你在無意中發現別人什么秘密?網友爆料,電視劇都不敢這樣演

你在無意中發現別人什么秘密?網友爆料,電視劇都不敢這樣演

夜深愛雜談
2026-03-16 22:21:03
圖赫爾承認薩卡狀態不達標

圖赫爾承認薩卡狀態不達標

體壇周報
2026-06-10 14:56:12
歐足聯確認,巴黎獲兩個歐洲冠軍,29隊直通歐冠,13隊直通歐聯杯

歐足聯確認,巴黎獲兩個歐洲冠軍,29隊直通歐冠,13隊直通歐聯杯

嗨皮看球
2026-06-10 18:10:49
阿里高層罕見批評釘釘

阿里高層罕見批評釘釘

財天COVER
2026-06-10 21:10:25
2026-06-11 05:12:49
雷峰網 incentive-icons
雷峰網
關注智能與未來!
69694文章數 656144關注度
往期回顧 全部

科技要聞

史上最大IPO將至:1.8萬億美元的信仰豪賭

頭條要聞

杭州店主回應2188元天價面:一天200個電話不分晝夜罵

頭條要聞

杭州店主回應2188元天價面:一天200個電話不分晝夜罵

體育要聞

2026世界杯,我們看什么?

娛樂要聞

蒙淇淇發文開撕白鹿!輿論再次反轉

財經要聞

SpaceX IPO或誕生4000名百萬富翁

汽車要聞

埃安i60 530寧德時代版上市限時煥新價10.36萬起

態度原創

健康
教育
時尚
藝術
本地

粽子為何難消化?過量吃會怎么樣?

教育要聞

有這個AI!你再也不會被外面的志愿填報機構騙了

夏天別總穿黑色長褲,不如看看這些牛仔裙,減齡百搭又耐看

藝術要聞

驚嘆!最新一組超質感的國際人像攝影作品

本地新聞

世界杯還沒開始,蘇超已經火到爆梗

無障礙瀏覽 進入關懷版