![]()
AI專(zhuān)屬顧問(wèn)、私人專(zhuān)家團(tuán)……類(lèi)似說(shuō)法的產(chǎn)品,大家可能聽(tīng)過(guò)不少。
但總是覺(jué)得,很多所謂的AI專(zhuān)家,還是不夠?qū)>⒉粔蛴行袆?dòng)力。
像AI版趙括,擅長(zhǎng)紙上談兵。
回答看起來(lái)洋洋灑灑,實(shí)際還是豆包型人格。
說(shuō)它有用吧,看到答案后,只會(huì)若有所得,不知道接著干啥。
近期我對(duì)Agent的印象,因?yàn)橐粋€(gè)叫OmniWork的產(chǎn)品,有了新的改觀。
比起單一的專(zhuān)家,它更像個(gè)OS系統(tǒng),一個(gè)能打配合、系統(tǒng)作戰(zhàn)的專(zhuān)家團(tuán)。
![]()
https://chat.omniwork.ai/
01做了一次短劇視頻,一鍵擁有專(zhuān)屬Skill
短劇很火,做AI短劇漫劇的產(chǎn)品也不少,但很少?gòu)摹叭恕钡慕嵌葋?lái)切入。
影視工作流與角色分工,除了可以被模型標(biāo)準(zhǔn)化的部分,剩下的,還是非常依賴(lài)于專(zhuān)家的審美把關(guān)。
大部分視頻AI產(chǎn)品,承擔(dān)的更偏視覺(jué)總監(jiān)、攝像、剪輯制作的職能,但是在導(dǎo)演、制片、音樂(lè)等等角色上,總有局限性。
![]()
OmniWork在專(zhuān)家角色上,延展性很強(qiáng)。
除了自帶的導(dǎo)演、制片人,還可以自己創(chuàng)建新英雄,用更垂直細(xì)分的專(zhuān)業(yè)形象,來(lái)滿(mǎn)足差異化的需求。
昨晚凌晨,我坐在電腦前,把OmniWork生成的這個(gè)短劇demo看了好幾遍。
不是因?yàn)樗缓茫∏∠喾矗撬玫米屛矣悬c(diǎn)恍惚。從畫(huà)面動(dòng)態(tài)到音樂(lè),都很能打。
十分鐘前,我往OmniWork里扔了一個(gè)想法:一個(gè)關(guān)于都市男女互換身體的短劇概念。
然后我去倒了杯水,刷了會(huì)兒朋友圈回來(lái)發(fā)現(xiàn)它已經(jīng)給出了完整的三集劇本框架、分鏡表、角色設(shè)定圖,甚至連第一場(chǎng)戲的粗剪視頻都渲染好了。
![]()
現(xiàn)實(shí)把腳本情節(jié),分劇集、分片段,跟我確認(rèn)好。
然后給出了視覺(jué)風(fēng)格的參考,以及音樂(lè)相關(guān)的下一步建議。
![]()
隨便選一幀圖拿出來(lái),都是不錯(cuò)的水準(zhǔn)。
幾位專(zhuān)家的配合也很有意思。
有臨時(shí)專(zhuān)家做外援,參與支持,也有已經(jīng)召喚的導(dǎo)演專(zhuān)家出謀劃策,還有視頻專(zhuān)家落地把片子最終做出來(lái)。
很多產(chǎn)品因?yàn)锳I,都像是知乎上的大神,談天說(shuō)地?zé)o所不知。
但OmniWork里給我的感覺(jué)是真懂,雖然預(yù)設(shè)的專(zhuān)家數(shù)量不算非常多,但單個(gè)專(zhuān)家的數(shù)據(jù),很豐富優(yōu)質(zhì),屬于能說(shuō)出來(lái)行業(yè)細(xì)節(jié)和水下信息的那種。
再一個(gè),除了能說(shuō),還得能做到,最終目標(biāo)還是交付結(jié)果。
好比是諸葛亮和關(guān)羽張飛合體,有勇有謀還能打。
完成一個(gè)任務(wù)后,彈出提示:可以把任務(wù)一鍵封裝成Skill:科幻劇制作人。
![]()
點(diǎn)一下,專(zhuān)家們自己開(kāi)始行動(dòng),挺容易上手的。
科幻題材里需要的想象力、科幻閱讀量、科學(xué)題材等等,這些能力按照一個(gè)創(chuàng)作者真實(shí)的工作流,系統(tǒng)性地組織起來(lái)。
OmniWork扮演的,像是行政總廚的角色,也像公司里的PMO、大管家。
![]()
做影視、做AI短劇的朋友,如果試了OmniWork,相信會(huì)得到不少啟發(fā)。
多擁有幾個(gè)影視專(zhuān)家,再多幾個(gè)隨時(shí)可調(diào)用的影視技能,用起來(lái),挺香的。
02當(dāng)想要更好的BGM,結(jié)果有了音樂(lè)專(zhuān)家團(tuán)
很多人對(duì)AI音樂(lè)生成的認(rèn)知,還停留在輸入一段描述,出來(lái)一段還不錯(cuò)的背景音樂(lè)。
市面上大多數(shù)工具,也確實(shí)就停在這里了。
OmniWork的音樂(lè)生成,因?yàn)閷?zhuān)家角色的存在,可以和其他場(chǎng)景任意組合。
比如做一個(gè)PPT,可以配套變成有聲版;做一個(gè)網(wǎng)頁(yè),也可以讓音樂(lè)注入靈魂;做視頻就更不用說(shuō)了,甚至因?yàn)橐魳?lè)的高匹配度,讓我覺(jué)得有了「音樂(lè)短劇」這樣一個(gè)細(xì)分領(lǐng)域的機(jī)會(huì)。
我給OmniWork的一個(gè)任務(wù)是:生成一首針對(duì)職場(chǎng)焦慮人群的療愈音樂(lè),時(shí)長(zhǎng)三分鐘左右,要有明確的呼吸引導(dǎo)節(jié)奏。
![]()
沒(méi)有給任何技術(shù)參數(shù),沒(méi)有說(shuō)調(diào)式、速度、配器,就像你去找一個(gè)音樂(lè)制作人談單子一樣,我只說(shuō)了我想要什么感覺(jué),給誰(shuí)用,大概多長(zhǎng)。
OmniWork調(diào)用了音樂(lè)療愈領(lǐng)域的Expert。
這個(gè)Expert不是通用的音樂(lè)生成模型,它的底層技能模塊里封裝了上海音樂(lè)學(xué)院那個(gè)實(shí)驗(yàn)室沉淀的一些專(zhuān)業(yè)框架——
比如療愈音樂(lè)中,432Hz頻率通常用于深度放松,60拍左右的速度能匹配安靜狀態(tài)下的心率,調(diào)式上Lydian比Major更能制造一種溫和的上升感。
![]()
它給我的第一版方案里,不只是輸出了一段音頻文件。
它同時(shí)給了一份制作說(shuō)明文檔,里面標(biāo)注了:
主旋律用了哪幾個(gè)音階,為什么選這個(gè)速度,呼吸引導(dǎo)點(diǎn)安排在哪些小節(jié),甚至還有一個(gè)簡(jiǎn)單的波形圖示,標(biāo)注了動(dòng)態(tài)范圍的控制邏輯。
從旋律到歌詞,都會(huì)有更豐富的選擇。
![]()
![]()
我聽(tīng)完第一版,感覺(jué)前奏的進(jìn)入有點(diǎn)突兀,不夠漸進(jìn)。
我在對(duì)話里說(shuō),能不能把開(kāi)頭那段合成器鋪墊拉長(zhǎng)四小節(jié),用一個(gè)更柔和的濾波器切入。
三秒鐘后,它回了兩個(gè)字:好的。
然后它開(kāi)始重新生成。
這個(gè)過(guò)程中,它調(diào)用了上一個(gè)版本的項(xiàng)目記憶,記住了我之前對(duì)療愈場(chǎng)景的偏好設(shè)定,還主動(dòng)問(wèn)我是否需要同步生成一個(gè)簡(jiǎn)版的樂(lè)譜,方便后續(xù)如果要做真人演奏錄制時(shí)參考。
我當(dāng)時(shí)的真實(shí)感受是,這不像是跟一個(gè)工具對(duì)話,更像是跟一個(gè)靠譜的音樂(lè)制作助理溝通。
他知道我在說(shuō)什么,也知道他自己在做什么,甚至能預(yù)判我下一步可能需要什么。
最終交付的成品,音質(zhì)、結(jié)構(gòu)、情緒曲線,放在任何一個(gè)療愈歌單里都不會(huì)違和。
但真正讓我在意的不是結(jié)果,是那個(gè)過(guò)程。
它沒(méi)有讓我去學(xué)任何專(zhuān)業(yè)術(shù)語(yǔ),沒(méi)有讓我去調(diào)任何參數(shù),我只需要說(shuō)我的需求,它用它的專(zhuān)業(yè)知識(shí)來(lái)落地。
這就是專(zhuān)家驅(qū)動(dòng)和通用模型的根本區(qū)別。
通用模型是,你懂什么,它幫你加速。專(zhuān)家模型是,你不懂什么,它替你搞定。
03從策劃到上線,一個(gè)小游戲水靈靈做好了
一個(gè)HTML5小游戲,能交互的那種,能做嗎?
我是一個(gè)寫(xiě)過(guò)代碼的人,我知道一個(gè)小游戲從想法到能玩,中間要跨過(guò)多少坑。策劃、美術(shù)、前端、測(cè)試,正常來(lái)說(shuō)三到五個(gè)人是最低配置。
我在OmniWork里創(chuàng)建了一個(gè)新的Expert Team,選了游戲策劃、前端開(kāi)發(fā)、美術(shù)資產(chǎn)三個(gè)Expert,給了一個(gè)共享目標(biāo):
![]()
我想做一款點(diǎn)擊收集類(lèi)的輕量小游戲,主題是太空廢品回收員,玩家控制一艘小飛船,在規(guī)定時(shí)間內(nèi)收集不同種類(lèi)的太空垃圾,每種垃圾有不同分值。
![]()
然后我就看著四位專(zhuān)家,開(kāi)始在同一個(gè)工作區(qū)里各自推進(jìn),同時(shí)彼此同步狀態(tài)。
美術(shù)資產(chǎn)Expert同步開(kāi)始出圖。角色立繪、飛船造型、不同類(lèi)型的太空垃圾圖標(biāo)、UI按鈕、背景圖,每出一批資源,就自動(dòng)提交到共享工作區(qū),前端Expert那邊可以直接調(diào)用。
游戲策劃Expert先給出了一個(gè)完整的游戲設(shè)計(jì)文檔,包括世界觀簡(jiǎn)述、核心循環(huán)、分值體系、難度曲線、操作說(shuō)明文檔里甚至標(biāo)注了哪些設(shè)計(jì)決策會(huì)影響前端開(kāi)發(fā)的工作量,哪些美術(shù)資源需要優(yōu)先產(chǎn)出。
前端開(kāi)發(fā)Expert拿到策劃文檔后,開(kāi)始在虛擬執(zhí)行環(huán)境里搭建項(xiàng)目框架。
它選擇了HTML5加原生JavaScript的方案,沒(méi)用任何重型框架,因?yàn)槟繕?biāo)是輕量、跨平臺(tái)、加載快。它自己劃分了sprint計(jì)劃,先搞定核心玩法循環(huán),再加UI和計(jì)分系統(tǒng),最后做動(dòng)效和音效集成。
![]()
我全程幾乎沒(méi)插手。
只是在幾個(gè)關(guān)鍵節(jié)點(diǎn)給出了方向性的意見(jiàn),比如我覺(jué)得初始難度偏高,玩家可能還沒(méi)上手就死了,需要調(diào)整垃圾的生成頻率和飛船的碰撞體積。
整個(gè)項(xiàng)目從啟動(dòng)到輸出一個(gè)可玩的HTML文件,用了大概十分鐘。
![]()
期間我去開(kāi)了個(gè)電話會(huì),回來(lái)發(fā)現(xiàn)它還順手幫我寫(xiě)了一個(gè)簡(jiǎn)單的游戲說(shuō)明彈窗,因?yàn)榍耙粋€(gè)版本測(cè)試時(shí)發(fā)現(xiàn)用戶(hù)進(jìn)入游戲后不知道該點(diǎn)什么。
然后又生成了一個(gè)改良版本,更賽博朋克的風(fēng)格。
我打開(kāi)那個(gè)HTML文件,在瀏覽器里跑了一下。
![]()
核心玩法成立,畫(huà)面風(fēng)格統(tǒng)一,音效雖然簡(jiǎn)單但跟主題契合,甚至還有一個(gè)本地排行榜功能,記錄玩家五次最高分。
雖然沒(méi)到能上Steam商業(yè)發(fā)行的級(jí)別,但作為一個(gè)驗(yàn)證demo,一個(gè)十分鐘的完整交付,還是很讓人開(kāi)心的。
整個(gè)過(guò)程里,我沒(méi)有寫(xiě)一行代碼,沒(méi)有畫(huà)一張圖,還能反向教我不少關(guān)于做游戲的經(jīng)驗(yàn)、流程。
我只是說(shuō)出我想做一個(gè)什么樣的游戲,然后看著一支AI團(tuán)隊(duì)把它搭起來(lái)。
像是給阿斗,配上了最牛的輔助團(tuán)。
04AgentOS級(jí)體驗(yàn)的背后設(shè)計(jì)
我還設(shè)置了一個(gè)Autowork任務(wù):
連續(xù)一周,每天早上八點(diǎn),自動(dòng)追蹤小紅書(shū)上AI視頻、AI影視、AI短劇、AI視覺(jué)、AI審美相關(guān)的熱門(mén)筆記,收集點(diǎn)贊過(guò)五百的爆款內(nèi)容,分析它們的選題方向、標(biāo)題公式、配圖風(fēng)格,每天下午六點(diǎn)前生成一份簡(jiǎn)報(bào),供我參考做自己的內(nèi)容規(guī)劃。
設(shè)置這個(gè)任務(wù)大概花了我兩分鐘。
![]()
然后我就把它忘了。
第一天下午六點(diǎn),提示我有了一份簡(jiǎn)報(bào)。
里面有當(dāng)天最火的五篇筆記的鏈接、截圖、數(shù)據(jù),還有一份分析,總結(jié)了高互動(dòng)內(nèi)容的三類(lèi)選題方向和兩種主流的封面/配圖風(fēng)格。
![]()
第二天,簡(jiǎn)報(bào)里多了一個(gè)趨勢(shì)對(duì)比,把當(dāng)天的熱門(mén)選題跟前一天做了交叉,指出有一個(gè)關(guān)于AI生成商業(yè)產(chǎn)品圖的方向連續(xù)兩天熱度上漲。
第三天,它沒(méi)有只給我數(shù)據(jù),還主動(dòng)生成了三組可以參考的標(biāo)題文案和配圖方案,標(biāo)注了每組方案針對(duì)的目標(biāo)用戶(hù)和預(yù)期效果區(qū)間。
![]()
這就是Autowork的價(jià)值。
它不是等你來(lái)找它,而是按照你設(shè)定的規(guī)則和目標(biāo),持續(xù)在后臺(tái)運(yùn)行,主動(dòng)推進(jìn),定期交付。
傳統(tǒng)的AI工具是對(duì)話式的,你問(wèn)一句,它答一句。
你停下來(lái),它也停下來(lái)。但創(chuàng)作工作不是這樣的。一個(gè)好點(diǎn)子的誕生,往往需要持續(xù)的信息輸入、跨時(shí)間的聯(lián)想、某個(gè)時(shí)刻的突然觸發(fā)。
當(dāng)AI可以不需要你每步都參與就能持續(xù)工作時(shí),角色就從操作者,變成了管理者。
終于可以,我只用關(guān)心,它最終有沒(méi)有把你要的東西放在你桌上。
![]()
有幾個(gè)讓我覺(jué)得真正有技術(shù)含量的設(shè)計(jì):
首先一個(gè),持久記憶的三層結(jié)構(gòu),不是噱頭。
我在做音樂(lè)那個(gè)項(xiàng)目時(shí),中間隔了兩天去忙別的事,第三天回來(lái)繼續(xù),它還記得我之前偏好暗色調(diào)的視覺(jué)風(fēng)格,記得我上次要求過(guò)更漸進(jìn)的音樂(lè)開(kāi)場(chǎng)。
這種記憶不是簡(jiǎn)單的歷史記錄回放,而是在新任務(wù)啟動(dòng)時(shí)被動(dòng)態(tài)檢索、判斷相關(guān)性、然后融合進(jìn)當(dāng)前的推理過(guò)程。
再一個(gè),Skill的可復(fù)用設(shè)計(jì)也很聰明。
![]()
比如短劇分鏡拆解這個(gè)方法,原本是影視創(chuàng)作領(lǐng)域的專(zhuān)家經(jīng)驗(yàn),被封裝成一個(gè)Skill后,可以在不同的創(chuàng)作任務(wù)中被調(diào)用。這就意味著,使用這個(gè)產(chǎn)品的人越多,沉淀下來(lái)的專(zhuān)家經(jīng)驗(yàn)就越多,整個(gè)系統(tǒng)的能力邊界會(huì)不斷擴(kuò)展。
還有那個(gè)開(kāi)箱即用的執(zhí)行環(huán)境。
對(duì)非技術(shù)背景的創(chuàng)作者來(lái)說(shuō),不需要配置服務(wù)器、不需要裝Python環(huán)境、不需要解決依賴(lài)沖突,打開(kāi)網(wǎng)頁(yè)就能跑一個(gè)完整的游戲開(kāi)發(fā)項(xiàng)目,這種體驗(yàn)本身就是一種能力。
了解到,OmniWork的團(tuán)隊(duì),他們反復(fù)強(qiáng)調(diào)一個(gè)觀點(diǎn):
下一代創(chuàng)作軟件的核心不是更強(qiáng)的單點(diǎn)工具,而是能否圍繞真實(shí)創(chuàng)作流程,建立一套支持Agent長(zhǎng)程運(yùn)行、持續(xù)協(xié)作、穩(wěn)定交付的系統(tǒng)環(huán)境。
用了這段時(shí)間后,我覺(jué)得他們確實(shí)在往這個(gè)方向走,而且走得比大多數(shù)同行都遠(yuǎn)。
05
寫(xiě)到這里,我想從行業(yè)觀察者的角度,聊幾個(gè)更深的判斷。
第一,AI創(chuàng)作工具的競(jìng)爭(zhēng),正在從模型能力競(jìng)爭(zhēng)轉(zhuǎn)向流程能力競(jìng)爭(zhēng)。
接下來(lái),真正的分水嶺會(huì)是誰(shuí)能把模型和Agent能力,按照真實(shí)的工作流組織起來(lái),讓用戶(hù)不用學(xué)習(xí)新工具就能用AI完成完整任務(wù)。
第二,專(zhuān)家經(jīng)驗(yàn)的系統(tǒng)化是AI產(chǎn)品真正的護(hù)城河。
OmniWork跟上戲文化、上音實(shí)驗(yàn)室的合作,不是營(yíng)銷(xiāo)噱頭。
導(dǎo)演怎么組織鏡頭、音樂(lè)制作人怎么配置和聲進(jìn)行、游戲策劃怎么設(shè)計(jì)難度曲線,這些經(jīng)驗(yàn)在傳統(tǒng)模式下只能通過(guò)師徒制、工作坊、多年實(shí)踐來(lái)傳承。
當(dāng)這些經(jīng)驗(yàn)被結(jié)構(gòu)化、產(chǎn)品化、變成可調(diào)用的Skill時(shí),它就成了一個(gè)可復(fù)用的資產(chǎn)。
![]()
OmniWork的專(zhuān)家市場(chǎng)
第三,Agent OS的方向是對(duì)的,但執(zhí)行難度極高。
讓多個(gè)Agent協(xié)作完成一個(gè)復(fù)雜任務(wù),涉及任務(wù)拆解、資源調(diào)度、沖突消解、狀態(tài)同步、異常處理等一系列系統(tǒng)工程問(wèn)題。任何一個(gè)環(huán)節(jié)出問(wèn)題,整個(gè)協(xié)作就會(huì)崩潰。
OmniWork在這個(gè)方向上的探索,目前看來(lái)在影視、音樂(lè)、輕量游戲這幾個(gè)垂直領(lǐng)域已經(jīng)跑通了閉環(huán)。
但要做到更通用的創(chuàng)作Agent OS,還有大量工程優(yōu)化要做。
第四,這類(lèi)產(chǎn)品最終會(huì)重塑創(chuàng)作者的工作方式和行業(yè)結(jié)構(gòu)。
當(dāng)一個(gè)創(chuàng)作者可以靠AI團(tuán)隊(duì)完成原本需要三到五個(gè)人才能完成的工作時(shí),小型工作室、獨(dú)立創(chuàng)作者的生產(chǎn)力會(huì)被極大釋放。
一個(gè)人加一套工具,可能就能產(chǎn)出過(guò)去一個(gè)微型公司才能產(chǎn)出的內(nèi)容量。
最后說(shuō)點(diǎn)實(shí)在的。
![]()
OmniWork目前還在內(nèi)測(cè)階段,邀請(qǐng)碼制,官網(wǎng)是www.omniwork.ai。
我這有幾個(gè)邀請(qǐng)碼,想體驗(yàn)的朋友可以在評(píng)論區(qū)留言~
強(qiáng)烈建議:當(dāng)成你真金白銀雇的一個(gè)專(zhuān)家團(tuán)隊(duì)來(lái)用,給他們一個(gè)真實(shí)的任務(wù),看他們能交出什么樣的答卷。
也許你會(huì)突然發(fā)現(xiàn),自己在創(chuàng)作這件事上,居然這么有天賦。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.