无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

橫評DeepSeek、Claude、GPT、Kimi,結果大跌眼鏡…

0
分享至

大家好,我是冷逸。

最近,模型圈又卷起來了,A廠、O廠和鯨魚都陸續發布了新模型。特別是DeepSeek V4,一發布就沖上了各種熱搜。

好多人都在問DeepSeek V4到底在開源模型中是什么地位,又和閉源模型差多少呢?

于是,我花了400元,實測對比了幾款熱門大模型,分別是:公認的頂級閉源模型 Claude Opus 4.6、GPT-5.4和頂級開源模型Kimi K2.6、DeepSeek V4 Pro。


下面,我們基于實測結果,全面評估一下Kimi K2.6、DeepSeek-V4-Pro、Claude Opus 4.6以及GPT-5.4,看看如今的AI頂流之戰,誰才是真正的版本答案。


一手實測

1)前端:信息圖

先測一個我們最常用到的信息圖,主要看模型的信息提煉能力、視覺排版能力和內容完整度。

提示詞:提煉下面文字內容的核心關鍵點,創建一個HTML網頁。
文字內容:
{
這里是一段文字內容
}
網頁的設計要求如下:
1.視覺設計:采用{Magazine Layout}風格布局,{深色}主題色,營造現代高端氛圍。
2.字體與排版:
·使用超大字體或數字突出核心要點,中文采用大號粗體,強調視覺沖擊力。
·英文使用小號字體作為點綴,與中文形成比例反差,提升設計層次感。
3視覺元素:
·融入超大視覺元素(如標題、背景圖或裝飾)以突出重點,與小型元素形成強烈對比。
·使用簡潔的勾線風格圖形作為數據可視化或配圖元素,保持現代感和清晰度。
4.色彩與效果:運用高亮色(單色透明度漸變)營造科技感,每種高亮色獨立使用,避免不同高亮色之間的漸變混雜。
5.技術要求:引入專業圖標庫(如Font Awesome或Material Icons,通過CDN加載),避免使用emoji作為主要圖標。
6.內容要求:提煉內容關鍵要點,不忽略重要細節。

Claude Opus 4.6:


GPT-5.4:


DeepSeek-V4-Pro:


Kimi K2.6:


整體來看,Kimi K2.6和DeepSeek-V4-Pro在這個case中表現最好,內容提煉得到位,視覺效果也更具沖擊力,布局、配色和字體搭配有層次感。

Claude Opus 4.6內容總結得不錯,關鍵信息都沒有遺漏,但是視覺效果一般。GPT-5.4 也是同樣的問題。

2)前端:旅游網站

接下來,我們試試讓大模型看圖做設計,測測模型的圖片理解和審美遷移能力。

提示詞:你是一個有頂級審美的網頁設計專家,請根據"xxxx.jpg"這張圖的元素和風格,設計一個旅游網站。

Claude Opus 4.6:


GPT-5.4:


DeepSeek-V4-Pro:


Kimi K2.6:


這個項目完成最好的是Claude Opus 4.6和Kimi K2.6,對于我給出的圖片風格都有自己的理解,并且按照這個理解來設計視覺效果。

而DeepSeek-V4-Pro和GPT-5.4做的網頁,圖片都沒加載出來,前者是因為不支持多模態,但是后者應該不至于。

3)3D任務

3D任務主要看模型的前端能力,考驗模型對三維空間理解、Three.js組織能力和生成結果的穩定性。

提示詞:制作一個3D的雪山場景html,雪山中間有一個中式的寺廟,整體風格參考塞爾達曠野之息。

Claude Opus 4.6:


GPT-5.4:


DeepSeek-V4-Pro:


Kimi K2.6:

在這個任務中,GPT-5.4的表現不及格,一直卡在雪山頁面根本動不了;DeepSeek-V4-Pro倒是完成了任務,但是建模肉眼可見的粗糙。

Claude Opus 4.6和Kimi K2.6的建模就很不錯,3D場景創建的挺好,旋轉、縮放展示也都非常流暢,做到了提示詞要求的“雪山+日式寺廟+塞爾達風格”。

特別是Kimi K2.6,雪山、建筑、雪花粒子這些細節上的表現,真的太強了。

4)網站開發

需求是,讓模型基于我給到的模特照片,做一個攝影師作品集網站。

提示詞:我是拍模特廣告的攝影師,我的工作室叫「小逸攝影」,文件夾 xxx 放了一些模特圖片,給我生成一個高級審美、大師級別水準的攝影師作品集網站,用文件夾里的圖配上精美的講解。

Claude Opus 4.6:

GPT-5.4:


DeepSeek-V4-Pro:


Kimi K2.6:

Kimi K2.6生成的網頁實在是太棒了,在logo、文字配色、交互動畫這些UI細節上的表現非常強,說明是真的讀懂了圖像,完全是基于圖片內容和風格來生成的。

Claude Opus 4.6生成的頁面風格也非常有特點,但圖片的展示比較簡單。

至于DeepSeek-V4-Pro和GPT-5.4我只想說,為啥別人都有圖,你倆卻加載不出來。很明顯是遇到bug了,需要人工來修。

5)Skills任務

前兩天,我用跑了一個PPT,效果非常滿意。這次也讓所有模型都來對比一下。

提示詞:根據"xxxx.txt"的內容,用guizang-ppt-skill做一份10頁的PPT。

Claude Opus 4.6:


GPT-5.4:


DeepSeek-V4-Pro:


Kimi K2.6:


這個調用skill的任務,四個模型都調用成功了。做出來的效果也大差不差,沒啥大的區別,可能skill已經把路徑限制的很死,沒留太多模型自我發揮的余地。

6)Agent長程任務

任務,還是我們的老case,讓Claude Code做一個聯網搜索+word生成+skill調用+網站開發的復雜長程任務。

提示詞:聯網搜索、調研張雪機車的發展軌跡,盡量從權威信源獲取信息。首先,給我創建一份5000字的word調研報告。然后,調用qiaomu-knowledge-site-creator skill給這份報告創建一個知識學習網頁,頁面高級審美。

Claude Opus 4.6:



GPT-5.4:



DeepSeek-V4-Pro:



Kimi K2.6:



因為是長程任務,需要模型先后調用WebSearch、python生成word、skills和網站開發等工具能力,還包括網站上線前測試的chrome-devtools-mcp,所以這個長程任務,大家都消耗了很長的時間。

所幸結果,大家都完成了。

從生成的調研報告來看,Kimi K2.6是最好的(他們家的WebSearch能力一直就很強),其次是Claude Opus 4.6和DeepSeek-V4-Pro,最差的是 GPT-5.4,你好歹給我排版一下啊。

從生成的網站來看,GPT-5.4嘴上說調用skill成功,但是最后生成的東西完全跟 skill不符,其他三個都生成的中規中矩,Kimi K2.6在頁面美化上稍強一點。

7)費用情況

最后,我們來算一下Coding成本。

本期測評花費如下:

  • Claude Opus 4.6,16.4美刀;

  • GPT-5.4,22.8美刀;

  • Kimi K2.6,我用的是Coding Plan套餐,大概消耗里月額度的1/10,換算下來是4塊錢;

  • DeepSeek-V4-Pro,接的昨天降價后的API,約2.4元。


第三方平臺對Claude和GPT的費用統計

說實話,對于這個成本來說,Claude和GPT是非常不劃算的,Claude生成的效果與Kimi差不多,但價格竟然差了近30倍!GPT更是效果也不好,但卻是花得最多的,十分不推薦。

降價后的DeepSeek,算是物美價廉。


綜合測評下來,如果要論成本,API降價后的DeepSeek V4無疑是最劃算的。但是它沒有多模態,很多coding場景受限。

如果要論性價比,Kimi K2.6則是最合適的,能力比肩甚至超越全球頂尖模型,而成本卻不到他們的幾十分之一。

另外,kimi也有多模態,Agent能力在線,綜合能力確實不錯。

而Claude和GPT,至少在本次任務測試中并未表現出有代差的能力,大家旗鼓相當。甚至部分場景,GPT還比較拉胯。

我是冷逸,你們的AI測評手替。如果你有想測的場景,歡迎在評論區甩出來,咱們互相抄作業。

如果覺得本期內容有用的話,歡迎點贊+在看+轉發,讓更多人看見,感恩。

咱們下期見。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
環球體育:巴拉圭門將希爾回應姆巴佩批評

環球體育:巴拉圭門將希爾回應姆巴佩批評

懂球帝
2026-07-05 20:20:24
發現一個扎心的真相:窮人的富養是帶孩子吃喝玩樂,喂大了孩子的胃口;富人的富養是教孩子看清世界的真相和規則,掌握兩條解決問題的方法

發現一個扎心的真相:窮人的富養是帶孩子吃喝玩樂,喂大了孩子的胃口;富人的富養是教孩子看清世界的真相和規則,掌握兩條解決問題的方法

心理觀察局
2026-07-05 07:00:10
中國最后還是松了口?高市早苗訪印專機直接從中國領空穿行而過!

中國最后還是松了口?高市早苗訪印專機直接從中國領空穿行而過!

阿龍聊軍事
2026-07-05 08:22:41
西安嚴鵬追悼儀式曝光:現場全是花圈,外地網友送千束菊花

西安嚴鵬追悼儀式曝光:現場全是花圈,外地網友送千束菊花

娛樂圈圈圓
2026-07-05 13:27:55
業績井噴!多家龍頭上市公司,大幅預增!

業績井噴!多家龍頭上市公司,大幅預增!

證券時報e公司
2026-07-05 21:59:27
吸煙真的有害嗎?英國煙草公司用48只狗實驗,4年竟抽掉14萬支煙

吸煙真的有害嗎?英國煙草公司用48只狗實驗,4年竟抽掉14萬支煙

掠影后有感
2026-06-24 10:52:34
為何狂犬病毒致死率是99.99%,不是100%,誰幸運活下來了?

為何狂犬病毒致死率是99.99%,不是100%,誰幸運活下來了?

荊醫生科普
2026-06-29 21:45:04
獨居女子去世半年難安葬 居委會出面:墊資承辦

獨居女子去世半年難安葬 居委會出面:墊資承辦

看看新聞Knews
2026-07-05 20:56:04
六年前,LV也告過日本商家侵權!被日網民群嘲“快去碰瓷唐玄宗”

六年前,LV也告過日本商家侵權!被日網民群嘲“快去碰瓷唐玄宗”

這里是東京
2026-07-05 21:47:46
“霉霉”泰勒·斯威夫特婚禮現場照片被泄漏,工作人員高價倒賣照片視頻被開除,至少四名違規拍照人員被帶離場館;婚禮規定全部禁用手機

“霉霉”泰勒·斯威夫特婚禮現場照片被泄漏,工作人員高價倒賣照片視頻被開除,至少四名違規拍照人員被帶離場館;婚禮規定全部禁用手機

極目新聞
2026-07-05 14:52:27
今年高溫時間大變!最熱不在七月初,熬完20天就涼快了

今年高溫時間大變!最熱不在七月初,熬完20天就涼快了

華庭講美食
2026-07-04 20:20:31
從頭號熱門到第三,金球獎之爭變天!又被提前換下,世界杯最憋屈綠葉!

從頭號熱門到第三,金球獎之爭變天!又被提前換下,世界杯最憋屈綠葉!

生活新鮮市
2026-07-05 15:09:46
普京這步棋走得太精了,派梅德韋杰夫去伊朗,美國才反應過來晚了

普京這步棋走得太精了,派梅德韋杰夫去伊朗,美國才反應過來晚了

奇思妙想生活家
2026-07-04 13:04:56
深圳街道都開始摸底電容電阻,AI把MLCC、PCB、覆銅板全抬成硬通貨了

深圳街道都開始摸底電容電阻,AI把MLCC、PCB、覆銅板全抬成硬通貨了

時尚的弄潮
2026-07-05 20:51:35
局勢持續升溫,鄭麗文緊急喊話:停止挑釁,和平才是唯一出路

局勢持續升溫,鄭麗文緊急喊話:停止挑釁,和平才是唯一出路

經點星娛
2026-07-04 22:45:05
剛剛,蘋果官網上架官翻新品!

剛剛,蘋果官網上架官翻新品!

花果科技
2026-07-05 22:44:03
網友篤定她家黑狗是金毛,大家都不信,直到她曬出這張照片……沒毛病,是金毛!

網友篤定她家黑狗是金毛,大家都不信,直到她曬出這張照片……沒毛病,是金毛!

愛寵物
2026-06-30 01:01:40
美軍已經插手,日本準備掀桌,釣魚島爭端升級,中方先封高市退路

美軍已經插手,日本準備掀桌,釣魚島爭端升級,中方先封高市退路

健身狂人
2026-07-05 19:47:48
給泰山安裝刀片刺網,在古代要被砍頭

給泰山安裝刀片刺網,在古代要被砍頭

黔有虎
2026-07-03 16:49:25
維尼修斯續約薪資談崩!今夏可離隊,英超三強全力爭奪

維尼修斯續約薪資談崩!今夏可離隊,英超三強全力爭奪

夜白侃球
2026-07-05 11:37:50
2026-07-06 01:03:00
沃垠AI incentive-icons
沃垠AI
努力分享一些有用、有趣的AI干貨
122文章數 53關注度
往期回顧 全部

科技要聞

華為:邏輯折疊將大幅提升麒麟CPU核心頻率

頭條要聞

醫院給老人一次拔12顆牙種10顆 官方:將頂格行政處罰

頭條要聞

醫院給老人一次拔12顆牙種10顆 官方:將頂格行政處罰

體育要聞

姆巴佩點走巴拉圭:巴黎三代左鋒傳承

娛樂要聞

霉霉婚禮照片泄露 有四人違規

財經要聞

揭秘跨境“對敲”換匯黑產

汽車要聞

方程豹鈦9內飾曝光 用上了長聯屏設計/下半年上市

態度原創

房產
本地
時尚
數碼
公開課

房產要聞

總裁空缺17個月、現金缺口超1000億:金融局“局外人”入局萬科

本地新聞

國內足球之旅?這座小城給你高分答案

3年賺46億,楊冪喊出一個安徽富豪

數碼要聞

Intel Xe3P核顯越來越近!Linux曝光新進展

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版