无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

美團正式上線LongCat App,可體驗語音通話等新功能

0
分享至

11月3日消息,美團LongCat團隊今日宣布,LongCat-Flash 系列大模型再升級,正式發布全新家族成員——LongCat-Flash-Omni,并開源。

目前,新App已支持聯網搜索、語音通話等功能,視頻通話等功能會稍后上線;Web端則增加圖片、文件上傳和語音通話等功能。

iOS用戶可直接在APP Store中搜索“LongCat”獲取。

在此之前,LongCat僅通過官網(https://longcat.ai/)來為C端用戶提供大模型的相關能力。

網頁版

我們迅速下載該APP測試了一下,發現該模型最大的亮點,那就是“快”!(天下武功,唯快不破)

該模型總參數560B,激活參數僅27B,繼承了LongCat-Flash系列“快”的基因,使其在保持龐大知識容量的同時,實現了極高的推理效率。

我們發現,從輸入指令到生成token的時間間隔非常短暫,整個過程相當絲滑,小編感覺比豆包通義及微信元寶的反應速度都更快一些。

據悉,在當前主流旗艦模型的性能標準和參數規模下,這是首個能夠實現全模態實時交互的開源模型,它能同時處理文本、圖像、音頻、視頻,而且還能實時進行音視頻交互。

據官方介紹,LongCat-Flash-Omni以LongCat-Flash系列的高效架構設計為基礎(Shortcut-Connected MoE,含零計算專家),集成了高效多模態感知模塊與語音重建模塊,在總參數 5600 億(激活參數 270 億)的龐大參數規模下,仍實現低延遲的實時音視頻交互能力,為開發者的多模態應用場景提供了更高效的技術選擇。

美團采用了 Shortcut-connected MoE 架構,配合零計算專家(zero-computation experts)設計,就像高速公路上的ETC通道,讓信息處理更高效,避免了“堵車”。

更重要的是,美團還提出了早期融合訓練范式(Early-Fusion Training),能確保模型在獲得多模態能力的同時,不會在單一模態上“偏科”。

并不是先語言訓練,然后再后加上視覺或音頻能力。這就像培養全能運動員,不能因為練游泳就忘了跑步,每天都要一起練,而不是先練兩年游泳,然后再去學跑步。

這樣的一體化架構,讓這只“龍貓”實現了完全端到端的設計:視覺與音頻編碼器作為多模態感知器,LLM 直接處理輸入并生成文本與語音 token,再通過輕量級音頻解碼器重建為自然語音波形。

此外,打開LongCat APP,從首頁可以看到,它目前支持文字/語音兩種輸入方式,并能進行語音通話(視頻通話功能正在跑步入場中),Web端還支持上傳圖片和文件。

APP端

在綜合性的全模態基準測試(如Omni-Bench, WorldSense)上,超越Qwen3-Omni、Gemini-2.5-Flash,這款模型直接達到了開源SOTA水準(開源最先進水平),而且能和閉源的Gemini-2.5-Pro相媲美。 即使單拉出來文本、圖像、音頻、視頻等各項模態能力,它也依舊能打(單項能力均位居開源模型前列),真正實現了“全模態不降智”。

文本:LongCat-Flash-Omni 延續了該系列卓越的文本基礎能力,且在多領域均呈現領先性能。相較于 LongCat-Flash 系列早期版本,該模型不僅未出現文本能力的衰減,反而在部分領域實現了性能提升。這一結果不僅印證了該團隊訓練策略的有效性,更凸顯出全模態模型訓練中不同模態間的潛在協同價值。

圖像理解:LongCat-Flash-Omni 的性能(RealWorldQA 74.8分)與閉源全模態模型 Gemini-2.5-Pro 相當,且優于開源模型 Qwen3-Omni;多圖像任務優勢尤為顯著,核心得益于高質量交織圖文、多圖像及視頻數據集上的訓練成果。

音頻能力:從自動語音識別(ASR)、文本到語音(TTS)、語音續寫維度進行評估,Instruct Model 層面表現突出:ASR 在 LibriSpeech、AISHELL-1 等數據集上優于 Gemini-2.5-Pro;語音到文本翻譯(S2TT)在 CoVost2 表現強勁;音頻理解在 TUT2017、Nonspeech7k 等任務達當前最優;音頻到文本對話在 OpenAudioBench、VoiceBench 表現優異,實時音視頻交互評分接近閉源模型,類人性指標優于 GPT-4o,實現基礎能力到實用交互的高效轉化。

視頻理解:LongCat-Flash-Omni 視頻到文本任務性能達當前最優,短視頻理解大幅優于現有參評模型,長視頻理解比肩 Gemini-2.5-Pro 與 Qwen3-VL,這得益于動態幀采樣、分層令牌聚合的視頻處理策略,及高效骨干網絡對長上下文的支持。

跨模態理解:性能優于 Gemini-2.5-Flash(非思考模式),比肩 Gemini-2.5-Pro(非思考模式);尤其在真實世界音視頻理解WorldSense 基準測試上,相較其他開源全模態模型展現出顯著的性能優勢,印證其高效的多模態融合能力,是當前綜合能力領先的開源全模態模型。

端到端交互:由于目前行業內尚未有成熟的實時多模態交互評估體系,LongCat團隊構建了一套專屬的端到端評測方案,該方案由定量用戶評分(250 名用戶評分)與定性專家分析(10 名專家,200 個對話樣本)組成。

定量結果顯示:圍繞端到端交互的自然度與流暢度,LongCat-Flash-Omni 在開源模型中展現出顯著優勢 —— 其評分比當前最優開源模型 Qwen3-Omni 高出 0.56 分;定性結果顯示:LongCat-Flash-Omni 在副語言理解、相關性與記憶能力三個維度與頂級模型持平,但是在實時性、類人性與準確性三個維度仍存在差距,也將在未來工作中進一步優化。

美團這款新發布模型也引發了外國網友的熱議。其中有網友表示:“這家中國外賣公司可是大有來路,年營收高達數百億美元,員工人數也超過 Meta,是那種可以把前沿模型開發當成副業來搞的巨頭公司。”甚至點名扎克伯格:快來學著抄作業。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
二十余年遺憾終圓滿!陳偉霆首個父親節,一雙定制親子鞋戳哭全網

二十余年遺憾終圓滿!陳偉霆首個父親節,一雙定制親子鞋戳哭全網

繁華羽淡洛
2026-06-21 16:05:36
斯諾克上海表演賽:趙心童又逆轉,翻盤小司機,小鋼炮復仇吳宜澤

斯諾克上海表演賽:趙心童又逆轉,翻盤小司機,小鋼炮復仇吳宜澤

劉姚堯的文字城堡
2026-06-22 17:19:22
沒有奇跡了!蔡磊發布倒計時演講,病癥已瀕臨末期,僅靠眼球互動

沒有奇跡了!蔡磊發布倒計時演講,病癥已瀕臨末期,僅靠眼球互動

侃故事的阿慶
2026-06-22 12:16:07
穆里尼奧都饞哭了!巴西世界杯最大浪費!安切洛蒂咋想的

穆里尼奧都饞哭了!巴西世界杯最大浪費!安切洛蒂咋想的

瀾歸序
2026-06-22 07:23:35
滬深兩市成交額3.74萬億歷史第二高,史上第一是哪天?

滬深兩市成交額3.74萬億歷史第二高,史上第一是哪天?

東方豪俠
2026-06-22 16:05:48
勁爆!世界杯|葡萄牙邊鋒孔塞桑:我們沒有義務傳球給C羅!

勁爆!世界杯|葡萄牙邊鋒孔塞桑:我們沒有義務傳球給C羅!

kio魚
2026-06-22 10:01:58
錢再多有什么用?50歲功成名就的撒貝寧,還是要為82歲父親操碎心

錢再多有什么用?50歲功成名就的撒貝寧,還是要為82歲父親操碎心

寒士之言本尊
2026-06-21 15:39:50
名校光環失效?上海交大冷門專業應屆出路腰斬

名校光環失效?上海交大冷門專業應屆出路腰斬

戶外阿毽
2026-06-22 09:48:18
讓步,“必須的”

讓步,“必須的”

中國新聞周刊
2026-06-22 19:04:02
智譜市值首次突破1萬億港元,股價年內漲超20倍

智譜市值首次突破1萬億港元,股價年內漲超20倍

金融界
2026-06-22 10:11:59
陰毛有什么用?要不要刮掉?由黑變白,暗示著什么?告訴你答案

陰毛有什么用?要不要刮掉?由黑變白,暗示著什么?告訴你答案

醫學科普匯
2026-06-22 22:30:07
狂省一大筆!雷霆原本奢侈稅2.13億,送走威金斯后省了6100萬

狂省一大筆!雷霆原本奢侈稅2.13億,送走威金斯后省了6100萬

懂球帝
2026-06-22 10:55:25
唐藝昕絲襪熱舞炸熱搜!網友罵她擦邊博流量,背后的細節藏不住了

唐藝昕絲襪熱舞炸熱搜!網友罵她擦邊博流量,背后的細節藏不住了

喜歡歷史的阿繁
2026-06-22 01:00:12
越吃陽氣越足,建議中老年:夏至后常吃5樣,增強體質少生病

越吃陽氣越足,建議中老年:夏至后常吃5樣,增強體質少生病

愛生活的陶哥
2026-06-22 07:20:59
廣州地鐵3號線被吐槽悶熱難受,乘客:熱得頭暈;地鐵方回應:將反饋給業務部門核查處理

廣州地鐵3號線被吐槽悶熱難受,乘客:熱得頭暈;地鐵方回應:將反饋給業務部門核查處理

陳意小可愛
2026-06-22 13:56:11
39歲的多爾袞在塞外墜馬身亡,彌留時急召胞兄阿濟格托付后事

39歲的多爾袞在塞外墜馬身亡,彌留時急召胞兄阿濟格托付后事

磊子講史
2026-06-15 15:19:58
打完澳洲才發現:男籃世預賽14人名單雖未出 但這6個名字基本穩了

打完澳洲才發現:男籃世預賽14人名單雖未出 但這6個名字基本穩了

蘭亭墨未干
2026-06-22 11:46:20
只剩下6511億美元,中方再“拋”美債后,最大接盤國家浮出水面?

只剩下6511億美元,中方再“拋”美債后,最大接盤國家浮出水面?

混沌錄
2026-06-22 17:59:31
伊朗隊獲準提前兩天到比賽地,但對手埃及卻被迫“繞路”:美國安全部門不準他們直接去比賽地

伊朗隊獲準提前兩天到比賽地,但對手埃及卻被迫“繞路”:美國安全部門不準他們直接去比賽地

紅星新聞
2026-06-22 15:21:00
斬草要除根!烏軍專打導彈供應鏈要害,定點摧毀俄導彈元器件廠房

斬草要除根!烏軍專打導彈供應鏈要害,定點摧毀俄導彈元器件廠房

軍迷戰情室
2026-06-22 23:27:35
2026-06-23 00:15:00
科工力量 incentive-icons
科工力量
觀察者網工業科技專欄
254文章數 546關注度
往期回顧 全部

科技要聞

馬云與阿里巴巴眾高管下田插秧

頭條要聞

媒體:中國"兩箭齊發"反制美國 不賣了也不買了

頭條要聞

媒體:中國"兩箭齊發"反制美國 不賣了也不買了

體育要聞

法國球星祝中國隊下屆世界杯取得好成績

娛樂要聞

陪睡陪玩是皮毛,向佐揭內娛暗規則

財經要聞

前美聯儲主席格林斯潘去世 享年100歲

汽車要聞

華為智駕ADS限時優惠月底結束 7月1日前下訂立省3000元

態度原創

時尚
家居
本地
房產
軍事航空

蘋果型顯瘦的夏季穿搭,挺好看!

家居要聞

綠意盎然 自然之境

本地新聞

吃一次廣東龍舟飯,才懂什么是豪華盛宴

房產要聞

一年時間,36個盤“消失”!海口樓市,罕見“大收縮”!

軍事要聞

東風-17發射狀態首次公開 多車齊射場面硬核

無障礙瀏覽 進入關懷版