MiniMax
先看一段視頻
點擊播放:14 秒,建議看完再往下翻
這段視頻沒有聲音,來猜猜這是啥曲子?
揭曉答案
這是《小星星》,你猜對了嗎?
我把這段無聲視頻丟給了 MiniMax M3,它給出了正確的判定:《小星星》
![]()
M3 的分析結果
然后,我追加了一個要求:
把這段的視頻,做成一個有聲的、能跟著彈的網頁游戲
![]()
幾分鐘后,出來了這個東西:
![]()
跟彈《小星星》
視頻嵌在上面當教學畫面,鍵盤 A 到 H 對應 do re mi fa sol la,按對了電腦發出鋼琴聲,視頻自動跳到下一個音的位置,等你按下一個鍵,錯了則會提醒
在電腦上實際跟彈
整個過程就是:它拿到了一段的手指視頻,給到了一個能發聲、能互動、能教我彈琴的游戲
背后發生了什么
MiniMax M3 主打三大能力:原生多模態、百萬級長上下文、前沿 Coding,而剛才的這個小星星任務,其實也正把這三個展示了出來
多模態。模型會逐幀分析手指和琴鍵的相對位置,標注每一幀按下的是哪個白鍵,然后翻譯成位置信號,通過這種方法,在沒有音頻信號的前提下,推斷出旋律
M3 思考過程
用 videos_understand 工具逐幀分析視頻
音序列:C C G G A A G | F F E E D D C
判定:《小星星》前兩句
![]()
長上下文。任務過程中,模型需要記錄和分析每次手指移動的情況,并且不斷推斷音符的時間戳,然后對視頻進行切片處理和打標,并在最后進行完整的交付
Coding。這個任務雖然看上去很小,但實際有著多種 tool call,還要通過如 Web Audio API 對工具進行實時音色合成、視頻播放控制,按鍵判定,UI 動效。這里的所有聲音,是 AI 控制震動頻率合成的
M3 思考過程
用 Web Audio API 生成正弦波 + 三角波合成音色
A=C(do) S=D(re) D=E(mi) F=F(fa) G=G(sol) H=A(la)
按對推進,按錯提示,做完打包
![]()
M3 在 MiniMax Code 里的工作過程,右邊是產出的文件
講道理,M3 能處理完這些,是超過我的預期的
MiniMax M3
昨天,6月1日,我在給酒吧開業的時候,看到了 MiniMax 發布了 M3,是國內第一個同時做到百萬級上下文、前沿 Coding 和原生多模態開源模型,詳細的信息如下:
![]()
官方 benchmark 對比
上下文
新架構MSA,把每個 token 的計算量壓到上代模型的1/20。一百萬 token 的上下文窗口,預填充快 9 倍,解碼快 15 倍
直觀理解:能一次讀完一本 300 頁的書,或者像小星星這樣,把整段視頻的逐幀分析 + 完整代碼 + 調試日志全部放在一個對話里
Coding
SWE-Bench Pro59.0%,超 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7
評測之外,M3 獨立復現一篇 ICLR 2025 最佳論文,12 小時,18 次提交,23 張圖表。另一個是優化 CUDA kernel,連續 24 小時,147次提交,性能提升 9.4 倍。中間卡殼了還知道換條路試
多模態
從訓練第一步就混合了文字、圖片、視頻。能看圖、看視頻、操作電腦桌面。小星星那個「看無聲視頻識別旋律」就是這個能力的直接體現
MiniMax Code
桌面 Agent 產品,類似 Claude Code。支持多階段并發執行,帶 Computer Use。M3 在里面可以調用 MiniMax 全家的 API:文字、語音、視頻分析,一個工具箱全裝下
定價
Token Plan 三檔:Plus49元/月 6 億 token,Max119元/月 18 億 token,Ultra469元/月 55 億 token
M3 發布后,Token Plan 從時長制切換到了 token 計量制,部分老用戶覺得權益縮水,反饋集中。MiniMax 當天發了補償方案:3.22 前的老用戶繼續無周限額,其他老用戶周限額加贈 50%,前 7 天額度翻倍,退款通道搭建中
![]()
官方權益調整說明
M3 API 上線 5 折,限時 7 天。技術報告和開源權重 10 天內發布
以及:這個模型還是不錯的,可以試試
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.