小米 MiMo-V2.5-Pro 突破每秒 1000 tokens!邊緣 AI 推論晶片新里程碑

說到小米的 AI 佈局,大家可能比較熟 HyperOS 的 Super Xiaoai 或手機上的 AI 功能。但小米其實在硬體端也有一條產品線——MiMo(小米移動 AI 晶片系列),而且最近有一個讓人眼睛一亮的進展。

根據 Gizchina 的報導,小米與 TileRT 合作開發的 MiMo-V2.5-Pro,在標準 GPU 上實現了 每秒 1000 tokens 的推論速度,而且是在 1 兆(trillion)參數的模型上跑出來的。

這個數字是什麼概念?一般來說,邊緣裝置上的 AI 推論速度如果能跑到幾百 tokens 就算不錯了,1000 tokens/s 在邊緣端算是非常高的水準。

這跟我們一般人有什麼關係?

你可能會想:「這是晶片廠商在秀肌肉,跟我日常使用有什麼關係?」

關係可大了。MiMo 系列的主要定位是邊緣 AI 推論——也就是說,AI 運算直接在手機或裝置上完成,不用把資料傳到雲端。這代表三件事:

  1. 隱私更好:你的對話、照片不用上傳到伺服器
  2. 速度更快:不用等網路,本地運算即時反應
  3. 離線可用:沒有網路的時候也能用 AI 功能

舉例來說,未來手機上的即時語音翻譯、AI 修圖、智慧助理的回應,如果靠 MiMo 這類晶片在本地跑,體驗會比現在順暢很多。

跟 HyperOS 4 的關聯

如果你有在追 HyperOS 4 的消息,應該知道下一代 HyperOS 主打的就是「深度 AI 整合」——用 Super Xiaoai + miclaw 系統架構讓 AI 深入系統底層。

MiMo-V2.5-Pro 的進展剛好呼應了這個方向。AI 要能「主動預測你的需求」,首先需要夠快的推論速度來做即時判斷。每秒 1000 tokens 的效能,正好為這種場景提供了硬體基礎。

什麼時候會看到實品?

目前 MiMo-V2.5-Pro 還在試用申請階段,還沒有明確的量產時間表。但從 HyperOS 4 預計 7-8 月推出的時程來看,小米的 AI 硬體 + 軟體雙線布局已經很清楚了。

小結

MiMo-V2.5-Pro 的 1000 tokens/s 里程碑,讓我對小米接下來的 AI 產品多了一些期待。不是說數字漂亮就厲害——而是這個方向對了:讓 AI 在本地跑、跑得快、而且真的能用

至於能不能變成一款實際讓消費者有感的产品,就看小米後續怎麼把這顆晶片放進手機和其他裝置裡了。有進一步消息再跟大家分享。