游侠网云服务,免实名免备案服务器 游侠云域名,免实名免备案域名

统一声明:

1.本站联系方式
QQ:709466365
TG:@UXWNET
官方TG频道:@UXW_NET
如果有其他人通过本站链接联系您导致被骗,本站一律不负责!

2.需要付费搭建请联系站长QQ:709466365 TG:@UXWNET
3.免实名域名注册购买- 游侠云域名
4.免实名国外服务器购买- 游侠网云服务

中国电子和汽车制造商小米今天发布了 MiMo-V2-Pro,一款拥有 1 万亿参数的基础模型,其基准测试接近美国 AI 巨头 OpenAI 和 Anthropic 的水平,但通过专有 API 访问时成本仅为后者的 1/7 左右。

White humanoid robot smoking cigarette
Credit: VentureBeat made with Gemini 3.1 Pro Image

技术架构:代理时代的智能引擎

MiMo-V2-Pro 由 DeepSeek R1 项目的资深专家 Fuli Luo 领导开发。该模型采用稀疏架构:虽然拥有 1 万亿总参数,但在任何单次前向传递中只有 420 亿参数处于活跃状态,使其规模约为前代 MiMo-V2-Flash 的三倍。

模型的核心是进化的混合注意力机制。MiMo-V2-Pro 采用 7:1 的混合比例(Flash 版本为 5:1)来管理其庞大的 100 万 token 上下文窗口。这种架构选择使模型能够在长时间运行的任务中保持深度”记忆”,而不会出现前沿模型常见的性能下降。

Xiaomi MiMo-V2-Pro benchmarking chart
小米 MiMo-V2-Pro 基准测试对比图。来源:小米

性能表现:第三方验证

在 GDPval-AA(衡量代理现实工作任务表现的基准)上,MiMo-V2-Pro 取得了 1426 的 Elo 分数,领先于 GLM-5(1406)和 Kimi K2.5(1283)等主要中国同行。

第三方基准测试组织 Artificial Analysis 验证了这些声明,将 MiMo-V2-Pro 排在全球智能指数第 10 位,得分为 49 分。这使其与 GPT-5.2 Codex 处于同一级别,并领先于 Grok 4.20 Beta。

Xiaomi MiMo-V2-Pro benchmarking comparison chart by Artificial Analysis
Artificial Analysis 智能指数基准测试对比。来源:Artificial Analysis

关键指标亮点:

  • 幻觉率:Pro 模型将幻觉率降至 30%,较 Flash 模型的 48% 大幅改善
  • 全知指数:得分 +5,领先于 GLM-5(+2)和 Kimi K2.5(-8)
  • Token 效率:运行完整智能指数仅需 7700 万输出 token,显著少于 GLM-5(1.09 亿)和 Kimi K2.5(8900 万)

定价策略:极具竞争力的成本

小米对 MiMo-V2-Pro 的定价旨在主导开发者市场:

  • MiMo-V2-Pro(≤256K):输入 1 美元/百万 token,输出 3 美元/百万 token
  • MiMo-V2-Pro(256K-1M):输入 2 美元/百万 token,输出 6 美元/百万 token
  • 缓存读取:低层级 0.20 美元,高层级 0.40 美元
  • 缓存写入:暂时免费

Artificial Analysis 报告称,运行其智能指数测试,MiMo-V2-Pro 仅需 348 美元,而 GPT-5.2 需要 2304 美元,Claude Opus 4.6 需要 2486 美元。

企业应用建议

基础设施决策者:MiMo-V2-Pro 是智能与成本帕累托前沿的有力候选者。以约 1/7 的成本获得全球前 10 的智能水平,对生产规模测试具有强大吸引力。

数据决策者:可利用 100 万上下文窗口构建 RAG 就绪架构,将整个企业代码库或文档集输入单个提示。

安全决策者:需谨慎。模型的”代理”特性(能够使用终端和操作文件)增加了提示注入和未授权访问的攻击面。虽然低幻觉率(30%)是防御优势,但缺乏公开权重意味着内部安全团队无法进行深度模型级审计。

总结

小米 MiMo-V2-Pro 代表了大模型领域的重要突破。通过专注于”行动空间”而非”对话窗口”,小米试图完全跨越对话范式。该模型目前在智能指数上排名中国第 2、全球第 8,问题不再仅仅是”它能说话吗?”而是”它能行动吗?”

对于寻求高性价比代理 AI 解决方案的企业来说,MiMo-V2-Pro 无疑是一个值得认真考虑的选择。