Xiaomi MiMo 联合 TileRT 推出 UltraSpeed 模式,单台 GPU 节点万亿参数大模型文本生成提至 1000 tokens/s!
2026/6/9 20:33:06 网站建设 项目流程

Xiaomi MiMo 联合 TileRT 推出 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,单台标准 8 卡通用 GPU 节点上,万亿参数大模型文本生成速度达 1000 tokens/s,MiMo-V2.5-Pro-UltraSpeed API 同步上线。

速度提升显著

该模式首次在单台标准 8 卡通用 GPU 节点上,将万亿参数大模型的文本生成速度提升至 1000 tokens/s。MiMo-V2.5-Pro-UltraSpeed API 采用限时体验价,虽定价为 MiMo-V2.5-Pro 的 3 倍,但输出速度有约 10 倍提升。

限时开放申请

本次采取申请制限时开放,时间为 2026 年 6 月 9 日至 6 月 23 日 23:59。申请入口为 ,通过审核的用户可限时接入 API 体验,还能获得限时免费的 Chat 体验。

试用服务规则

为保障体验质量与使用公平性,每个账号每日最多成功进入队列 10 次;单次会话时长上限 30 分钟;如会话空闲超过 5 分钟,系统将自动释放资源。

技术优化亮点

模型侧针对通用硬件带宽瓶颈,进行 FP4 量化,缩减模型体积并减少访存开销,引入 DFlash 提升 Token 接受长度。系统侧 TileRT 适配算法动态特性,定制专项优化编译引擎与计算核。

效果展示惊艳

从效果展示来看,能 10 秒做一个贪吃蛇小游戏,1 分钟复刻一个 MacOS 系统,展现出该模式的强大性能。

编辑观点:Xiaomi MiMo 此次推出的 UltraSpeed 模式在大模型文本生成速度上有重大突破,限时开放体验能吸引更多用户,有望在行业内掀起新的竞争热潮。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询