很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。
logo2026年05月30日 19:19:55
小米MiMo首次公开模型推理系统全链路优化技术细节
财联社5月30日电,小米5月30日正式公开 MiMo-V2.5 系列模型的推理系统全链路优化方案。团队围绕 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了从 KVCache 管理、分级缓存、前缀缓存到调度策略与 Prefill/Decode 链路的完整推理栈,KVCache 存储压缩至同级方案的约 1/7,在长序列场景下推理成本大幅下降——这是本次降价的核心技术基础。此前5月27日,MiMo-V2.5 系列 API 完成永久降价,最高降幅达 99%,不区分输入长度。
19.52W
关联话题
2.46W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号