智源FlagOS×海光信息完成 MiniCPM5 Day0适配-AET-电子技术应用

智源FlagOS×海光信息完成 MiniCPM5 Day0适配

效率追平NVIDIA原生

日期： 2026-05-27

来源：海光信息

关键词： 海光信息智源研究院

近日，面壁智能正式发布并开源新一代端侧文本基座大模型MiniCPM5-1B。海光信息联合智源研究院众智FlagOS社区，依托FlagOS统一多芯片软件栈，第一时间完成该模型的适配与推理部署，实现“发布即支持”。海光DCU在所有测试场景下首Token延迟（TTFT）全面低于NVIDIA H20原生基线，用极致效率达成从云到端的国产算力生态覆盖。

MiniCPM5-1B以仅1B参数规模，在AA-Index权威榜单上取得17.9的高分，超越Qwen3.5-2B（16.3）等全部 4B 以下开源基座模型，展现出端侧模型少有的语言理解与推理能力。众智FlagOS社区基于vLLM-plugin-FL推理插件和底层算子库 FlagGems，快速打通MiniCPM5-1B在多款AI芯片上的推理链路。海光DCU依托FlagOS统一软件栈，无需修改业务代码即完成推理优化，真正做到了模型开源的当天同步可用。

首Token响应全面领先，交互体验突破

TTFT是衡量大模型交互响应速度的核心指标，数值越低，用户获得首次反馈的等待时间越短。经实测，海光DCU在多种并发、上下文长度等严苛场景下，TTFT全面低于NVIDIA H20原生部署基线。这意味着在智能客服、实时翻译、端侧助理等对响应速度敏感的应用中，海光平台可为用户带来更流畅、即时的智能体验，效率追平甚至超越业界主流。

此前，海光DCU已成功支撑DeepSeek系列等千亿级云端大模型的高效推理，如今又实现对1B级端侧模型的Day0适配。这一“云+端”全场景覆盖能力，证明了海光DCU与FlagOS统一软件栈的灵活性与可扩展性，无论大规模数据中心还是轻量化边缘设备，都能获得一致的开发体验与高能效算力。

极简部署，生态开放

开发者现可通过FlagOS社区获取相关推理插件与模型镜像，以极低迁移成本在海光平台上快速部署MiniCPM5-1B。底层优化自动生效，完全兼容原生接口及工具链，大幅缩短从开发到上线的周期。

本次MiniCPM5-1B的闪电适配，是海光信息、众智FlagOS社区与面壁智能紧密协作的又一成果，标志着国产AI芯片在端侧大模型领域已具备与国际主流产品同台竞技的能力。海光将持续参与异构算力协同建设，以高效、安全、可控的算力底座，加速大模型在千行百业的规模化落地。

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

智源FlagOS×海光信息完成 MiniCPM5 Day0适配

日期： 2026-05-27

来源：海光信息

相关内容