智源FlagOS×海光信息完成 MiniCPM5 Day0适配
2026-05-27
来源:海光信息
近日,面壁智能正式发布并开源新一代端侧文本基座大模型MiniCPM5-1B。海光信息联合智源研究院众智FlagOS社区,依托FlagOS统一多芯片软件栈,第一时间完成该模型的适配与推理部署,实现“发布即支持”。海光DCU在所有测试场景下首Token延迟(TTFT)全面低于NVIDIA H20原生基线,用极致效率达成从云到端的国产算力生态覆盖。

MiniCPM5-1B以仅1B参数规模,在AA-Index权威榜单上取得17.9的高分,超越Qwen3.5-2B(16.3)等全部 4B 以下开源基座模型,展现出端侧模型少有的语言理解与推理能力。众智FlagOS社区基于vLLM-plugin-FL推理插件和底层算子库 FlagGems,快速打通MiniCPM5-1B在多款AI芯片上的推理链路。海光DCU依托FlagOS统一软件栈,无需修改业务代码即完成推理优化,真正做到了模型开源的当天同步可用。
首Token响应全面领先,交互体验突破
TTFT是衡量大模型交互响应速度的核心指标,数值越低,用户获得首次反馈的等待时间越短。经实测,海光DCU在多种并发、上下文长度等严苛场景下,TTFT全面低于NVIDIA H20原生部署基线。这意味着在智能客服、实时翻译、端侧助理等对响应速度敏感的应用中,海光平台可为用户带来更流畅、即时的智能体验,效率追平甚至超越业界主流。
此前,海光DCU已成功支撑DeepSeek系列等千亿级云端大模型的高效推理,如今又实现对1B级端侧模型的Day0适配。这一“云+端”全场景覆盖能力,证明了海光DCU与FlagOS统一软件栈的灵活性与可扩展性,无论大规模数据中心还是轻量化边缘设备,都能获得一致的开发体验与高能效算力。
极简部署,生态开放
开发者现可通过FlagOS社区获取相关推理插件与模型镜像,以极低迁移成本在海光平台上快速部署MiniCPM5-1B。底层优化自动生效,完全兼容原生接口及工具链,大幅缩短从开发到上线的周期。
本次MiniCPM5-1B的闪电适配,是海光信息、众智FlagOS社区与面壁智能紧密协作的又一成果,标志着国产AI芯片在端侧大模型领域已具备与国际主流产品同台竞技的能力。海光将持续参与异构算力协同建设,以高效、安全、可控的算力底座,加速大模型在千行百业的规模化落地。

