5月25日,面壁智能正式發(fā)布并開源了新一代端側(cè)文本基座大模型 MiniCPM5-1B。該模型以1B 參數(shù)規(guī)模在 AA-Index 榜單取得17.9分,超越 Qwen3.5-2B(16.3 分)等全部4B 以下開源基座模型,延續(xù)了面壁智能提出的“密度定律”——大模型智能密度約每3.5個月翻一番。其 Base 版本由面壁自研 AI 訓練框架 ForgeTrain 預訓練完成,這是全球首個完全由 AI 編寫的生產(chǎn)級訓練框架。INT4量化后權(quán)重僅0.5GB,可在手機、瀏覽器等90%以上終端設備運行。官方已原生支持 vLLM、SGLang、llama.cpp 等主流推理框架。

據(jù)悉,眾智 FlagOS 社區(qū)基于統(tǒng)一多芯片軟件棧,通過 vLLM-plugin-FL 推理插件完成了 MiniCPM5-1B 的跨芯片適配與推理部署 Day-0發(fā)布。此次適配覆蓋英偉達、華為昇騰、平頭哥、摩爾線程、海光、昆侖芯、沐曦、天數(shù)智芯 8 類數(shù)據(jù)中心 AI 加速芯片,并針對 MiniCPM5面向端側(cè)部署的特點,首次將 Day-0適配延伸至 ARM 端側(cè)平臺。FlagOS 支持 MiniCPM5-1B 在 ARM 上以 int8、bf16、fp32三種精度運行,實現(xiàn)了從數(shù)據(jù)中心多款AI芯片到端側(cè) ARM 的“一套代碼、跨架構(gòu)運行”。在性能方面,多款AI芯片的首 token 延遲(TTFT)低于 NVIDIA H20原生基線,進一步驗證了 FlagOS 統(tǒng)一軟件棧在跨芯片適配和推理優(yōu)化上的能力。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務業(yè)務經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導報》社有限責任公司