本報訊(記者 羅曉燕)5月26日,中科創(chuàng)星硬科技媒體行——清程極智專場活動在北京舉行?;顒蝇F(xiàn)場,北京清程極智科技有限公司(以下簡稱“清程極智”)團隊與到場媒體圍繞大模型推理降本、國產(chǎn)算力生態(tài)適配、Token服務(wù)質(zhì)量與性價比三大行業(yè)關(guān)鍵痛點進行深入交流,并集中展示多項核心技術(shù)突破與規(guī)?;涞爻晒约夹g(shù)創(chuàng)新推動中國AI產(chǎn)業(yè)從“能用”邁向好用、低成本、自主可控的新階段。

當前,全球AI產(chǎn)業(yè)已進入規(guī)?;涞氐年P(guān)鍵時期。Token作為AI時代的“水電煤”,正成為大模型服務(wù)與智能應(yīng)用的核心生產(chǎn)要素。數(shù)據(jù)顯示,2024年初至2026年3月,中國Token日均調(diào)用量激增約1400倍,規(guī)模突破140萬億。隨著Agent智能體、多模態(tài)應(yīng)用的快速普及,Token正從交互用量轉(zhuǎn)向生產(chǎn)用量,對推理效率、部署成本、服務(wù)穩(wěn)定性提出更高要求。清程極智首席科學(xué)家、清華大學(xué)計算機系教授翟季冬在活動中指出:“Agent應(yīng)用會有多步執(zhí)行,頻繁調(diào)用大模型,將Token調(diào)用量顯著增加。中國的Token增長速度比全球還高,這背后是供給側(cè)和需求側(cè)共同的爆發(fā)。”
與此同時,國產(chǎn)算力與國產(chǎn)模型雖迎來高速發(fā)展,但推理環(huán)節(jié)長期依賴海外引擎,難以充分釋放國產(chǎn)硬件性能。Token服務(wù)市場也面臨“亂、貴、慢、選型難”等突出問題。翟季冬以電力和Token做對比:“家里用電不用擔(dān)心只有國網(wǎng)的電力,但Token有幾十家供應(yīng)商,每家質(zhì)量參差不齊,同樣的模型在不同服務(wù)商那里可能聰明程度不一樣,價格和緩存命中率也千差萬別?!?/p>
針對上述痛點,清程極智打造了覆蓋“生產(chǎn)—流通—應(yīng)用”全鏈路的三大產(chǎn)品體系。公司成立于2023年12月,核心團隊來自清華大學(xué)計算機系高性能計算所,已順利完成天使輪、Pre-A、Pre-A+三輪融資,獲得中科創(chuàng)星、中金資本、考拉基金、聯(lián)想創(chuàng)投、中關(guān)村科學(xué)城公司等多家機構(gòu)加持。

赤兔推理引擎是清程極智完全自主研發(fā)的國產(chǎn)推理引擎,從第一行代碼開始自研,面向昇騰、海光、沐曦、摩爾線程等國產(chǎn)芯片深度優(yōu)化。清程極智聯(lián)合創(chuàng)始人唐適之博士解釋:“推理引擎是運行在AI算力上的計算機程序,用戶提一個問題,引擎根據(jù)大模型定義計算后給出回答。國產(chǎn)芯片各有特點,我們不能簡單把英偉達的技術(shù)挪過來,必須針對國產(chǎn)算力進行原生優(yōu)化。”
據(jù)介紹,赤兔推理引擎通過軟件方案在不具備FP4/FP8硬件能力的設(shè)備上支持低位寬浮點數(shù)量化,使用FP8量化可降低50%算力門檻,F(xiàn)P4量化可降低75%算力門檻。同樣使用浮點數(shù)計算部署DeepSeek-V3滿血版模型時,僅需1臺8卡華為910B服務(wù)器即可替代傳統(tǒng)4臺8卡機,硬件成本從600萬元降至150萬元。目前,赤兔推理引擎已在券商、能源央企等場景落地,某能源央企實現(xiàn)3500+員工全國產(chǎn)化算力穩(wěn)定使用,算力效率提升近40%,相關(guān)案例榮獲2025人工智能應(yīng)用大賽銅獎。

面對Token服務(wù)市場服務(wù)商林立、指標混亂、選型成本高的行業(yè)亂象,清程極智打造AI Ping一站式大模型服務(wù)評測與API智能路由平臺,成為國內(nèi)首個集“信息匯總、客觀評測、智能路由”于一體的Token服務(wù)樞紐。清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾介紹,AI Ping接入30多家服務(wù)商、600多個大模型服務(wù),7×24小時多地域分布式監(jiān)測,輸出延遲、吞吐、可靠性、價格等真實可核驗的指標。同時,該平臺依托智能路由算法,以統(tǒng)一API接口為用戶自動匹配最優(yōu)服務(wù)商,實現(xiàn)成本降低超37%、吞吐提升超90%、延遲降低超20%。
師天麾進一步表示:“Token是一個黑盒,你買之前不知道服務(wù)質(zhì)量。很多企業(yè)只看標價,不懂緩存命中率。有的服務(wù)商標價低,但沒有緩存折扣,最終成本反而高好幾倍。我們會把這些坑幫用戶踩掉,把開箱即用的穩(wěn)定體驗留給客戶?!?/p>
此外,清程極智還推出八卦爐智能軟件棧,面向大模型訓(xùn)練、微調(diào)場景提供高效Token生產(chǎn)與智能調(diào)度能力,與赤兔推理引擎、AI Ping平臺形成協(xié)同,覆蓋AI“訓(xùn)練—推理—應(yīng)用”全流程。
清程極智相關(guān)負責(zé)人表示,公司將持續(xù)深耕AI基礎(chǔ)設(shè)施領(lǐng)域,堅持核心技術(shù)自主可控,不斷迭代赤兔推理引擎對國產(chǎn)芯片的適配能力,完善AI Ping評測與路由服務(wù),聯(lián)動國產(chǎn)算力、國產(chǎn)模型、行業(yè)應(yīng)用等產(chǎn)業(yè)鏈伙伴,打造高效、普惠、安全的國產(chǎn)AI基礎(chǔ)設(shè)施體系,積極響應(yīng)國家“人工智能+”行動,以技術(shù)創(chuàng)新推動中國AI產(chǎn)業(yè)高質(zhì)量發(fā)展。
(本報記者 羅曉燕/攝)
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》社有限責(zé)任公司