近日,中昊芯英“剎那®”TPU架構(gòu)AI芯片完成對百度開源多模態(tài)混合專家大模型ERNIE-4.5-VL-28B-A3B的適配與性能實測。此次適配驗證了國產(chǎn)TPU架構(gòu)算力基座對前沿MoE模型的高效支撐能力,更開創(chuàng)了“國產(chǎn)創(chuàng)新芯片架構(gòu)+國產(chǎn)開源大模型”的生態(tài)范式。
中昊芯英成立于2018年,由前谷歌TPU芯片核心研發(fā)者楊龔軼凡攜一批來自谷歌、微軟、三星等海外科技巨頭公司的AI軟硬件設(shè)計專家組建。公司核心團隊掌握從28nm到7nm各代制程工藝下大芯片設(shè)計與優(yōu)化完整方法論,全棧式的技術(shù)梯隊覆蓋芯片設(shè)計、電路設(shè)計、軟件棧研發(fā)、系統(tǒng)架構(gòu)、大模型算法等各類技術(shù)領(lǐng)域,研發(fā)人員占比70%以上。
歷經(jīng)近5年的研發(fā),中昊芯英推出的“剎那®”TPU架構(gòu)高性能AI專用算力芯片,擁有完全自主可控的IP核、全自研指令集與計算平臺。該芯片采用專為AI/ML而生的 TPU 芯片架構(gòu),在AI大模型計算場景中,算力性能超越海外著名GPU產(chǎn)品近1.5倍,能耗降低30%同時,通過采用Chiplet技術(shù)與2.5D封裝,實現(xiàn)了同等制程工藝下的性能躍升,并支持1024片芯片片間互聯(lián),實現(xiàn)千卡集群線性擴容,支撐超千億參數(shù)大模型運算需求。
此次中昊芯英“剎那®”TPUAI芯片適配的百度開源的ERNIE-4.5-VL-28B-A3B模型(以下簡稱 ERNIE-4.5-VL)是百度文心開源大模型ERNIE-4.5系列中的一款多模態(tài)MoE大模型,于2025年6月30日隨文心4.5系列一同開源。該模型總參數(shù)量為28B,激活參數(shù)量為3B,采用異構(gòu)混合專家架構(gòu)(MoE),在跨模態(tài)理解與生成、長文本處理等領(lǐng)域表現(xiàn)卓越,適用于智能導(dǎo)覽、視覺客服等多種場景。
文心4.5系列模型均基于飛槳深度學(xué)習(xí)框架進行高效訓(xùn)練、推理和部署,在大語言模型的預(yù)訓(xùn)練中,模型 FLOPs 利用率(MFU)達到47%。實驗結(jié)果顯示,該系列模型在多個文本和多模態(tài)基準測試中達到SOTA水平,在指令遵循、世界知識記憶、視覺理解和多模態(tài)推理任務(wù)上效果尤為突出。
在此次的技術(shù)適配方面,中昊芯英憑借“剎那®”TPU AI芯片強大的并行處理能力,與ERNIE-4.5-VL的架構(gòu)設(shè)計實現(xiàn)了深度融合。芯片的可重構(gòu)多級存儲、近存運算設(shè)計以及流水線式的時空映射,有效提升了大模型計算速度和精度,為模型在復(fù)雜任務(wù)中的運行提供了高效支持。同時,針對ERNIE-4.5-VL的多模態(tài)特性,“剎那®”TPU芯片在處理視覺、文本等多模態(tài)數(shù)據(jù)時,展現(xiàn)出了出色的兼容性和運算性能。
根據(jù)實際運行效果表明,在基于“剎那®”TPU AI芯片構(gòu)建的“泰則®”AI服務(wù)器上驅(qū)動運行 ERNIE-4.5-VL 模型時,性能表現(xiàn)與海外著名GPU產(chǎn)品齊平。 這一數(shù)據(jù)有力地證明,“剎那®”TPU AI芯片不僅在技術(shù)架構(gòu)上具有先進性,在實際應(yīng)用中同樣擁有強大的性能表現(xiàn)和商業(yè)價值。
除了性能數(shù)據(jù)方面,中昊芯英技術(shù)團隊還成功基于“剎那®”TPU AI 芯片運行了ERNIE- 4.5-VL的多項復(fù)雜多模態(tài)任務(wù)。例如,在古文識別任務(wù)中,模型能夠精準理解古文字體并給出相應(yīng)出處典故,整個過程流暢運行,無縫銜接。這進一步佐證了在針對大模型方面,中昊芯英“剎那®”TPU AI芯片能夠為ERNIE-4.5-VL提供穩(wěn)定且強大的算力基礎(chǔ)。無論是大規(guī)模的模型訓(xùn)練,還是實時性要求較高的推理任務(wù),“剎那®”TPU AI 芯片都能滿足需求。此外,通過與百度飛槳框架的緊密配合,進一步優(yōu)化模型在芯片上的運行性能,可以更好的為開發(fā)者提供更加便捷、高效的開發(fā)環(huán)境,有助于推動大模型技術(shù)在更多領(lǐng)域的應(yīng)用和創(chuàng)新。

中昊芯英創(chuàng)始人及CEO楊龔軼凡表示:“此次適配驗證了國產(chǎn)算力與模型協(xié)同創(chuàng)新的可行性。“剎那®”TPU AI芯片作為專為大模型設(shè)計的算力引擎,與 ERNIE-4.5-VL 的異構(gòu)MoE架構(gòu)形成完美互補。接下來我們將持續(xù)深化與百度的技術(shù)共研,推動從3B到424B全系列模型的硬件加速方案落地,為產(chǎn)業(yè)提供更高效可靠的國產(chǎn)自主AI基礎(chǔ)設(shè)施。”





明基投影機
堅果投影機
科視投影機
極米投影機
SONNOC投影機
寶視來投影機
視美樂投影機
當(dāng)貝投影機
哈趣投影機
WAP手機版
建議反饋
官方微博
微信掃一掃
PjTime