首頁 要聞 中國 經(jīng)濟 財經(jīng) 品牌 點評 會展 綜合 | 設為首頁
中國品牌要聞網(wǎng)-傳遞資訊的價值打造品牌的影響
您現(xiàn)在的位置:首頁/工業(yè)機電/ 正文
寒武紀發(fā)布新品MLU370-X8 多芯互聯(lián)技術(shù)支持8卡并行
來源:
編輯:
時間:2022-07-23

近日,寒武紀發(fā)布了訓練卡新品——MLU370-X8,這款芯片主要面向訓練任務,搭載雙芯片四芯粒思元370,集成寒武紀MLU-Link™多芯互聯(lián)技術(shù)。值得注意的是,在業(yè)界應用廣泛的YOLOv3、Transformer等訓練任務中, 8卡計算系統(tǒng)的并行性能平均達到350W RTX GPU的155%。

據(jù)官方介紹顯示,MLU370-X8智能加速卡支持MLU-Link™多芯互聯(lián)技術(shù),提供卡內(nèi)及卡間互聯(lián)功能。寒武紀為多卡系統(tǒng)專門設計了MLU-Link橋接卡,可實現(xiàn)4張加速卡為一組的8顆思元370芯片全互聯(lián),每張加速卡可獲得200GB/s的通訊吞吐性能,帶寬為PCIe 4.0 的3.1倍,可高效執(zhí)行多芯多卡訓練和分布式推理任務。

 

MLU370-X8 MLU-Link 4卡橋接拓撲

在Cambricon NeuWare SDK上實測,在常見的4個深度學習網(wǎng)絡模型上,MLU370-X8單卡性能與主流350W RTX GPU相當;而在多卡加速方面,MLU370-X8借助MLU-Link多芯互聯(lián)技術(shù)和Cambricon NeuWare CNCL通訊庫的優(yōu)化,在8卡環(huán)境下達到更優(yōu)的并行加速比。

長期以來,寒武紀為用戶提供了覆蓋不同場景、不同算力規(guī)模的全系列產(chǎn)品,建立起覆蓋云邊端、訓練、推理的完整產(chǎn)品矩陣,同時利用平臺級基礎系統(tǒng)軟件 Cambricon Neuware,連接全線產(chǎn)品,由點及面,實現(xiàn)了“訓推一體、端云融合”。

相關(guān)資料顯示,在全球芯片競爭加劇以及嚴重缺貨的大環(huán)境下,國內(nèi)芯片半導體行業(yè)正式駛?cè)肟燔嚨。?jù)相關(guān)數(shù)據(jù)統(tǒng)計,僅在2020年,中國就新增超過2萬家半導體相關(guān)企業(yè),增速達到32%。在芯片設計領域,截至去年底,國內(nèi)已有超過2000家芯片設計公司。

增速喜人的背后,卻是無奈的現(xiàn)實,2000余家芯片設計公司中,絕大多數(shù)實力單薄,技術(shù)能力儲備不足,產(chǎn)品和市場高度趨同,創(chuàng)造的利潤甚至不如一顆大白菜。如此現(xiàn)象只能造成低端市場的不斷內(nèi)卷。而在高端市場中,能夠設計出CPU、GPU、DSP和FPGA等高性能數(shù)字芯片的企業(yè)依然鳳毛麟角。

所以,寒武紀的高端數(shù)字芯片產(chǎn)品,就成為了芯片市場的重要補充,稀缺度較高。目前,寒武紀的客戶已經(jīng)覆蓋大量頭部服務器廠商、云計算客戶,輻射金融、交通、能源等主要應用領域。新產(chǎn)品推出后可以順利進入客戶選型,市場端競爭壓力較小。寒武紀產(chǎn)品一旦實現(xiàn)技術(shù)突破,市場側(cè)的突破將十分輕松。

免責聲明:本文僅代表作者個人觀點,與本網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實, 對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾, 請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。當事人(單位)如有異議,請參閱《刪帖說明》辦理。
中國品牌要聞網(wǎng)-傳遞資訊的價值打造品牌的影響
編輯:綜合整理
2024-04-26
評論(0)
  • CopyRight@ 2005-2022 中國品牌要聞網(wǎng)
  • 工商注冊號 430122000189097
  • ICP備案許證:渝ICP備2022012785號