燧原科技亮相Hot Chips大會,詳解邃思芯片架構


原標題:燧原科技亮相Hot Chips大會,詳解邃思芯片架構
燧原科技在Hot Chips大會上詳解了邃思芯片架構,這一舉動展示了燧原科技在高性能微處理器和集成電路領域的研發實力。以下是對邃思芯片架構的詳細解析:
一、邃思芯片概述
邃思芯片是燧原科技自主研發的一系列高性能AI芯片,包括訓練芯片和推理芯片。這些芯片專為云端訓練和推理場景設計,旨在提供高效、可靠的AI計算能力。
二、邃思訓練芯片架構(以邃思1.0和邃思2.0為例)
邃思1.0
眾核結構:采用燧原科技自研的GCU-CARE計算引擎,整個SOC擁有32個GCU-CARE計算引擎,組成4個計算群組。
全面支持常見AI張量數據格式:包括FP32/FP16/BF16, INT8/INT16/INT32,能夠更全面地支撐客戶業務。
高效數據架構:GCU-DARE數據架構面向數據流優化,提供512GB/s的HBM和200GB/s的GCU-LARE互聯,數倍于傳統GPU、CPU。
分布式片上共享緩存:提供10TB/s的超大帶寬,可編程共享緩存,可控線程內、線程間數據常駐共享,降低數據訪問延時并節約IO帶寬。
靈活互聯:四路GCU-LARE智能互聯,支持千卡級規模集群,為大中小型數據中心提供基于不同需求的人工智能訓練產品組合。
發布時間:2019年12月
架構特點:
應用場景:支持CNN、RNN、LSTM、BERT等常用人工訓練模型,可用于圖像、流數據、語音等訓練場景。
邃思2.0
發布背景:在邃思1.0的基礎上進行了全面升級,成為國內首家發布第二代人工智能訓練產品組合的公司。
計算能力:單精度FP32峰值算力達到40TFLOPS,單精度張量TF32峰值算力達到160TFLOPS。
存儲與帶寬:搭載了4顆HBM2E片上存儲芯片,高配支持64GB內存,帶寬達1.8TB/s。
互聯能力:GCU-LARE全面升級,提供雙向300GB/s互聯帶寬,支持數千張云燧CloudBlazer加速卡互聯。
軟件平臺:同步升級的馭算TopsRider軟件平臺,成為燧原科技構建原始創新軟件生態的基石。
三、邃思推理芯片架構(以邃思2.5為例)
發布時間:2021年12月
核心尺寸與工藝:Die核心尺寸為55mm×55mm,采用格芯12nm FinFET工藝打造。
架構特點:
高性能計算核心:采用第二代GCU-CARA架構,大幅提升單位面積的晶體管效率。
全面支持多種計算類型:張量、向量、標量計算全支持,同時支持虛擬化、動態節能技術等。
高效數據壓縮格式:采用完全自研的Sparse Value Segment數據壓縮格式,減少數據傳輸過程中的帶寬和功耗。
高速內存與帶寬:配備兩顆HBM2e顯存,容量16GB,帶寬819GB/s。
四、總結
燧原科技的邃思芯片架構展示了其在AI芯片領域的深厚技術積累和創新能力。通過不斷優化芯片架構和提升性能,燧原科技為云端訓練和推理場景提供了高效、可靠的解決方案,推動了AI技術的廣泛應用和發展。
責任編輯:David
【免責聲明】
1、本文內容、數據、圖表等來源于網絡引用或其他公開資料,版權歸屬原作者、原發表出處。若版權所有方對本文的引用持有異議,請聯系拍明芯城(marketing@iczoom.com),本方將及時處理。
2、本文的引用僅供讀者交流學習使用,不涉及商業目的。
3、本文內容僅代表作者觀點,拍明芯城不對內容的準確性、可靠性或完整性提供明示或暗示的保證。讀者閱讀本文后做出的決定或行為,是基于自主意愿和獨立判斷做出的,請讀者明確相關結果。
4、如需轉載本方擁有版權的文章,請聯系拍明芯城(marketing@iczoom.com)注明“轉載原因”。未經允許私自轉載拍明芯城將保留追究其法律責任的權利。
拍明芯城擁有對此聲明的最終解釋權。