AMD「NextHorizon」活動(dòng)中,運(yùn)算不僅揭曉7nmZen2“ROME”EPYC處理器,先挺更搶先挺進(jìn)7nm製程GPU與PCIe4.0規(guī)格,進(jìn)n加速發(fā)表首款RadeonInstinctMI60與MI50運(yùn)算加速卡。發(fā)表
Vega架構(gòu)優(yōu)化7nm製程RadeonInstinctMI60運(yùn)算加速卡
AMD如期推出Vega架構(gòu)優(yōu)化并採(cǎi)用7nm製程的運(yùn)算GPU「RadeonInstinctMI60」運(yùn)算加速卡,新製程與架構(gòu)優(yōu)化,先挺讓GPU電晶體密度提高2倍,進(jìn)n加速更有著1.25倍的發(fā)表性能提升,以及更高的運(yùn)算每瓦效能。
MI60著重于「FP64」與「FP32」加速運(yùn)算,先挺可加速深度學(xué)習(xí)所需的進(jìn)n加速Training與Inference運(yùn)算;以及32GBHBM2記憶體,不僅可達(dá)到1TB/s記憶體頻寬速度,發(fā)表更具備End-to-EndECC保護(hù)。
而MI60除了是首款7nmGPU之外,更是首款支援PCIe4.0的繪圖處理器;而多GPU之間通過(guò)InfinityFabric橋接,可達(dá)到100GB/sperLink的連接頻寬,而受惠于PCIe4.0可讓GPU與CPU之間達(dá)到雙向Bi-Directional64GB/s的頻寬;更支援硬體層級(jí)的GPU虛擬化技術(shù)。
性能方面,MI60在一般運(yùn)算如「雙精度矩陣乘法(DGEMM)」比起上一代MI25有著8.8倍的性能提升,達(dá)到6.717TFLOPS;而深度學(xué)習(xí)Resnet-5o的影像辨識(shí)速度,MI60可達(dá)到每秒498張,更是MI25的2.8倍性能提升。
而且在Resnet-5o深度學(xué)習(xí)訓(xùn)練上,有著近乎倍數(shù)的多GPU性能提升,2GPU有著1.99倍性能提升,8GPU更可保持在7.64倍的訓(xùn)練性能提升。
至于MI60與對(duì)手TeslaV100相互比較,雙精度矩陣乘法(DGEMM),MI60有著6.717TFLOPS快過(guò)V100的6.627TFLOPS;至于單精度矩陣乘法(SGEMM),MI60有著14TFLOPS運(yùn)算能力,亦贏過(guò)V100的13.1TFLOPS;只不過(guò),在Resnet-5o深度學(xué)習(xí)訓(xùn)練上,MI60僅每秒334張的處理速度,緊追在V100每秒357張的性能之后。
簡(jiǎn)單來(lái)說(shuō)RadeonInstinctMI60是世界首款7nmGPU產(chǎn)品,以及第一款支援PCIe4.0的運(yùn)算加速卡,更達(dá)到1TB/s記憶體頻寬速度,以及硬體層級(jí)虛擬化。
針對(duì)HPC有著7.4TFLOPSFP64的性能,對(duì)于深度學(xué)習(xí)的Training有著14.7TFLOPSFP32的性能,至于深度學(xué)習(xí)Inference有著118TOPSINT4的性能表現(xiàn)。