<rt id="ogeyi"><tr id="ogeyi"></tr></rt>
    1. <label id="ogeyi"></label>
      <label id="ogeyi"></label>

      幣圈網

      AMD正式發布ROCm 7開發平臺:AI訓練、推理性能暴漲至高3.8倍

      本站6月13日美國圣何塞現場報道——

      AMD今天正式發布了新一代AI加速卡Instinct MI350系列,硬件能力再次取得飛躍,進一步強化了面對NVIDIA的競爭力。

      但是我們知道,硬件性能和技術要想完全釋放潛力,尤其是在AI加速系統中,強大的軟件開發平臺是必不可少的。NVIDIA能在AI行業有如今的地位,最大的功臣和護城河就是CUDA。

      AMD也有自己的一套ROCm開發平臺,一直和NVIDIA CUDA都存在一定的差距,好在最近的進步幅度也是非常喜人的,包括對眾多AI大模型、框架的即時支持,全方位的開源。

      現在,我們又迎來了全新的ROCm 7版本,在最新模型與算法支持、高級AI特性、新硬件支持、集群管理、企業級特性等各方面,都再次有了長足的進步。

      訓練方面,ROCm 7支持一系列新特性,包括多個AMD開源模型、增強的AI框架、增強的內核與算法、新的數據類型(BF16/FP8)等等。

      官方聲稱對比ROCm 6,實測在Llama 2/3.1、千問1.5等多個模型中,性能提升普遍達到了3倍乃至更高。

      推理方面,新的變化同樣不少,包括增強框架、Serving優化、內核與算法改進、高級數據類型(FP8/FP6/FP4/混合)等。

      性能提升同樣喜人,Llama 3.1、千問2、DeepSeek R1等模型實測平均達3.5倍,最高更是可達3.8倍。

      有了ROCm 7的加持,MI355X面對NVIDIA B200也是絲毫不弱,比如DeepSeek R1 FP8吞吐量可以領先達30%。

      當然這只是一個例子,AMD并未更多地對比自家新品和友商競品。

      除了數據中心、企業端,ROCm 7在消費端也有全面改進,新增原生支持Red Hat EPEL、Ubuntu、OpenSUSE等更多的Linux系統發行版,其中前兩者下半年實現。

      Windows平臺上,也新增支持PyTorch、ONNX-EP兩大框架,分別在三季度和7月份開放預覽。

      AMD還順帶介紹了下全線的消費級AI解決方案,比如移動端的銳龍AI 300系列最高可以本地端側運行240億參數大模型,銳龍AI Max 300系列更是能跑到700億參數,而新一代線程撕裂者處理器、Radeon AI顯卡組合最高可以搞定1280億參數。

      鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

      主站蜘蛛池模板: 亚洲综合色婷婷在线观看| 激情综合丝袜美女一区二区| 色综合天天综合高清网国产| 国产成人综合久久精品下载| 国产综合成人亚洲区| 精品亚洲综合在线第一区| 狠狠色丁香婷婷综合久久来| 涩涩色中文综合亚洲| 伊人久久综合影院| 亚洲欧洲自拍拍偷综合| 综合激情区视频一区视频二区 | 综合久久久久久中文字幕| 国产亚洲综合视频| 久久综合狠狠综合久久| 色婷婷久久综合中文久久一本| 狠狠色婷婷七月色综合| 丁香六月激情综合| 色综合久久天天综合| 亚洲五月综合网色九月色| 国产亚洲综合色就色| 国产精品天干天干在线综合| 精品综合久久久久久98| 亚洲国产成人久久综合碰碰动漫3d| 狠狠色综合网久久久久久| 亚洲综合久久精品无码色欲| 亚洲一区综合在线播放| 亚洲色婷婷综合久久| 国产综合无码一区二区辣椒| 一本大道久久a久久综合| 狠狠综合亚洲综合亚洲色| 色婷婷久久综合中文久久一本`| 久久综合给合久久狠狠狠97色69| 久久精品国产亚洲综合色| 亚洲综合精品香蕉久久网97| 91精品国产综合久久精品| 丁香婷婷色五月激情综合深爱| 在线亚洲97se亚洲综合在线| 久久久久一级精品亚洲国产成人综合AV区 | 久久桃花综合桃花七七网| 国产综合无码一区二区色蜜蜜| 另类小说图片综合网|