HPE推出搭載AMD技術的全新專用型解決方案,加速大型且複雜的AI模型訓練
Hewlett Packard Enterprise(HPE)推出專為複雜的AI模型訓練任務所設計的HPE ProLiant Compute XD685,搭載第五代AMD EPYC™處理器及AMD Instinct™ MI325X加速器。此款經過最佳化的全新HPE系統能夠迅速部署高效能、安全且節能的AI叢集,以支援大型語言模型訓練、自然語言處理及多模態訓練等應用。
AI的潛力正迅速被開發,有望在勞動生產力、醫療保健、氣候科學等領域實現重大突破。為了充分發揮AI潛力,AI服務供應商、政府機構和大型模型建構者需要靈活、高效能且能快速投入市場的解決方案。
「實現高效能的大型語言模型訓練,需要強大的擴充性、大規模的平行運算能力,以及獨特的服務,唯有HPE的高效能運算解決方案能夠滿足這些需求,」HPE高效能運算與AI基礎架構解決方案部門資深副總裁暨總經理Trish Damkroger表示。「作為全球最強大、最節能系統的領導供應商,HPE與AMD攜手合作,將這項創新技術擴展應用在新推出的HPE ProLiant Compute XD685,以支援日益增長的AI模型建構者市場,並加速各產業在科學與工程領域的突破。」
「HPE ProLiant Compute XD685搭載最新AMD EPYC處理器和Instinct加速器的強大組合,能協助客戶加快產品上市時程,並達成業界領先的AI效能和效率,」AMD資料中心解決方案事業群執行副總裁暨總經理Forrest Norrod表示。「透過與HPE合作,我們持續提供靈活、高效能的解決方案,充分發揮AI效益,以因應日益增長的大型語言模型訓練需求,並推動產業的創新競爭力。」
解決方案的速度與高靈活性可提升AI競爭優勢
HPE ProLiant Compute XD685採用HPE全新設計的模組化機箱,為大型AI模型訓練及調校專案提供快速的解決方案。這款輕巧且模組化的5U機箱不僅可縮短解決方案的上市時程,還具備高度靈活性,可支援各種GPU、CPU、組件、軟體及冷卻技術。此外,HPE ProLiant Compute XD685結合了HPE數十年的直接液冷技術專長以及HPE iLO的安全創新技術,打造出高效能、永續且安全的解決方案。
* 使用更少的GPU運行最大的AI模型:採用AMD CDNA™ 3架構的AMD Instinct™ MI325X加速器能夠為訓練和推論任務提供頂尖的AI效能與效率。MI325X加速器配備業界領先的HBM3E記憶體容量以及每秒6TB的記憶體頻寬,能最佳化效能並降低總擁有成本(TCO)。
* 透過選配直接液冷提高效率:HPE在部署全球最大液冷IT環境擁有數十年的專業知識和市場領導地位。利用直接液冷技術可協助企業因應不斷增長的電力需求,達成永續發展目標,同時降低營運成本。
* 加速部署與運行:HPE Services提供靈活且可客製化的全方位服務,能在全球各地安裝和部署大型AI叢集,同時確保運行的穩定性和卓越效能。透過在工廠內建置、整合、驗證、全面測試和客製化解決方案等專業服務,加速現場部署進程。
* 防範與日俱增的安全威脅:透過HPE iLO安全管理HPE ProLiant Compute XD685系統,提供順暢的管理體驗,並內建業界領先的創新安全功能,其從供應鏈端即植根於晶片中。
* 最佳化機櫃密度:HPE設計的5U伺服器機箱使用每機櫃8個節點的緊湊配置,以最大化8路GPU系統的機櫃密度。HPE ProLiant Compute XD685支援八個AMD Instinct™ MI325X或AMD Instinct™ MI300X加速器,搭載兩顆最新的AMD EPYC™ 9005系列處理器,並可選擇氣冷或直接液冷方案。
* 簡化大型AI叢集的管理:HPE Performance Cluster Manager是一款完全整合的集群系統管理軟體,能透過自動化設定,迅速從裸機啟動及佈署複雜系統,並利用詳細的即時監測資料、GPU壓力測試等功能維持叢集正常運作。
此外,HPE也宣布搭載 AMD EPYC處理器的HPE ProLiant伺服器已創下48項世界紀錄,其中30項為搭載AMD EPYC 9005系列處理器之HPE ProLiant Gen11伺服器創下的全新世界紀錄。這些新紀錄包括運行企業工作負載時的頂尖效能與能源效率。
上市時程
HPE ProLiant Compute XD685現已可透過HPE訂購,並將於2025年第一季全面上市。
AMD、AMD箭頭標誌、AMD Instinct、EPYC及其相關組合是Advanced Micro Devices, Inc.的註冊商標。其他名稱僅供參考之用,且可能是其各自擁有者的商標。