HPE擴展直接液冷超級運算解決方案,推出兩款專為服務供應商與大型企業打造的AI系統
Hewlett Packard Enterprise(NYSE:HPE)宣布推出全新的高效能運算(HPC)與人工智慧(AI)基礎架構產品組合,包括業界領先的HPE Cray Supercomputing EX解決方案,以及兩套針對大型語言模型(LLM)訓練、自然語言處理(NLP)和多模態訓練最佳化的AI系統。此全新的超級運算解決方案旨在協助全球客戶加速科學研究與創新。
「隨著服務供應商和各國政府積極投資主權AI計畫,高效能運算已逐漸成為訓練大規模AI模型、加速科學探索與創新的關鍵基礎,」HPE高效能運算與AI基礎架構解決方案部門資深副總裁暨總經理Trish Damkroger表示。「我們的客戶透過HPE領先全球的HPC解決方案,以及在交付、部署和維護全方位整合系統方面的數十年經驗,協助其加速部署AI系統,從而更快速、更有效率地實現價值。」
業界領先的端對端HPC解決方案:HPE Cray Supercomputing EX
HPE在打造全球最快速、最節能的超級電腦領域居領導地位。HPE為其業界領先的HPC產品組合推出以HPE Cray Supercomputing EX系統為基礎之全新產品,協助研究機構解決全球重大挑戰,並助力政府機構發展主權AI。此產品組合採用業界首款100%無風扇直接液冷(DLC)系統架構,涵蓋HPE超級運算解決方案的各層面,包括運算節點、網路和儲存,並輔以全新的軟體產品。
• HPE Cray Supercomputing EX4252 Gen 2 Compute Blade-此運算刀鋒伺服器可在單一機櫃內提供高達98,304個核心的運算力,為超級運算領域中最強大的單機架系統。其搭載八個第5代AMD EPYC™處理器,支援高CPU密度,讓客戶在相同空間內實現更高效的運算。HPE Cray Supercomputing EX4252 Gen 2 Compute Blade預計於2025年春季上市。
• HPE Cray Supercomputing EX154n Accelerator Blade-為大幅縮短超級運算工作負載的完成時間,其單一機櫃可容納多達224個NVIDIA Blackwell GPU。每組加速器刀鋒伺服器皆搭載NVIDIA GB200 Grace Blackwell NVL4 Superchip設計,內涵整合四個透過NVIDIA NVLink™連接的Blackwell GPU,以及兩顆透過NVIDIA NVLink-C2C連接的NVIDIA Grace CPU。HPE Cray Supercomputing EX154n Accelerator Blade預計於2025年底全面上市。
• HPE Slingshot Interconnect 400-HPE的次世代百萬兆級(Exascale)互連產品組合提供網路介面控制器(NIC)、電纜線和交換器,可實現每秒400 Gigabit的傳輸速度。其線速是前一代的兩倍i,並具備自動壅塞管理和自適應路由等功能,可實現超低尾延遲,讓客戶能以更少的網路基礎架構執行大型工作負載。此新版本的HPE Slingshot將於2025年秋季上市,並支援基於HPE Cray Supercomputing EX 系統的叢集使用。
• HPE Cray Supercomputing Storage Systems E2000-此高效能儲存系統專為專為大型超級電腦設計,輸入/輸出(I/O)效能較前一代提升逾一倍ii。其採用開源Lustre檔案系統為基礎開發,透過降低I/O作業的閒置時間,提升CPU和GPU運算節點的使用效率。此HPC儲存系統將於2025年初在HPE Cray Supercomputing EX系統上全面推出。
• HPE Cray Supercomputing User Services Software-此全新軟體產品可改善運算密集型工作負載的使用者體驗。其現已正式上市,透過多項功能協助客戶最佳化系統效率、調節功耗,並在超級運算基礎架構上靈活執行各種工作負載。
新的HPE ProLiant Compute XD伺服器系列針對AI模型訓練與調校效能進行最佳化
HPE持續推出新的伺服器系列,協助客戶簡化大規模、高效能AI叢集的部署流程。HPE ProLiant Compute XD伺服器運用憑藉HPE在導入和部署大型AI系統的專業能力,協助服務供應商與大型企業訓練其自行開發的AI模型。客戶亦可選購HPE專業服務,由HPE先進製造廠區協助系統建置、客製化、整合、驗證與完整測試,加速現場部署作業。
HPE ProLiant Compute 伺服器獨家搭載HPE Integrated Lights-Out(iLO)管理技術,讓特定授權人員能透過頻外遠端控制存取伺服器,並提供比標準頻內網路存取方式更高的安全性。
• HPE ProLiant Compute XD680伺服器-以提供最佳性價比為考量,並採用風冷設計,能處理要求嚴苛的AI訓練、調校和推論工作負載。其配備一個HPE設計的機箱,可在體積小巧的單一節點中容納八顆Intel® Gaudi® 3 AI加速器。搭載Intel Gaudi 3的HPE ProLiant Compute XD680伺服器將於2024年12月上市。
• HPE ProLiant Compute XD685伺服器-針對重視效能、競爭優勢和能源效率的客戶,此全新版本的HPE ProLiant Compute XD685伺服器將搭載NVIDIA GPU,加速大型、複雜AI模型的訓練。此伺服器採用五個機架單元的機箱設計,搭載八個NVIDIA H200 SXM Tensor Core GPU或NVIDIA Blackwell GPU,並運用 HPE在液冷技術領域長達數十年的專業經驗,有效冷卻GPU、CPU和交換器。搭載NVIDIA HGX H200 8-GPU的HPE ProLiant Compute XD685伺服器預計於2025年初上市,而搭載 NVIDIA Blackwell GPU 的伺服器將配合NVIDIA Blackwell GPU的推出時程發表。
HPE已於十月發表搭載八個AMD Instinct™ MI325X加速器和兩個AMD EPYC™ CPU的HPE ProLiant Compute XD685伺服器。HPE ProLiant Compute XD伺服器系列為HPE全方位AI解決方案的一部分,其中還包括HPE Private Cloud AI和HPE ProLiant Compute DL伺服器。
隨著客戶需求不斷演進,HPE持續突破創新界限,積極回應市場需求,展現在協助傳統超級運算客戶運用AI模型加速科學研究方面的實力。
資料來源
i HPE Slingshot前代產品的傳輸速度為每秒200 Gbps
ii HPE Cray ClusterStor E1000的讀取效能為每秒85 GB、寫入效能為每秒65 GB;HPE Cray Supercomputing Storage Systems E2000的讀取效能為每秒190 GB、寫入效能為每秒140 GB