Với sự gia tăng nhanh chóng của các ứng dụng AI, dẫn đầu bởi các mô hình như ChatGPT, nhu cầu về sức mạnh tính toán đã tăng vọt. Để đáp ứng nhu cầu tính toán ngày càng tăng của kỷ nguyên AI, Tập đoàn H3C, dưới sự bảo trợ của Tsinghua Unigroup, gần đây đã trình làng 11 sản phẩm mới trong dòng H3C UniServer G6 và HPE Gen11 tại Hội nghị thượng đỉnh lãnh đạo NAVIGATE 2023. Các sản phẩm máy chủ mới này tạo ra một ma trận toàn diện cho AI trong nhiều tình huống khác nhau, cung cấp nền tảng cơ bản mạnh mẽ để xử lý các thuật toán mô hình và dữ liệu lớn, đồng thời đảm bảo nguồn cung cấp tài nguyên điện toán AI dồi dào.
Ma trận sản phẩm đa dạng để giải quyết các nhu cầu điện toán AI đa dạng
Là công ty đi đầu trong lĩnh vực điện toán thông minh, H3C Group đã tham gia sâu vào lĩnh vực AI trong nhiều năm. Vào năm 2022, H3C đã đạt được tốc độ tăng trưởng cao nhất trong thị trường điện toán tăng tốc Trung Quốc và tích lũy được tổng cộng 132 thứ hạng đầu tiên trên thế giới trong tiêu chuẩn AI nổi tiếng quốc tế MLPerf, thể hiện năng lực và chuyên môn kỹ thuật mạnh mẽ của mình.
Tận dụng kiến trúc điện toán tiên tiến và khả năng quản lý năng lượng điện toán thông minh được xây dựng trên nền tảng điện toán thông minh, H3C đã phát triển sản phẩm điện toán thông minh hàng đầu H3C UniServer R5500 G6, được thiết kế đặc biệt để đào tạo mô hình quy mô lớn. Họ cũng đã giới thiệu H3C UniServer R5300 G6, một công cụ điện toán lai phù hợp với các kịch bản đào tạo/suy luận quy mô lớn. Các sản phẩm này đáp ứng hơn nữa các yêu cầu điện toán đa dạng trong các kịch bản AI khác nhau, cung cấp phạm vi điện toán AI toàn diện.
Flagship điện toán thông minh được thiết kế để đào tạo mô hình quy mô lớn
H3C UniServer R5500 G6 kết hợp sức mạnh, mức tiêu thụ điện năng thấp và trí thông minh. So với thế hệ trước, nó cung cấp sức mạnh tính toán gấp ba lần, giảm 70% thời gian đào tạo cho các kịch bản đào tạo mô hình quy mô lớn GPT-4. Nó có thể áp dụng cho các tình huống kinh doanh AI khác nhau, chẳng hạn như đào tạo quy mô lớn, nhận dạng giọng nói, phân loại hình ảnh và dịch máy.
Điểm mạnh: R5500 G6 hỗ trợ tới 96 lõi CPU, giúp hiệu suất lõi tăng 150%. Nó được trang bị mô-đun 8-GPU NVIDIA HGX H800 mới, cung cấp 32 PFLOPS sức mạnh tính toán, giúp cải thiện gấp 9 lần tốc độ đào tạo AI mô hình quy mô lớn và cải thiện 30 lần về hiệu suất suy luận AI mô hình quy mô lớn. Ngoài ra, với sự hỗ trợ của mạng PCIe 5.0 và 400G, người dùng có thể triển khai các cụm điện toán AI hiệu suất cao hơn, đẩy nhanh việc áp dụng và ứng dụng AI trong doanh nghiệp.
Thông minh: R5500 G6 hỗ trợ hai cấu hình cấu trúc liên kết, thích ứng thông minh với các tình huống ứng dụng AI khác nhau và tăng tốc các ứng dụng điện toán khoa học và học sâu, cải thiện đáng kể việc sử dụng tài nguyên GPU. Nhờ tính năng GPU đa phiên bản của mô-đun H800, một H800 có thể được chia thành 7 phiên bản GPU, với khả năng lên tới 56 phiên bản GPU, mỗi phiên bản có tài nguyên bộ nhớ và điện toán độc lập. Điều này tăng cường đáng kể tính linh hoạt của tài nguyên AI.
Dấu chân Carbon thấp: R5500 G6 hỗ trợ đầy đủ khả năng làm mát bằng chất lỏng, bao gồm cả làm mát bằng chất lỏng cho cả CPU và GPU. Với PUE (Hiệu quả sử dụng năng lượng) dưới 1,1, nó cho phép “điện toán mát mẻ” trong bối cảnh tăng vọt tính toán.
Điều đáng nói là R5500 G6 đã được công nhận là một trong “Top 10 Máy chủ hiệu suất cao xuất sắc năm 2023” trong “Xếp hạng sức mạnh về hiệu suất tính toán năm 2023” khi phát hành.
Công cụ điện toán lai giúp đáp ứng linh hoạt nhu cầu đào tạo và suy luận
H3C UniServer R5300 G6, với tư cách là máy chủ AI thế hệ tiếp theo, mang đến những cải tiến đáng kể về thông số CPU và GPU so với phiên bản tiền nhiệm. Nó tự hào có hiệu suất vượt trội, cấu trúc liên kết thông minh cũng như khả năng lưu trữ và tính toán tích hợp, giúp nó phù hợp cho đào tạo mô hình deep learning, suy luận deep learning và các kịch bản ứng dụng AI khác, phù hợp linh hoạt với nhu cầu đào tạo và điện toán suy luận.
Hiệu suất vượt trội: R5300 G6 tương thích với thế hệ GPU cấp doanh nghiệp mới nhất của NVIDIA, mang lại hiệu suất cải thiện 4,85 lần so với thế hệ trước. Nó hỗ trợ nhiều loại thẻ tăng tốc AI khác nhau, chẳng hạn như GPU, DPU và NPU, để đáp ứng các yêu cầu về sức mạnh tính toán không đồng nhất của AI trong các tình huống khác nhau, hỗ trợ kỷ nguyên trí tuệ.
Cấu trúc liên kết thông minh: R5300 G6 cung cấp năm cài đặt cấu trúc liên kết GPU, bao gồm HPC, AI song song, AI nối tiếp, truy cập trực tiếp 4 thẻ và truy cập trực tiếp 8 thẻ. Tính linh hoạt chưa từng có này giúp tăng cường đáng kể khả năng thích ứng với các tình huống ứng dụng người dùng khác nhau, phân bổ tài nguyên một cách thông minh và thúc đẩy hoạt động điện toán hiệu quả.
Điện toán và lưu trữ tích hợp: R5300 G6 linh hoạt điều chỉnh thẻ tăng tốc AI và NIC thông minh, kết hợp khả năng đào tạo và suy luận. Nó hỗ trợ tới 10 GPU có chiều rộng gấp đôi và 24 khe ổ cứng LFF (Hệ số dạng lớn), cho phép đào tạo và suy luận đồng thời trên một máy chủ duy nhất và cung cấp công cụ tính toán hiệu quả về mặt chi phí cho môi trường phát triển và thử nghiệm. Với dung lượng lưu trữ lên tới 400TB, nó đáp ứng đầy đủ yêu cầu về không gian lưu trữ dữ liệu AI.
Với sự bùng nổ AI ngày càng tăng, sức mạnh tính toán liên tục được định hình lại và thách thức. Việc phát hành máy chủ AI thế hệ tiếp theo đánh dấu một cột mốc quan trọng khác trong cam kết của Tập đoàn H3C đối với công nghệ “trí thông minh vốn có” và động lực không ngừng cho sự phát triển của điện toán thông minh.
Nhìn về tương lai, được hướng dẫn bởi chiến lược “Trí tuệ bản địa trên nền tảng đám mây”, Tập đoàn H3C tuân thủ khái niệm “chủ nghĩa thực dụng tỉ mỉ, mang lại trí thông minh cho thời đại”. Họ sẽ tiếp tục khai thác mảnh đất màu mỡ của điện toán thông minh, khám phá các kịch bản ứng dụng AI cấp độ sâu và đẩy nhanh sự xuất hiện của một thế giới thông minh với sức mạnh tính toán thích ứng và sẵn sàng cho tương lai.
Thời gian đăng: Jul-04-2023