Nvidia công bố Blackwell Ultra B300 – Nhanh hơn 1.5 lần so với B200, trang bị 288GB HBM3e và đạt 15 PFLOPS FP4
Tại sự kiện GTC 2025 ở San Jose, California, CEO Jensen Huang của Nvidia đã chính thức giới thiệu GPU trung tâm dữ liệu thế hệ mới – Blackwell Ultra B300. Với dung lượng bộ nhớ tăng 50% và hiệu năng tính toán FP4 cao hơn 1,5 lần so với dòng B200, sản phẩm này tiếp tục đẩy nhanh cuộc đua phát triển các mô hình AI lớn và phức tạp hơn. Nvidia mô tả B300 là GPU "dành cho thời đại suy luận", ám chỉ khả năng phục vụ các mô hình AI hiện đại như DeepSeek R1 – vốn làm được nhiều hơn là chỉ lặp lại dữ liệu đã học.
Blackwell Ultra B300 không chỉ là một GPU đơn lẻ, mà đi kèm cả loạt giải pháp hệ thống mới: cụ thể gồm máy chủ B300 NVL16, máy trạm GB300 DGX Station, và hệ thống rack GB300 NV72L. Khi kết hợp 8 rack NV72L, Nvidia tạo thành siêu máy tính Blackwell Ultra DGX SuperPOD với cấu hình 288 CPU Grace, 576 GPU Blackwell Ultra, 300 TB HBM3e và tổng hiệu năng đạt 11,5 ExaFLOPS FP4. Đây là nền tảng được Nvidia gọi là "nhà máy AI" (AI Factories).
Tuy Nvidia khẳng định B300 tăng 1.5 lần hiệu năng FP4, nhưng vẫn chưa rõ các mức độ tính toán khác như FP8 hay FP16 có được nâng tương tự hay không. Một số thông số cho thấy có thể Nvidia không chỉ tăng số lõi tensor, mà còn điều chỉnh xung nhịp hoặc kích thước vật lý chip để tối ưu hóa hiệu năng.
Điểm đáng chú ý khác là bộ nhớ tích hợp của B300 tăng lên đến 288GB HBM3e, giúp các mô hình AI lớn hơn có thể chạy trực tiếp mà không cần chia nhỏ, đồng thời hỗ trợ tăng tốc độ suy luận với khối lượng lớn tham số.
Về mặt phần mềm, Nvidia cũng giới thiệu thư viện Dynamo, giúp các GPU B300 phục vụ tốt hơn cho các mô hình AI thiên về "suy luận" như DeepSeek. Theo hãng, chỉ riêng một rack NV72L sử dụng B300 có thể đạt hiệu năng suy luận gấp 30 lần so với cấu hình tương đương dùng Hopper. Với mô hình DeepSeek R1-671B, Blackwell Ultra có thể xử lý 1.000 token/giây, gấp 10 lần tốc độ của Hopper (100 token/giây), giúp rút ngắn thời gian phản hồi truy vấn lớn từ 1,5 phút xuống còn 10 giây.
Các sản phẩm thuộc dòng B300 dự kiến sẽ bắt đầu giao hàng trong nửa cuối năm 2025. Nvidia cũng kỳ vọng sẽ vượt qua doanh thu 11 tỷ USD từ dòng Blackwell B200/B100 trong năm tài chính trước đó, với mức tăng trưởng đáng kể từ thế hệ Blackwell Ultra mới này.