Kiến trúc của NVIDIA mang lại bước nhảy vọt về hiệu suất gấp 10 lần cho các mô hình AI phức tạp

Ngày đăng 23:17 03/12/2025
© Reuters.

Investing.com -- Hệ thống quy mô giá đỡ GB200 NVL72 của NVIDIA đang mang lại bước nhảy vọt về hiệu suất gấp 10 lần cho các mô hình AI hỗn hợp chuyên gia (MoE) so với phần cứng thế hệ trước, làm thay đổi cách triển khai các mô hình AI tiên tiến, theo bài đăng mới nhất trên blog của công ty.

Kiến trúc MoE, bắt chước não người bằng cách chỉ kích hoạt các thành phần "chuyên gia" liên quan cho từng nhiệm vụ, đã trở thành phương pháp tiếp cận chủ đạo cho các mô hình AI hàng đầu. Bảng xếp hạng Artificial Analysis cho thấy 10 mô hình mã nguồn mở thông minh nhất đều sử dụng kiến trúc MoE, bao gồm DeepSeek-R1, Kimi K2 Thinking của Moonshot AI, gpt-oss-120B của OpenAI, và Mistral Large 3.

Hệ thống NVIDIA GB200 NVL72 kết hợp 72 GPU Blackwell hoạt động như một đơn vị duy nhất, cung cấp hiệu suất AI 1,4 exaflops với 30TB bộ nhớ chia sẻ. NVLink Switch của hệ thống tạo ra một cấu trúc thống nhất với khả năng kết nối 130 TB/giây, cho phép các chuyên gia được phân bổ trên tối đa 72 GPU.

Thiết kế này trực tiếp giải quyết các thách thức mở rộng MoE chính bằng cách giảm số lượng chuyên gia trên mỗi GPU và tăng tốc giao tiếp giữa các chuyên gia. Hệ thống cũng tích hợp khung NVIDIA Dynamo và định dạng NVFP4 để nâng cao hiệu suất hơn nữa.

"Tại CoreWeave, khách hàng của chúng tôi đang tận dụng nền tảng của chúng tôi để đưa các mô hình hỗn hợp chuyên gia vào sản xuất khi họ xây dựng quy trình công việc tự động," ông Peter Salanki, đồng sáng lập và giám đốc công nghệ tại CoreWeave cho biết.

GB200 NVL72 đang được triển khai bởi các nhà cung cấp đám mây lớn bao gồm Amazon Web Services, Google Cloud, Microsoft Azure, và Oracle Cloud Infrastructure, cùng nhiều đơn vị khác.

DeepL đang sử dụng hệ thống Blackwell NVL72 để đào tạo các mô hình AI thế hệ tiếp theo của họ. "DeepL đang tận dụng phần cứng NVIDIA GB200 để đào tạo các mô hình hỗn hợp chuyên gia, nâng cao kiến trúc mô hình để cải thiện hiệu quả trong quá trình đào tạo và suy luận," ông Paul Busch, trưởng nhóm nghiên cứu tại DeepL cho biết.

Sự cải thiện hiệu suất gấp 10 lần chuyển thành doanh thu token gấp 10 lần, cải thiện đáng kể hiệu quả kinh tế của việc triển khai AI trong các trung tâm dữ liệu bị hạn chế về năng lượng. Ông Jensen Huang, nhà sáng lập và CEO của NVIDIA đã nhấn mạnh bước nhảy vọt về hiệu suất này cho DeepSeek-R1 tại NVIDIA GTC Washington, D.C.

Fireworks AI đã triển khai Kimi K2 trên nền tảng NVIDIA B200. "Thiết kế quy mô giá đỡ NVIDIA GB200 NVL72 làm cho việc phục vụ mô hình MoE hiệu quả hơn đáng kể," bà Lin Qiao, đồng sáng lập và CEO của Fireworks AI cho biết.

Mô hình Kinnie mới cũng đạt được mức tăng hiệu suất gấp 10 lần trên GB200 NVL72 so với H200, dẫn đến trải nghiệm người dùng tốt hơn, chi phí trên mỗi token thấp hơn và hiệu quả năng lượng cao hơn.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.