NVIDIA Dynamo nhằm mục đích tăng hiệu quả suy luận AI

Ngày đăng 01:21 19/03/2025

SAN JOSE, California - NVIDIA (NVDA), gã khổng lồ bán dẫn với vốn hóa thị trường 2,83 nghìn tỷ USD và Điểm Piotroski hoàn hảo là 9 theo InvestingPro, đã giới thiệu NVIDIA Dynamo, một phần mềm mã nguồn mở mới được thiết kế để nâng cao hiệu quả và khả năng mở rộng của các mô hình suy luận AI trong các nhà máy AI. Được công bố hôm nay, nền tảng này sẵn sàng giúp các nhà cung cấp dịch vụ phát triển và tăng doanh thu bằng cách tối ưu hóa các yêu cầu suy luận AI trên các mạng GPU rộng lớn.

NVIDIA Dynamo, kế nhiệm Máy chủ suy™ luận NVIDIA Triton, tập trung vào việc tối đa hóa việc sử dụng tài nguyên GPU. Nó đạt được điều này bằng cách điều phối giao tiếp suy luận trên hàng nghìn GPU và sử dụng phục vụ phân tách để tối ưu hóa độc lập các giai đoạn xử lý và tạo của các mô hình ngôn ngữ lớn (LLM) trên các GPU khác nhau.

Jensen Huang, Giám đốc điều hành của NVIDIA, nhấn mạnh tầm quan trọng của việc đào tạo các mô hình AI để suy nghĩ và học hỏi theo nhiều cách khác nhau. Với việc công ty đạt được mức tăng trưởng doanh thu ấn tượng 114,2% và duy trì tỷ suất lợi nhuận gộp mạnh mẽ 75% trong mười hai tháng qua, ông tuyên bố rằng NVIDIA Dynamo phục vụ các mô hình này trên quy mô lớn, thúc đẩy tiết kiệm chi phí và nâng cao hiệu quả trên các nhà máy AI.

Các tối ưu hóa suy luận thông minh của phần mềm được báo cáo là tăng gấp đôi hiệu suất và doanh thu của các nhà máy AI sử dụng cùng số lượng GPU trên nền tảng NVIDIA Hopper™. Ví dụ: chạy mô hình DeepSeek-R1 trên một cụm giá đỡ GB200 NVL72, NVIDIA Dynamo đã tăng số lượng mã thông báo được tạo trên mỗi GPU lên hơn 30 lần.

Các tính năng của NVIDIA Dynamo bao gồm phân bổ GPU động để đáp ứng với khối lượng yêu cầu thay đổi, khả năng định tuyến truy vấn đến các GPU cụ thể để giảm thiểu tính toán phản hồi và giảm tải dữ liệu suy luận sang bộ nhớ và thiết bị lưu trữ giá cả phải chăng hơn. Các tính năng này chung nhằm mục đích tăng thông lượng và giảm chi phí.

Bản chất mã nguồn mở của NVIDIA Dynamo hỗ trợ nhiều khung khác nhau, bao gồm PyTorch và NVIDIA TensorRT-LLM™, tạo điều kiện phát triển và tối ưu hóa việc phục vụ các mô hình AI trên các suy luận phân tách. Các công ty như AWS, Cohere, CoreWeave, Dell và Google Cloud dự kiến sẽ đẩy nhanh việc áp dụng suy luận AI của họ với NVIDIA Dynamo.

Denis Yarats, CTO của Perplexity AI, bày tỏ mong đợi về khả năng phục vụ phân tán của Dynamo để tăng hiệu quả phục vụ suy luận. Tương tự, Phó chủ tịch cấp cao về kỹ thuật của Cohere, Saurabh Baji, dự đoán rằng NVIDIA Dynamo sẽ nâng cao trải nghiệm khách hàng doanh nghiệp của họ.

Những cải tiến của NVIDIA Dynamo bao gồm GPU Planner để quản lý GPU động, Bộ định tuyến thông minh để phân phối yêu cầu hiệu quả, thư viện giao tiếp có độ trễ thấp để truyền dữ liệu GPU nhanh chóng từ GPU sang GPU và Trình quản lý bộ nhớ để giảm tải dữ liệu hiệu quả về chi phí.

Phần mềm sẽ có sẵn trong các vi dịch vụ NVIDIA NIM™ và được thiết lập để được hỗ trợ bởi nền tảng phần mềm NVIDIA AI Enterprise trong bản phát hành trong tương lai. Thông báo này được đưa ra trong bài phát biểu quan trọng của NVIDIA GTC và các khả năng của phần mềm được trình bày chi tiết hơn trong một blog và các phiên liên quan tại hội nghị, tiếp tục đến ngày 21 tháng 3.

Thông tin này dựa trên tuyên bố thông cáo báo chí từ NVIDIA. Tình hình tài chính vững chắc và quỹ đạo tăng trưởng của công ty đã thu hút sự chú ý của các nhà phân tích, với 25 nhà phân tích gần đây đã điều chỉnh ước tính thu nhập của họ tăng lên. Các nhà đầu tư tìm kiếm thông tin chi tiết sâu hơn về tình hình tài chính và triển vọng tăng trưởng của NVIDIA có thể truy cập phân tích toàn diện thông qua InvestingPro, cung cấp quyền truy cập độc quyền vào hơn 30 chỉ số chính bổ sung và thông tin chuyên sâu của chuyên gia không được đề cập trong bài viết này.

Trong một tin tức gần đây khác, NVIDIA đã công bố hợp tác với các công ty viễn thông lớn, bao gồm T-Mobile, MITRE, Cisco, ODC và Booz Allen Hamilton, để thúc đẩy cơ sở hạ tầng mạng 6G gốc AI. Sự hợp tác này nhằm mục đích tăng cường kết nối cho các thiết bị khác nhau bằng cách tích hợp AI vào mạng không dây thế hệ tiếp theo, tập trung vào việc cải thiện hiệu quả và hiệu suất quang phổ. Ngoài ra, Truist Securities đã duy trì xếp hạng Mua đối với NVIDIA với mục tiêu giá là 205 đô la, bày tỏ sự tin tưởng vào triển vọng của công ty trước sự kiện GTC. Công ty nhấn mạnh tiềm năng của NVIDIA trong việc thúc đẩy niềm tin của nhà đầu tư bằng cách chứng minh khả năng hiển thị trung hạn về các cam kết chi tiêu của khách hàng.

Tương tự, UBS đã tái khẳng định xếp hạng Mua đối với NVIDIA, đặt mục tiêu giá là 185 USD. Công ty ghi nhận những điều chỉnh trong hỗn hợp sản phẩm của NVIDIA do những thay đổi trong kế hoạch mở rộng của TSMC nhưng vẫn duy trì dự báo về các lô hàng GPU. UBS đã đặt ước tính doanh thu cho quý tài chính đầu tiên của NVIDIA là khoảng 46 tỷ USD, với dự báo EPS cho năm 2025 và 2026 lần lượt là 5,27 USD và 6,22 USD. Trong khi đó, kỳ vọng đối với hội nghị GTC 2025 của NVIDIA cho thấy sự tập trung vào máy chủ AI, với các thông báo tiềm năng về chip AI B300 và các giải pháp mạng trung tâm dữ liệu. Các nhà đầu tư đang rất mong đợi hội nghị AI của NVIDIA, hy vọng những hiểu biết sâu sắc có thể thúc đẩy một làn sóng lạc quan và động lực mới cho công ty.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Xem tất cả bình luận (0)0

Bình luận mới nhất

VN30

1,629.12

-66.51

-3.92%

VN100

1,578.81

-79.85

-4.81%

HNX30

487.90

+5.16

+1.07%

US 500

6,404.10

+14.3

+0.22%

Dow Jones

44,837.56

-64.36

-0.14%

Hang Seng

25,524.45

-37.68

-0.15%

FTSE 100

9,119.13

+37.69

+0.42%

Bài Viết Phổ Biến Nhất

Tin tức

Phân tích

Chính phủ họp với các tập đoàn bất động sản, công ty chứng khoán lớn

Theo Investing.co...

29 thg 7, 2025

NHNN bơm hơn 173.000 tỷ đồng qua kênh OMO, thanh khoản lưu hành cao nhất 8 năm

Theo Investing.co...

28 thg 7, 2025

Vàng thế giới lao dốc mạnh

Theo Investing.co...

28 thg 7, 2025

Bitcoin dao động quanh mức 119.000 USD trước cuộc họp Fed và thời hạn áp thuế

Theo Investing.co...

28 thg 7, 2025

Hợp đồng tương lai Phố Wall ổn định khi lạc quan về thương mại lu mờ; cuộc họp Fed và báo cáo lợi nhuận của ’7 ông lớn’ sắp tới

Theo Investing.co...

28 thg 7, 2025

Thêm Tin Tức

Chuyển động Thị trường

Tên	Mới nhất	% T.đổi	KL
NHTM Cổ phần Sài Gòn - Hà Nội	15,050.0	-6.52%	138.35M
VPBank	23,600.0	-5.98%	129.72M
Chứng khoán VIX	23,950.0	-6.81%	113.60M
Chứng khoán SSI	33,300.0	-6.98%	105.88M
VNDIRECT	21,050.0	-6.86%	90.33M
Hoà Phát	25,350.0	-3.80%	82.73M
Techcombank	33,900.0	-4.78%	59.49M

Tên	Mới nhất	% T.đổi	KL
Dược Medipharco	12,500	+17.92%	200.00
Can Tho Import Export Seafood	20,000.00	+17.65%	14.10K
CONINCO	57,500	+15.00%	100.00
Đầu tư và Phát Triển Việt Trung Nam	2,300	+15.00%	11.77M
Song Be Rubber	9,200.00	+15.00%	1.11K
In Hàng không	18,400	+15.00%	100.00
Dapcau Garment	21,700.00	+14.81%	100.00

Tên	Mới nhất	% T.đổi	KL
Đầu tư Tài chính Giáo dục	2,600	-18.75%	5.83K
XNK Y tế TP.HCM	40,800	-15.00%	100.00
Xà phòng Hà Nội	15,200	-14.61%	99.50K
Dược Trung ương 3	18,700	-14.22%	100.00
Que hàn	6,200	-13.89%	6.30K
Viễn thông Điện tử Vinacap	5,600	-13.85%	2.18K
Cấp nước Nhơn Trạch	17,200	-13.13%	100.00

Cổ Phiếu Theo Xu Hướng

Tên	Mới nhất	% T.đổi	KL
Chứng khoán SSI	33,300.0	-6.98%	105.88M
Hoà Phát	25,350.0	-3.80%	82.73M
FPT	106,000.0	-4.76%	15.39M
VNDIRECT	21,050.0	-6.86%	90.33M
Chứng khoán VIX	23,950.0	-6.81%	113.60M

Hiển thị thêm

Cài Đặt Ứng Dụng của Chúng TôiQuét mã QR để cài đặt ứng dụng

Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.

Tìm Kiếm Phổ Biến

Hãy thử tìm kiếm với từ khóa khác

NVIDIA Dynamo nhằm mục đích tăng hiệu quả suy luận AI

Bình luận mới nhất

Cổ Phiếu Theo Xu Hướng