Chính phủ họp với các tập đoàn bất động sản, công ty chứng khoán lớn
SAN JOSE, California - NVIDIA (NVDA), gã khổng lồ bán dẫn với vốn hóa thị trường 2,83 nghìn tỷ USD và Điểm Piotroski hoàn hảo là 9 theo InvestingPro, đã giới thiệu NVIDIA Dynamo, một phần mềm mã nguồn mở mới được thiết kế để nâng cao hiệu quả và khả năng mở rộng của các mô hình suy luận AI trong các nhà máy AI. Được công bố hôm nay, nền tảng này sẵn sàng giúp các nhà cung cấp dịch vụ phát triển và tăng doanh thu bằng cách tối ưu hóa các yêu cầu suy luận AI trên các mạng GPU rộng lớn.
NVIDIA Dynamo, kế nhiệm Máy chủ suy™ luận NVIDIA Triton, tập trung vào việc tối đa hóa việc sử dụng tài nguyên GPU. Nó đạt được điều này bằng cách điều phối giao tiếp suy luận trên hàng nghìn GPU và sử dụng phục vụ phân tách để tối ưu hóa độc lập các giai đoạn xử lý và tạo của các mô hình ngôn ngữ lớn (LLM) trên các GPU khác nhau.
Jensen Huang, Giám đốc điều hành của NVIDIA, nhấn mạnh tầm quan trọng của việc đào tạo các mô hình AI để suy nghĩ và học hỏi theo nhiều cách khác nhau. Với việc công ty đạt được mức tăng trưởng doanh thu ấn tượng 114,2% và duy trì tỷ suất lợi nhuận gộp mạnh mẽ 75% trong mười hai tháng qua, ông tuyên bố rằng NVIDIA Dynamo phục vụ các mô hình này trên quy mô lớn, thúc đẩy tiết kiệm chi phí và nâng cao hiệu quả trên các nhà máy AI.
Các tối ưu hóa suy luận thông minh của phần mềm được báo cáo là tăng gấp đôi hiệu suất và doanh thu của các nhà máy AI sử dụng cùng số lượng GPU trên nền tảng NVIDIA Hopper™. Ví dụ: chạy mô hình DeepSeek-R1 trên một cụm giá đỡ GB200 NVL72, NVIDIA Dynamo đã tăng số lượng mã thông báo được tạo trên mỗi GPU lên hơn 30 lần.
Các tính năng của NVIDIA Dynamo bao gồm phân bổ GPU động để đáp ứng với khối lượng yêu cầu thay đổi, khả năng định tuyến truy vấn đến các GPU cụ thể để giảm thiểu tính toán phản hồi và giảm tải dữ liệu suy luận sang bộ nhớ và thiết bị lưu trữ giá cả phải chăng hơn. Các tính năng này chung nhằm mục đích tăng thông lượng và giảm chi phí.
Bản chất mã nguồn mở của NVIDIA Dynamo hỗ trợ nhiều khung khác nhau, bao gồm PyTorch và NVIDIA TensorRT-LLM™, tạo điều kiện phát triển và tối ưu hóa việc phục vụ các mô hình AI trên các suy luận phân tách. Các công ty như AWS, Cohere, CoreWeave, Dell và Google Cloud dự kiến sẽ đẩy nhanh việc áp dụng suy luận AI của họ với NVIDIA Dynamo.
Denis Yarats, CTO của Perplexity AI, bày tỏ mong đợi về khả năng phục vụ phân tán của Dynamo để tăng hiệu quả phục vụ suy luận. Tương tự, Phó chủ tịch cấp cao về kỹ thuật của Cohere, Saurabh Baji, dự đoán rằng NVIDIA Dynamo sẽ nâng cao trải nghiệm khách hàng doanh nghiệp của họ.
Những cải tiến của NVIDIA Dynamo bao gồm GPU Planner để quản lý GPU động, Bộ định tuyến thông minh để phân phối yêu cầu hiệu quả, thư viện giao tiếp có độ trễ thấp để truyền dữ liệu GPU nhanh chóng từ GPU sang GPU và Trình quản lý bộ nhớ để giảm tải dữ liệu hiệu quả về chi phí.
Phần mềm sẽ có sẵn trong các vi dịch vụ NVIDIA NIM™ và được thiết lập để được hỗ trợ bởi nền tảng phần mềm NVIDIA AI Enterprise trong bản phát hành trong tương lai. Thông báo này được đưa ra trong bài phát biểu quan trọng của NVIDIA GTC và các khả năng của phần mềm được trình bày chi tiết hơn trong một blog và các phiên liên quan tại hội nghị, tiếp tục đến ngày 21 tháng 3.
Thông tin này dựa trên tuyên bố thông cáo báo chí từ NVIDIA. Tình hình tài chính vững chắc và quỹ đạo tăng trưởng của công ty đã thu hút sự chú ý của các nhà phân tích, với 25 nhà phân tích gần đây đã điều chỉnh ước tính thu nhập của họ tăng lên. Các nhà đầu tư tìm kiếm thông tin chi tiết sâu hơn về tình hình tài chính và triển vọng tăng trưởng của NVIDIA có thể truy cập phân tích toàn diện thông qua InvestingPro, cung cấp quyền truy cập độc quyền vào hơn 30 chỉ số chính bổ sung và thông tin chuyên sâu của chuyên gia không được đề cập trong bài viết này.
Trong một tin tức gần đây khác, NVIDIA đã công bố hợp tác với các công ty viễn thông lớn, bao gồm T-Mobile, MITRE, Cisco, ODC và Booz Allen Hamilton, để thúc đẩy cơ sở hạ tầng mạng 6G gốc AI. Sự hợp tác này nhằm mục đích tăng cường kết nối cho các thiết bị khác nhau bằng cách tích hợp AI vào mạng không dây thế hệ tiếp theo, tập trung vào việc cải thiện hiệu quả và hiệu suất quang phổ. Ngoài ra, Truist Securities đã duy trì xếp hạng Mua đối với NVIDIA với mục tiêu giá là 205 đô la, bày tỏ sự tin tưởng vào triển vọng của công ty trước sự kiện GTC. Công ty nhấn mạnh tiềm năng của NVIDIA trong việc thúc đẩy niềm tin của nhà đầu tư bằng cách chứng minh khả năng hiển thị trung hạn về các cam kết chi tiêu của khách hàng.
Tương tự, UBS đã tái khẳng định xếp hạng Mua đối với NVIDIA, đặt mục tiêu giá là 185 USD. Công ty ghi nhận những điều chỉnh trong hỗn hợp sản phẩm của NVIDIA do những thay đổi trong kế hoạch mở rộng của TSMC nhưng vẫn duy trì dự báo về các lô hàng GPU. UBS đã đặt ước tính doanh thu cho quý tài chính đầu tiên của NVIDIA là khoảng 46 tỷ USD, với dự báo EPS cho năm 2025 và 2026 lần lượt là 5,27 USD và 6,22 USD. Trong khi đó, kỳ vọng đối với hội nghị GTC 2025 của NVIDIA cho thấy sự tập trung vào máy chủ AI, với các thông báo tiềm năng về chip AI B300 và các giải pháp mạng trung tâm dữ liệu. Các nhà đầu tư đang rất mong đợi hội nghị AI của NVIDIA, hy vọng những hiểu biết sâu sắc có thể thúc đẩy một làn sóng lạc quan và động lực mới cho công ty.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.