NVIDIA ra mắt các mô hình suy luận AI của Llama Nemotron

Ngày đăng 02:17 19/03/2025
© Reuters

SAN JOSE, California - NVIDIA, gã khổng lồ bán dẫn với vốn hóa thị trường 2,84 nghìn tỷ USD và Điểm Piotroski hoàn hảo là 9 theo InvestingPro, đã công bố phát hành dòng mô hình Llama Nemotron, được thiết kế để nâng cao khả năng suy luận AI cho các nhà phát triển và doanh nghiệp. Các mô hình mới được cho là cải thiện toán học nhiều bước, mã hóa, suy luận và các nhiệm vụ ra quyết định phức tạp, với cải tiến độ chính xác lên đến 20% và tối ưu hóa tốc độ suy luận gấp 5 lần so với các mô hình hiện có. Sự đổi mới này diễn ra khi NVIDIA duy trì tỷ suất lợi nhuận gộp ấn tượng 75% và tăng trưởng doanh thu 114% so với cùng kỳ năm ngoái.

Các mô hình lý luận Llama Nemotron có sẵn ở các kích thước Nano, Super và Ultra, mỗi mô hình được tối ưu hóa cho các tình huống triển khai khác nhau. Mẫu Nano được thiết kế riêng cho PC và thiết bị biên, mẫu Super dành cho thiết lập GPU đơn và mẫu Ultra dành cho máy chủ nhiều GPU.

Các công ty như Accenture, Amdocs, Atlassian, Box, Cadence, CrowdStrike, Deloitte, IQVIA, Microsoft, SAP và ServiceNow đang hợp tác với NVIDIA để tích hợp các mô hình lý luận này vào dịch vụ của họ. Ví dụ: Microsoft có kế hoạch kết hợp các mô hình Llama Nemotron vào Azure AI Foundry của mình và SAP đang sử dụng các mô hình này để cải thiện các giải pháp AI kinh doanh và Joule AI copilot. Bạn muốn hiểu sâu hơn về các chỉ số tăng trưởng và sức khỏe tài chính của NVIDIA? InvestingPro cung cấp 20+ chỉ số chính bổ sung và phân tích chuyên gia trong Báo cáo Nghiên cứu Chuyên nghiệp toàn diện.

NVIDIA cũng đã giới thiệu các công cụ và phần mềm mới để hỗ trợ triển khai các mô hình này, bao gồm các vi dịch vụ NVIDIA NIM để tối ưu hóa suy luận và cho phép học hỏi liên tục, cũng như NVIDIA AI-Q Blueprint và NVIDIA AI Data Platform để hỗ trợ xây dựng các hệ thống AI cộng tác.

Các mẫu Llama Nemotron Nano và Super, cùng với các vi dịch vụ NIM, hiện có sẵn để phát triển, thử nghiệm và nghiên cứu thông qua Chương trình nhà phát triển của NVIDIA. Doanh nghiệp có thể triển khai các mô hình này trong sản xuất với NVIDIA AI Enterprise trên trung tâm dữ liệu và cơ sở hạ tầng đám mây. Bản thiết kế NVIDIA AI-Q dự kiến sẽ có sẵn vào tháng 4 và bộ công cụ NVIDIA AgentIQ đã có thể truy cập được trên GitHub.

Tin tức này dựa trên một tuyên bố thông cáo báo chí từ NVIDIA, trong đó nhấn mạnh sự dẫn đầu liên tục của công ty trong việc phát triển điện toán tăng tốc và AI tác nhân. Với 25 nhà phân tích gần đây đã sửa đổi ước tính thu nhập của họ và khuyến nghị đồng thuận là 1,34 (Mua mạnh) theo InvestingPro, vị trí thị trường của NVIDIA có vẻ mạnh mẽ. Khám phá phân tích chi tiết hơn và hơn 30 chỉ số tài chính bổ sung với các công cụ nghiên cứu toàn diện của InvestingPro.

Trong một tin tức gần đây khác, NVIDIA đã tiết lộ một loạt các tiến bộ công nghệ đáng kể nhằm nâng cao khả năng AI và robot. Công ty đã giới thiệu mô hình GR00T N1, một mô hình nền tảng cho robot hình người, trong sự kiện GTC của mình. Mô hình này được thiết kế để cải thiện suy luận và kỹ năng của robot hình người và có sẵn cho các nhà phát triển trên toàn thế giới. NVIDIA cũng ra mắt GPU RTX PRO Blackwell, dự kiến sẽ nâng cao năng suất trong các lĩnh vực chuyên môn khác nhau bằng cách tăng tốc quy trình làm việc trong các lĩnh vực AI, kỹ thuật, sáng tạo và kỹ thuật.

Ngoài ra, NVIDIA đã công bố phát hành hai siêu máy tính AI cá nhân, DGX Spark và DGX Station, mang kiến trúc NVIDIA Grace Blackwell lên máy tính để bàn, cho phép các nhà phát triển xây dựng và triển khai các mô hình AI lớn. Công ty cũng giới thiệu các thiết bị chuyển mạch nhà máy AI tiết kiệm năng lượng, NVIDIA Spectrum-X và Quantum-X, để tối ưu hóa mạng trong các trung tâm dữ liệu AI. Những thiết bị chuyển mạch này hứa hẹn sẽ giảm đáng kể mức tiêu thụ năng lượng và chi phí vận hành.

Hơn nữa, NVIDIA đã tiết lộ nền tảng Blackwell Ultra, được thiết kế để tăng cường khả năng suy luận và suy luận mở rộng quy mô AI, dự kiến sẽ mang lại hiệu suất AI gấp 1,5 lần so với người tiền nhiệm. Nền tảng này bao gồm các hệ thống GB300 NVL72 và HGX B300 NVL16, nhằm cải thiện chất lượng dịch vụ AI. Sự hợp tác liên tục của NVIDIA với các đối tác như Google DeepMind và Disney Research tiếp tục hỗ trợ sự phát triển của các công nghệ AI và robot tiên tiến.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.