Alibaba ra mắt Qwen3, thách thức các đối thủ hàng đầu trong ngành

Ngày đăng 04:42 29/04/2025
© Reuters.

Investing.com — Tập đoàn Alibaba Group Holdings Ltd ADR (NYSE:BABA) đã giới thiệu dòng mô hình ngôn ngữ lớn thế hệ tiếp theo, Qwen3, vào hôm thứ Ba, mở rộng các giải pháp AI của mình với nhiều kích thước và kiến trúc mô hình khác nhau. Phiên bản này bao gồm tám mô hình trọng số mở, sáu mô hình dày đặc và hai mô hình hỗn hợp chuyên gia (MoE), với số tham số từ 0,6 tỷ đến 235 tỷ.

Mô hình chủ lực, Qwen3-235B-A22B, đã thể hiện hiệu suất cạnh tranh trong các tiêu chuẩn đánh giá về lập trình, toán học và các tác vụ chung khi so sánh với các mô hình hàng đầu như DeepSeek-R1, Grok-3 và Gemini-2.5-Pro. Các mô hình nhỏ hơn như Qwen3-30B-A3B cũng vượt trội hơn các mô hình có nhiều tham số hơn, cho thấy sự cải tiến về hiệu quả trong cấu trúc và quá trình đào tạo.

Tất cả các mô hình—bao gồm các biến thể đã được đào tạo trước và sau—đều có thể truy cập công khai thông qua Hugging Face, ModelScope và Kaggle. Để triển khai, Alibaba khuyến nghị sử dụng SGLang và vLLM, trong khi người dùng địa phương có thể chạy Qwen3 bằng các công cụ như LMStudio, llama.cpp và KTransformers.

Qwen3 cung cấp hiệu suất có thể mở rộng và thích ứng, cho phép người dùng điều chỉnh ngân sách tính toán lý luận để cân bằng giữa độ chính xác và chi phí tài nguyên. Tính linh hoạt này nhằm đáp ứng nhu cầu ngày càng đa dạng của các nhà phát triển tích hợp AI vào quy trình làm việc cấp người tiêu dùng hoặc doanh nghiệp.

Các mô hình hỗ trợ 119 ngôn ngữ và phương ngữ, gấp ba lần phạm vi của phiên bản tiền nhiệm, Qwen2.5. Khả năng đa ngôn ngữ rộng rãi này đặt Qwen3 ở vị thế thuận lợi để được áp dụng tại các thị trường toàn cầu, bao gồm cả các khu vực mới nổi với sự đa dạng ngôn ngữ phong phú.

Các mô hình Qwen3 thể hiện những tiến bộ trong lập trình và chức năng tác nhân, được nâng cao với sự tích hợp sâu hơn cho việc nhắc nhở có điều kiện mô hình (MCP). Những cải tiến này hỗ trợ các ứng dụng phức tạp, chẳng hạn như tác nhân tự động và công cụ phát triển với độ chính xác cao hơn.

Dòng sản phẩm này được đào tạo trên 36 nghìn tỷ token, bao gồm các nguồn chất lượng cao từ STEM, lý luận, sách và bộ dữ liệu tổng hợp. Việc nâng cấp dữ liệu góp phần tạo ra những cải tiến đáng kể trong hiểu ngôn ngữ, khả năng lập trình và bộ nhớ ngữ cảnh dài.

Qwen3 sử dụng các đổi mới về kiến trúc và đào tạo như qk layernorm và cân bằng tải batch toàn cục cho các mô hình MoE. Điều này dẫn đến sự ổn định đào tạo lớn hơn và cải thiện hiệu suất nhất quán trên các quy mô mô hình.

Phương pháp đào tạo trước ba giai đoạn của nó nhắm vào hiểu ngôn ngữ, lý luận và xử lý ngữ cảnh dài một cách riêng biệt, với các chuỗi token mở rộng lên đến 32.000. Chiến lược mô-đun này nâng cao khả năng của Qwen3 trong việc xử lý các tương tác phức tạp, nhiều lượt và tài liệu lớn hơn.

Với các siêu tham số được tối ưu hóa dựa trên quy luật mở rộng cho từng loại mô hình, Qwen3 đại diện cho bản phát hành có chủ đích và toàn diện về mặt kỹ thuật nhất của Alibaba cho đến nay. Các nhà quan sát trong ngành cho rằng chiến lược trọng số mở và phạm vi đa ngôn ngữ của nó có thể biến Qwen3 thành một đối thủ đáng gờm trong cuộc đua AI toàn cầu.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.