17 công ty báo lỗ, ngành chứng khoán lộ rõ sự phân hóa
Investing.com -- Alibaba vừa phát hành Qwen3-Coder-480B-A35B-Instruct, mô hình mã nguồn mở tác nhân thông minh tiên tiến nhất của hãng cho đến nay, với 480 tỷ tham số trong đó có 35 tỷ tham số hoạt động.
Mô hình mới này hỗ trợ độ dài ngữ cảnh 256K token và có thể mở rộng lên đến 1 triệu token bằng các phương pháp ngoại suy. Theo Alibaba, mô hình này đạt hiệu suất hàng đầu trong số các mô hình mở trên nhiều tiêu chuẩn đánh giá lập trình tác nhân, bao gồm cả SWE-bench-Verified.
Cùng với mô hình này, Alibaba cũng công bố mã nguồn mở Qwen Code, một công cụ dòng lệnh dành cho lập trình tác nhân. Công cụ này được phát triển từ Gemini Code, bao gồm các lời nhắc tùy chỉnh và giao thức gọi hàm được thiết kế để tối đa hóa khả năng của Qwen3-Coder.
Công ty đã huấn luyện mô hình trên 7,5 nghìn tỷ token với tỷ lệ mã là 70%, cho phép khả năng lập trình mạnh mẽ trong khi vẫn duy trì các khả năng tổng quát và toán học. Mô hình đã trải qua quá trình huấn luyện sau với học tăng cường trên các nhiệm vụ lập trình thực tế, giúp cải thiện đáng kể tỷ lệ thành công trong việc thực thi mã.
Các nhà phát triển có thể truy cập Qwen3-Coder thông qua nhiều giao diện, bao gồm Qwen Code, Claude Code và Cline. Mô hình này hiện có sẵn thông qua Alibaba Cloud Model Studio với quyền truy cập API.
Alibaba cho biết công ty đang phát triển thêm nhiều kích thước mô hình khác nhằm mang lại hiệu suất mạnh mẽ đồng thời giảm chi phí triển khai. Công ty cũng đang nghiên cứu liệu Tác nhân Lập trình có thể đạt được khả năng tự cải thiện hay không.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.