Việt Nam lên kế hoạch giao dịch xuyên trưa, cho phép bán chứng khoán chờ về?
Investing.com - Alibaba đã tung ra một mô hình trí tuệ nhân tạo mới, Qwen2.5-VL-32B-Instruct, một phiên bản tối ưu hóa của dòng Qwen2.5-VL được tung ra vào cuối tháng 1 năm nay. Mô hình mới, được phát hành theo giấy phép Apache 2.0, đã được thiết kế để cung cấp các câu trả lời chi tiết hơn, có cấu trúc tốt phù hợp hơn với sở thích của con người.
Mô hình Qwen2.5-VL-32B-Instruct tự hào có những cải tiến đáng kể về độ chính xác của lý luận toán học. Nó cũng thể hiện khả năng nâng cao trong việc hiểu và suy luận hình ảnh chi tiết, bao gồm các tác vụ như phân tích cú pháp hình ảnh, nhận dạng nội dung và suy luận logic trực quan.
Mô hình mới đã chứng minh hiệu suất vượt trội so với các mô hình hiện đại tương đương, bao gồm Mistral-Small-3.1-24B và Gemma-3-27B-IT. Nó cũng vượt trội hơn mô hình Qwen2-VL-72B-Instruct lớn hơn, đặc biệt là trong các tác vụ đa phương thức như MMMU, MMMU-Pro và MathVista, đòi hỏi lý luận phức tạp, nhiều bước. Trên MM-MT-Bench, một điểm chuẩn đánh giá trải nghiệm người dùng, Qwen2.5-VL-32B-Instruct vượt trội hơn đáng kể so với người tiền nhiệm của nó.
Ngoài khả năng trực quan, Qwen2.5-VL-32B-Instruct đã đạt được hiệu suất hàng đầu về khả năng văn bản thuần túy ở cùng quy mô.
Hướng nghiên cứu trong tương lai của Alibaba sẽ tập trung vào việc cải thiện các quy trình suy luận lâu dài và hiệu quả. Động thái chiến lược này nhằm mục đích nâng cao hiệu suất của các mô hình trực quan trong việc xử lý các nhiệm vụ lý luận trực quan phức tạp, nhiều bước.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.