Góc nhìn tuần 11-15/08: VN-Index có thể lên 1,600 điểm?
Investing.com -- Alibaba đã ra mắt dòng Qwen3-Embedding và Qwen3-Reranker, thiết lập các chuẩn mực mới trong lĩnh vực nhúng văn bản đa ngôn ngữ và xếp hạng mức độ liên quan. Dòng sản phẩm này, bao gồm các mô hình được thiết kế cho các tác vụ nhúng văn bản, truy xuất và xếp hạng lại, hỗ trợ 119 ngôn ngữ và có sẵn ở các phiên bản 0,6B, 4B và 8B.
Dòng Qwen3-Embedding và Qwen3-Reranker được xây dựng trên mô hình nền tảng Qwen3, vốn có khả năng hiểu văn bản đa ngôn ngữ mạnh mẽ. Những mô hình mới này đã đạt được hiệu suất tốt nhất trên nhiều tiêu chuẩn đánh giá cho các tác vụ nhúng văn bản và xếp hạng lại. Chúng được mã nguồn mở theo giấy phép Apache 2.0 trên Hugging Face, GitHub và ModelScope, đồng thời có thể được sử dụng thông qua API trên Alibaba Cloud.
Dòng Qwen3-Embedding cung cấp nhiều kích thước khác nhau cho cả mô hình nhúng và xếp hạng lại, đáp ứng các trường hợp sử dụng khác nhau ưu tiên hiệu quả và hiệu suất. Mô hình nhúng kích thước 8B xếp hạng số 1 trong bảng xếp hạng đa ngôn ngữ MTEB tính đến ngày 5 tháng 6 năm 2025, với điểm số 70,58. Các mô hình xếp hạng lại xuất sắc trong các tình huống truy xuất văn bản, cải thiện đáng kể mức độ liên quan trong tìm kiếm.
Dòng Qwen3-Embedding hỗ trợ hơn 100 ngôn ngữ, bao gồm nhiều ngôn ngữ lập trình, và cung cấp khả năng truy xuất đa ngôn ngữ, liên ngôn ngữ và mã nguồn mạnh mẽ. Các mô hình được thiết kế sử dụng kiến trúc bộ mã hóa kép và bộ mã hóa chéo, nhằm mục đích bảo toàn đầy đủ và nâng cao khả năng hiểu văn bản của mô hình cơ sở.
Khung đào tạo cho dòng Qwen3-Embedding tuân theo mô hình đào tạo nhiều giai đoạn được thiết lập bởi dòng GTE-Qwen. Điều này bao gồm cấu trúc đào tạo ba giai đoạn cho mô hình Embedding và sử dụng trực tiếp dữ liệu được gắn nhãn chất lượng cao để đào tạo có giám sát mô hình Reranking, cải thiện hiệu quả đào tạo.
Trong kế hoạch tương lai, Alibaba dự định tối ưu hóa mô hình nền tảng Qwen lõi để nâng cao hiệu quả đào tạo của các mô hình nhúng văn bản và xếp hạng lại. Điều này sẽ cải thiện hiệu suất triển khai trong nhiều tình huống khác nhau. Ngoài ra, công ty cũng có kế hoạch mở rộng hệ thống biểu diễn đa phương thức để thiết lập khả năng hiểu ngữ nghĩa liên phương thức.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.