Thuế Mỹ đối với Việt Nam: Cảnh báo, cơ hội hay phép thử?
Investing.com -- Alibaba vừa phát hành Qwen-Image, một mô hình nền tảng hình ảnh MMDiT 20B mang đến những tiến bộ đáng kể trong việc xử lý văn bản phức tạp và khả năng chỉnh sửa hình ảnh chính xác.
Mô hình mới này, mà người dùng có thể truy cập thông qua Qwen Chat bằng cách chọn "Image Generation", có khả năng xử lý văn bản vượt trội, hỗ trợ bố cục nhiều dòng, ngữ nghĩa cấp đoạn văn và các chi tiết tinh tế. Mô hình hỗ trợ cả ngôn ngữ chữ cái như tiếng Anh và ngôn ngữ tượng hình như tiếng Trung với độ chính xác cao.
Qwen-Image cũng cung cấp khả năng chỉnh sửa hình ảnh nhất quán thông qua mô hình đào tạo đa nhiệm vụ nâng cao, đạt hiệu suất xuất sắc trong việc bảo toàn cả ý nghĩa ngữ nghĩa và tính chân thực trực quan trong các thao tác chỉnh sửa.
Theo Alibaba, mô hình này vượt trội hơn các giải pháp hiện có trên nhiều tiêu chuẩn đánh giá công khai cho cả tác vụ tạo và chỉnh sửa, bao gồm GenEval, DPG, OneIG-Bench, GEdit, ImgEdit và GSO. Đặc biệt, mô hình này xuất sắc trong các tiêu chuẩn xử lý văn bản như LongText-Bench, ChineseWord và TextCraft, nơi nó vượt trội đáng kể so với các mô hình tiên tiến hiện tại.
Công ty đã minh họa khả năng của Qwen-Image thông qua nhiều ví dụ, thể hiện khả năng xử lý văn bản phức tạp trong các tình huống khác nhau. Những ví dụ này bao gồm việc tạo chính xác các ký tự tiếng Trung trên biển hiệu cửa hàng với độ sâu trường ảnh phù hợp, tạo văn bản tiếng Anh chi tiết trên bìa sách và các slide thông tin, đồng thời xử lý nội dung song ngữ một cách dễ dàng.
Ngoài việc xử lý văn bản, Qwen-Image hỗ trợ nhiều phong cách nghệ thuật đa dạng từ cảnh chân thực đến tranh ấn tượng, và cung cấp nhiều thao tác chỉnh sửa khác nhau bao gồm chuyển đổi phong cách, thêm, xóa, nâng cao chi tiết, chỉnh sửa văn bản và điều chỉnh tư thế nhân vật.
Alibaba cho biết Qwen-Image nhằm mục đích thúc đẩy sự phát triển của việc tạo hình ảnh, giảm rào cản kỹ thuật trong việc tạo nội dung trực quan và truyền cảm hứng cho các ứng dụng đổi mới. Công ty đang mời cộng đồng tham gia và đóng góp ý kiến để xây dựng "một hệ sinh thái AI tạo sinh mở, minh bạch và bền vững".
Mô hình này dự kiến sẽ ra mắt vào tháng 8 năm 2025.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.