Bitcoin về dưới 112.000 USD trước thời điểm công bố dữ liệu kinh tế quan trọng của Mỹ
Investing.com -- Alibaba (NYSE:BABA) đã ra mắt Qwen3-LiveTranslate, một hệ thống phiên dịch đa ngôn ngữ thời gian thực kết hợp khả năng xử lý âm thanh và hình ảnh.
Theo thông báo của công ty vào hôm thứ Ba, hệ thống Qwen3-LiveTranslate-Flash mới cung cấp dịch thuật thời gian thực cho 18 ngôn ngữ với độ trễ chỉ ba giây.
Công nghệ này hỗ trợ các ngôn ngữ chính bao gồm tiếng Trung, tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Nga và tiếng Nhật, cùng với các phương ngữ Trung Quốc khác nhau như tiếng Phổ thông, tiếng Quảng Đông và phương ngữ Bắc Kinh.
Một đổi mới quan trọng trong hệ thống này là khả năng hiểu được nâng cao bằng thị giác, cho phép nó diễn giải không chỉ âm thanh mà còn cả các dấu hiệu hình ảnh như chuyển động môi, cử chỉ và văn bản trên màn hình để cải thiện độ chính xác trong môi trường ồn ào.
Công ty khẳng định mô hình của họ đạt độ chính xác cao hơn so với các mô hình quy mô lớn cạnh tranh từ Gemini-2.5-Flash, GPT-4o-Audio-Preview và Voxtral Small-24B trên các tiêu chuẩn công khai về dịch thuật giọng nói.
Công nghệ dự đoán đơn vị ngữ nghĩa của Alibaba giúp giải quyết các thách thức về sắp xếp lại cấu trúc ngôn ngữ đa ngôn ngữ trong khi vẫn duy trì độ chính xác trên 94% so với dịch thuật không thời gian thực.
Sau thông báo này, cổ phiếu của nền tảng học ngôn ngữ Duolingo (NASDAQ:DUOL) đã giảm 3,1% vào hôm thứ Ba.
Alibaba cho biết họ dự định tiếp tục cải thiện độ chính xác và độ trung thực về cảm xúc của hệ thống, đồng thời mở rộng phạm vi ngôn ngữ và nâng cao hiệu suất trong các môi trường âm thanh khó khăn.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.