Meta giới thiệu các mô hình AI tiên tiến cho nhiệm vụ thị giác và ngôn ngữ

Ngày đăng 02:05 07/05/2025
© Reuters

Investing.com — Meta Platforms đã công bố một loạt mô hình trí tuệ nhân tạo mới đẩy mạnh ranh giới của nhận thức máy tính và hiểu biết ngôn ngữ, báo hiệu một bước tiến vượt bậc trong khả năng AI. Trong số các mô hình mới có Perception Encoder, Perception Language Model (PLM), Meta Locate 3D, Dynamic Byte Latent Transformer và Collaborative Reasoner, mỗi mô hình được thiết kế để giải quyết những thách thức phức tạp trong lĩnh vực tương ứng.

Perception Encoder nổi bật với khả năng diễn giải thông tin hình ảnh từ ảnh và video, vượt trội hơn các mô hình hiện có trong các nhiệm vụ phân loại và truy xuất zero-shot. Nó đã thể hiện sự thành thạo trong các nhiệm vụ khó khăn, như nhận diện động vật trong môi trường tự nhiên, và đã cho thấy những cải tiến đáng kể trong các nhiệm vụ ngôn ngữ sau khi tích hợp với mô hình ngôn ngữ lớn.

Mặt khác, PLM của Meta là một mô hình thị giác-ngôn ngữ mã nguồn mở được đào tạo trên sự kết hợp của dữ liệu được gắn nhãn bởi con người và dữ liệu tổng hợp. Nó được thiết kế để xử lý các nhiệm vụ nhận dạng hình ảnh đầy thách thức và có các biến thể với tối đa 8 tỷ tham số. PLM-VideoBench, một chuẩn đánh giá mới được phát hành cùng với PLM, tập trung vào hiểu biết hoạt động chi tiết và lập luận dựa trên không gian-thời gian.

Trong lĩnh vực robot, Meta Locate 3D đại diện cho một đổi mới trong định vị đối tượng, cho phép robot hiểu và tương tác với thế giới 3D bằng cách sử dụng lệnh ngôn ngữ tự nhiên. Mô hình này có thể định vị chính xác các đối tượng trong môi trường 3D, một bước quan trọng hướng tới các hệ thống robot tự chủ và thông minh hơn. Meta cũng đã phát hành một bộ dữ liệu để hỗ trợ phát triển công nghệ này, bao gồm 130.000 chú thích ngôn ngữ.

Dynamic Byte Latent Transformer là một mô hình đột phá khác từ Meta, được thiết kế để nâng cao hiệu quả và độ mạnh mẽ trong xử lý ngôn ngữ. Kiến trúc mô hình ngôn ngữ cấp byte này phù hợp với hiệu suất của các mô hình dựa trên tokenization truyền thống và hiện đã có sẵn cho cộng đồng sử dụng sau khi công bố nghiên cứu vào cuối năm 2024.

Cuối cùng, khung Collaborative Reasoner nhằm phát triển các tác nhân AI xã hội có khả năng hợp tác với con người hoặc các tác nhân AI khác. Nó bao gồm một loạt các nhiệm vụ định hướng mục tiêu đòi hỏi lập luận nhiều bước và hội thoại nhiều lượt. Đánh giá của Meta cho thấy các mô hình hiện tại có thể hưởng lợi từ lập luận hợp tác, và công ty đã mở nguồn quy trình tạo dữ liệu và mô hình hóa của mình để khuyến khích nghiên cứu thêm.

Khi Meta tích hợp các mô hình AI tiên tiến này vào các ứng dụng mới, tiềm năng cho các hệ thống AI có khả năng cao hơn trên nhiều lĩnh vực khác nhau sẽ mở rộng, đánh dấu tiến bộ đáng kể trong nghiên cứu và phát triển trí tuệ nhân tạo.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.