Meta Platforms đã ra mắt phiên bản mở rộng nhất của mô hình trí tuệ nhân tạo Llama 3, cho thấy những cải tiến về khả năng ngôn ngữ và giải quyết vấn đề toán học. Công ty đã công bố phát hành mô hình AI mới, có thể giao tiếp bằng tám ngôn ngữ khác nhau, tạo ra mã máy tính chất lượng cao hơn và giải quyết các vấn đề toán học phức tạp hơn so với người tiền nhiệm.
Mô hình Llama 3, với 405 tỷ thông số, thể hiện một bước tiến đáng kể so với lần lặp lại cuối cùng và là một phần trong nỗ lực của Meta chống lại các mô hình đối thủ trả phí như GPT-4 của OpenAI, tự hào có một nghìn tỷ thông số và một mô hình sắp tới từ Amazon với hai nghìn tỷ thông số.
Trong một động thái chiến lược, Meta đang cung cấp các mẫu Llama 3 phần lớn miễn phí cho các nhà phát triển, điều mà CEO Mark Zuckerberg tin rằng sẽ thúc đẩy sự đổi mới và giảm sự phụ thuộc vào các đối thủ cạnh tranh. Việc áp dụng rộng rãi chatbot AI được hỗ trợ bởi các mô hình này được dự đoán, với Zuckerberg dự đoán nó sẽ trở thành trợ lý AI phổ biến nhất vào cuối năm, đã được hàng trăm triệu người sử dụng.
Bản phát hành nhấn mạnh cuộc đua của ngành công nghiệp công nghệ để chứng minh giá trị của các mô hình ngôn ngữ lớn trong việc giải quyết các thách thức lý luận phức tạp. Nhà khoa học AI hàng đầu của Meta đã gợi ý rằng trong khi các mô hình này đang đạt đến tầm cao mới, các hệ thống AI thay thế có thể cần thiết cho những đột phá trong tương lai.
Ngoài mẫu flagship này, Meta cũng đang cập nhật các phiên bản thông số nhẹ hơn 8 tỷ và 70 tỷ. Các mô hình này hiện có "cửa sổ ngữ cảnh" mở rộng, cho phép chúng xử lý các yêu cầu của người dùng lớn hơn và ghi nhớ nhiều thông tin hơn, điều này đặc biệt có lợi cho việc tạo mã máy tính.
Ahmad Al-Dahle, người đứng đầu bộ phận AI của Meta, lưu ý tầm quan trọng của cửa sổ ngữ cảnh lớn hơn, vì đây là phản hồi chính từ cộng đồng nhà phát triển. Nhóm của ông cũng cải thiện khả năng giải quyết các vấn đề toán học của mô hình Llama 3 bằng cách sử dụng dữ liệu do AI tạo ra để đào tạo.
Bất chấp các chi phí liên quan, đã thu hút một số sự giám sát của nhà đầu tư, chiến lược của Meta có thể phá vỡ mô hình kinh doanh của các đối thủ cạnh tranh nếu các nhà phát triển thích các mô hình miễn phí của nó. Công ty đã tự hào về hiệu suất của Llama 3 trên các điểm chuẩn, với điểm số cạnh tranh hoặc vượt quá các mô hình hàng đầu như GPT-4o và Claude 3.5 Sonnet trong các bài kiểm tra toán và kiến thức.
Mô hình Llama 3 đạt 73,8 điểm trên điểm chuẩn MATH, theo sát 76,6 của GPT-4o và trước 71,1 của Claude 3,5 Sonnet. Nó cũng đạt được 88,6 điểm chuẩn MMLU, trải dài trên nhiều môn học khác nhau, gần bằng với 88,7 của GPT-4o và vượt qua 88,3 của Claude 3,5 Sonnet.
Trong tương lai, các nhà nghiên cứu của Meta đang hé lộ sự phát triển của các phiên bản "đa phương thức" của các mô hình, sẽ tích hợp khả năng hình ảnh, video và giọng nói cùng với các chức năng văn bản cốt lõi. Chúng dự kiến sẽ cạnh tranh với các mô hình đa phương thức khác như Gemini 1.5 của Google và Claude 3.5 Sonnet của Anthropic, và dự kiến sẽ phát hành vào cuối năm nay.
Reuters đã đóng góp cho bài viết này.Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.