Đàm phán Mỹ - Trung tăng tốc trước hạn chót “đình chiến” thương mại
Investing.com -- Google (NASDAQ:GOOGL) DeepMind vừa công bố Genie 3, một mô hình thế giới đa năng mới có khả năng tạo ra môi trường tương tác mà người dùng có thể điều hướng theo thời gian thực.
Hệ thống AI mới này có thể tạo ra thế giới ảo động dựa trên các gợi ý văn bản, duy trì tính nhất quán trong vài phút ở độ phân giải 720p và chạy ở tốc độ 24 khung hình mỗi giây.
Genie 3 đại diện cho một bước tiến đáng kể trong công nghệ mô phỏng thế giới, dựa trên nghiên cứu kéo dài một thập kỷ của Google DeepMind về môi trường mô phỏng. Trước đây, công ty đã phát triển các hệ thống AI để làm chủ các trò chơi chiến thuật thời gian thực và tạo ra môi trường cho việc học tập không giới hạn và robotics.
Theo thông báo, các mô hình thế giới cho phép hệ thống AI mô phỏng các khía cạnh của thế giới và dự đoán môi trường sẽ phát triển và phản ứng với các hành động như thế nào. Google DeepMind xem những mô hình này là những bước quan trọng hướng tới trí tuệ nhân tạo tổng quát (AGI), vì chúng cho phép các tác nhân AI đào tạo trong vô số môi trường mô phỏng.
Công ty đã giới thiệu các mô hình thế giới nền tảng đầu tiên với Genie 1 và Genie 2 vào năm ngoái. Họ cũng đã phát triển các mô hình tạo video tiên tiến có tên Veo 2 và Veo 3, thể hiện sự hiểu biết về vật lý trực quan.
Genie 3 đánh dấu mô hình thế giới đầu tiên từ Google DeepMind cho phép tương tác thời gian thực đồng thời cải thiện tính nhất quán và tính thực tế so với phiên bản tiền nhiệm.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.