Google DeepMind ra mắt Gemini Robotics, một mô hình AI mới cho robot tiên tiến

Ngày đăng 23:52 12/03/2025
© Reuters.

Investing.com - Google (NASDAQ:GOOGL) DeepMind đã công bố giới thiệu hai mô hình trí tuệ nhân tạo mới, Gemini Robotics và Gemini Robotics-ER, cả hai đều dựa trên công nghệ Gemini 2.0. Những mô hình này nhằm đặt nền móng cho thế hệ robot thực tế tiếp theo.

Gemini Robotics là một mô hình thị giác-ngôn ngữ-hành động (VLA) tiên tiến mở rộng Gemini 2.0 để bao gồm các hành động vật lý, cho phép điều khiển trực tiếp robot. Mô hình Gemini Robotics-ER nâng cao khả năng suy luận (ER) của Gemini, cung cấp sự hiểu biết không gian nâng cao cho các nhà robot chạy các chương trình của riêng họ.

Các mô hình mới được thiết kế để cho phép nhiều loại robot thực hiện nhiều nhiệm vụ trong thế giới thực hơn. Google DeepMind đang hợp tác với Apptronik để tạo ra thế hệ robot hình người tiếp theo bằng cách sử dụng Gemini 2.0. Ngoài ra, họ đang làm việc với một nhóm những người thử nghiệm đáng tin cậy để hướng dẫn sự phát triển của Gemini Robotics-ER.

Để hiệu quả và có lợi cho con người, các mô hình AI cho robot cần phải tổng quát, tương tác và khéo léo. Gemini Robotics đã đạt được những tiến bộ đáng kể trong tất cả các lĩnh vực này, đưa chúng ta đến gần hơn với robot đa năng thực sự.

Gemini Robotics sử dụng sự hiểu biết thế giới của Gemini để khái quát hóa các tình huống mới và giải quyết một loạt các nhiệm vụ. Nó cũng có kỹ năng xử lý các đối tượng mới, hướng dẫn đa dạng và môi trường mới. Mô hình này có tính tương tác do nền tảng của nó trên Gemini 2.0, cho phép nó hiểu và phản hồi các lệnh bằng ngôn ngữ đàm thoại hàng ngày. Nó cũng có thể điều chỉnh hành vi của mình dựa trên những thay đổi trong môi trường hoặc hướng dẫn của nó.

Gemini Robotics có thể thực hiện các tác vụ phức tạp, nhiều bước đòi hỏi thao tác chính xác, chẳng hạn như gấp origami hoặc đóng gói đồ ăn nhẹ vào túi Ziploc. Mô hình này đã được thiết kế để thích ứng với các loại robot khác nhau, với việc đào tạo chủ yếu dựa trên dữ liệu từ nền tảng robot hai tay, ALOHA 2.

Mô hình Gemini Robotics-ER nâng cao sự hiểu biết của Gemini về thế giới theo những cách cần thiết cho robot, đặc biệt tập trung vào lý luận không gian. Nó cải thiện các khả năng hiện có của Gemini 2.0 như trỏ và phát hiện 3D với biên độ lớn. Gemini Robotics-ER có thể thực hiện tất cả các bước cần thiết để điều khiển robot ngay lập tức, bao gồm nhận thức, ước tính trạng thái, hiểu không gian, lập kế hoạch và tạo mã.

Google DeepMind đang thực hiện một cách tiếp cận toàn diện để giải quyết vấn đề an toàn trong nghiên cứu của họ, từ điều khiển vận động cấp thấp đến hiểu ngữ nghĩa cấp cao. Họ cũng đang phát hành một bộ dữ liệu mới để đánh giá và cải thiện độ an toàn ngữ nghĩa trong AI và robot hiện thân. Họ đã phát triển một khuôn khổ để tự động tạo ra các hiến pháp dựa trên dữ liệu - các quy tắc được thể hiện trực tiếp bằng ngôn ngữ tự nhiên - để điều khiển hành vi của robot.

Google DeepMind đang hợp tác với các chuyên gia trong nhóm Đổi mới và Phát triển Có trách nhiệm cũng như Hội đồng Trách nhiệm và An toàn để đánh giá các tác động xã hội của công việc của họ. Họ cũng đang tham khảo ý kiến của các chuyên gia bên ngoài về những thách thức và cơ hội do AI thể hiện trong các ứng dụng robot.

Mô hình Gemini Robotics-ER cũng có sẵn cho những người thử nghiệm đáng tin cậy bao gồm Agile Robots, Agility Robots, Boston Dynamics và Enchanted Tools. Google DeepMind mong muốn khám phá khả năng của các mô hình này và tiếp tục phát triển AI cho thế hệ robot hữu ích hơn tiếp theo.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.