Công cụ AI Operator do OpenAI ra mắt, có khả năng thực hiện các tác vụ web một cách độc lập

Ngày đăng 03:28 24/01/2025
© Reuters.

Investing.com - Một công cụ trí tuệ nhân tạo (AI) mới có tên Operator đã được OpenAI tiết lộ hôm nay, được thiết kế để thực hiện các tác vụ độc lập trên web. Công cụ này sử dụng trình duyệt của riêng mình để tương tác với các trang web thông qua nhập, nhấp và cuộn. Là bản xem trước nghiên cứu, Operator có một số hạn chế nhưng sẽ phát triển dựa trên phản hồi của người dùng.

Người vận hành có thể quản lý nhiều tác vụ lặp đi lặp lại của trình duyệt, bao gồm điền vào biểu mẫu, đặt hàng tạp hóa và tạo meme. Công cụ này mở rộng chức năng của AI bằng cách sử dụng các giao diện và công cụ tương tự mà con người tương tác hàng ngày, giúp mọi người tiết kiệm thời gian cho các nhiệm vụ thường ngày và mang lại cơ hội mới cho doanh nghiệp.

Để triển khai an toàn và lặp đi lặp lại, việc ra mắt Operator ban đầu có sẵn cho người dùng Pro ở Hoa Kỳ vào operator.chatgpt.com. Bản phát hành sớm này sẽ giúp thu thập phản hồi từ người dùng và hệ sinh thái rộng lớn hơn, cho phép cải thiện theo thời gian. Kế hoạch cuối cùng là mở rộng quyền truy cập cho người dùng Plus, Team và Enterprise và tích hợp các khả năng này vào ChatGPT trong tương lai.

Operator được hỗ trợ bởi một mô hình mới có tên là Computer-Using Agent (CUA), kết hợp khả năng thị giác của GPT-4o với suy luận nâng cao thông qua học tăng cường. CUA được thiết kế để tương tác với giao diện người dùng đồ họa (GUI) như nút, menu và trường văn bản. Người vận hành có thể xem và tương tác với trình duyệt, cho phép nó thực hiện hành động trên web mà không yêu cầu tích hợp API tùy chỉnh.

Trong trường hợp gặp khó khăn hoặc sai sót, Operator có thể sử dụng khả năng suy luận của mình để tự sửa chữa. Nếu gặp phải một nhiệm vụ mà nó không thể hoàn thành, nó sẽ trao lại quyền kiểm soát cho người dùng, đảm bảo trải nghiệm hợp tác và suôn sẻ.

Mặc dù đang ở giai đoạn đầu, CUA đã đạt được kết quả điểm chuẩn mới trong WebArena và WebVoyager, hai điểm chuẩn sử dụng trình duyệt chính.

Để sử dụng Operator, người dùng chỉ cần mô tả nhiệm vụ mà họ muốn hoàn thành. Người dùng có thể tiếp quản quyền kiểm soát trình duyệt từ xa bất kỳ lúc nào và Nhà điều hành được thiết kế để yêu cầu người dùng tiếp quản các tác vụ yêu cầu đăng nhập, chi tiết thanh toán hoặc khi giải CAPTCHA.

Người dùng có thể cá nhân hóa quy trình làm việc của họ trong Operator bằng cách thêm hướng dẫn tùy chỉnh cho tất cả các trang web hoặc các trang cụ thể. Người điều hành cũng cho phép người dùng lưu lời nhắc để truy cập nhanh trên trang chủ, lý tưởng cho các tác vụ lặp đi lặp lại. Người dùng có thể yêu cầu Operator chạy nhiều tác vụ đồng thời bằng cách tạo các cuộc trò chuyện mới.

Nhà điều hành chuyển đổi AI từ một công cụ thụ động thành một người tham gia tích cực vào hệ sinh thái kỹ thuật số. Nó nhằm mục đích hợp lý hóa các nhiệm vụ cho người dùng và mang lại lợi ích cho các công ty tìm kiếm trải nghiệm khách hàng sáng tạo và tỷ lệ chuyển đổi cao hơn. Sự hợp tác với các công ty như DoorDash, Instacart (NASDAQ:CART), OpenTable, Priceline, StubHub, Thumbtack, Uber và các công ty khác đang được tiến hành để đảm bảo Operator giải quyết các nhu cầu trong thế giới thực trong khi vẫn tôn trọng các tiêu chuẩn đã được thiết lập. Các nỗ lực cũng đang được thực hiện để cải thiện khả năng tiếp cận và hiệu quả của một số quy trình làm việc nhất định, đặc biệt là trong các ứng dụng khu vực công, bằng cách làm việc với các tổ chức như Thành phố Stockton để đơn giản hóa việc đăng ký vào các dịch vụ và chương trình của thành phố.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.