💎 Khám Phá Những Cổ Phiếu Bị Định Giá Thấp Tại Mọi Thị TrườngBắt đầu

Reddit thắt chặt quyền truy cập vào các trình thu thập dữ liệu bị cản trở

Ngày đăng 03:58 26/06/2024
© Reuters.

Reddit đã thông báo vào thứ ba rằng họ sẽ sửa đổi một tiêu chuẩn web để ngăn chặn việc thu thập dữ liệu tự động trên nền tảng của mình. Động thái này là một phản ứng với các báo cáo rằng các công ty khởi nghiệp AI đã lách các quy tắc hiện có để thu thập nội dung cho hệ thống của họ. Công ty truyền thông xã hội được thiết lập để cập nhật Giao thức loại trừ robot, thường được gọi là "robots.txt", quy định các phần của trang web có thể được truy cập bởi trình thu thập thông tin tự động.

Quyết định này được đưa ra trong bối cảnh lo ngại về việc các công ty trí tuệ nhân tạo bị cáo buộc đạo văn nội dung từ các nhà xuất bản để tạo ra các bản tóm tắt do AI tạo ra mà không có sự ghi công hoặc cho phép thích hợp. Các biện pháp cập nhật của Reddit sẽ bao gồm việc duy trì giới hạn tốc độ để kiểm soát khối lượng yêu cầu mà một người dùng có thể thực hiện, cũng như chặn các bot và trình thu thập thông tin không xác định thu thập dữ liệu từ trang web.

Việc sử dụng "robots.txt" đã trở nên nổi bật khi các nhà xuất bản tìm cách bảo vệ nội dung của họ khỏi bị các công ty công nghệ sử dụng để đào tạo các thuật toán AI và tạo tóm tắt cho các truy vấn tìm kiếm nhất định mà không phải bồi thường. Tuần trước, TollBit, một công ty khởi nghiệp cấp phép nội dung, đã gửi thư cho các nhà xuất bản tiết lộ rằng nhiều công ty AI đã bỏ qua tiêu chuẩn web để thu thập nội dung từ các trang web của nhà xuất bản.

Một cuộc điều tra của Wired hồi đầu tháng 6 cho thấy công ty tìm kiếm AI Perplexity có thể đã phá vỡ các biện pháp chặn trình thu thập dữ liệu web của mình thông qua "robots.txt". Trong một sự cố liên quan, Forbes đã cáo buộc Perplexity vào đầu tháng 6 đã đạo văn các câu chuyện điều tra của mình để sử dụng trong các hệ thống AI tạo ra mà không có tín dụng.

Mặc dù thắt chặt quyền truy cập, Reddit đã xác nhận rằng các nhà nghiên cứu và các tổ chức như Internet Archive vẫn có thể truy cập nội dung của nó, miễn là việc sử dụng chúng là phi thương mại. Điều này đảm bảo rằng trong khi công ty thực hiện các bước để bảo vệ nội dung của mình khỏi bị cạo trái phép, nó vẫn tiếp tục hỗ trợ các hoạt động nghiên cứu và lưu trữ hợp pháp.

Reuters đã đóng góp cho bài viết này.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2024 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.