OpenAI ra mắt trung tâm đánh giá an toàn để theo dõi hiệu suất mô hình AI

Ngày đăng 23:36 14/05/2025

Investing.com — OpenAI đã ra mắt một trung tâm mới dành cho việc đánh giá an toàn của các mô hình trí tuệ nhân tạo (AI). Trung tâm này được thiết kế để đo lường mức độ an toàn và hiệu suất của từng mô hình, đồng thời sẽ công khai chia sẻ những kết quả này.

Các đánh giá an toàn bao gồm nhiều khía cạnh như nội dung có hại, jailbreak (phá vỡ hạn chế), ảo giác (hallucinations), và thứ bậc chỉ dẫn. Đánh giá nội dung có hại đảm bảo rằng mô hình không đáp ứng các yêu cầu về nội dung vi phạm chính sách của OpenAI, bao gồm nội dung thù địch hoặc lời khuyên bất hợp pháp.

Đánh giá jailbreak bao gồm các lệnh đối kháng được thiết kế để vượt qua đào tạo an toàn của mô hình và khiến mô hình tạo ra nội dung có hại. Đánh giá ảo giác đo lường khi nào mô hình mắc lỗi về sự kiện. Đánh giá thứ bậc chỉ dẫn đo lường việc tuân thủ khuôn khổ mà mô hình sử dụng để ưu tiên chỉ dẫn giữa ba phân loại thông điệp được gửi đến mô hình.

Trung tâm này cung cấp quyền truy cập vào kết quả đánh giá an toàn cho các mô hình của OpenAI, được bao gồm trong thẻ hệ thống của họ. OpenAI sử dụng những đánh giá này nội bộ như một phần trong quá trình ra quyết định về an toàn và triển khai mô hình.

Trung tâm cho phép OpenAI chia sẻ các chỉ số an toàn một cách liên tục, với các bản cập nhật trùng với các bản cập nhật mô hình chính. Đây là một phần trong nỗ lực rộng lớn hơn của OpenAI nhằm truyền đạt chủ động hơn về an toàn.

Khi khoa học đánh giá AI phát triển, OpenAI hướng đến việc chia sẻ tiến trình của mình trong việc phát triển các cách đo lường khả năng và an toàn của mô hình một cách hiệu quả hơn. Khi các mô hình trở nên có khả năng và thích ứng hơn, các phương pháp cũ trở nên lỗi thời hoặc không hiệu quả trong việc thể hiện sự khác biệt có ý nghĩa, dẫn đến việc cập nhật thường xuyên các phương pháp đánh giá để tính đến các phương thức mới và rủi ro mới nổi.

Kết quả đánh giá an toàn được chia sẻ trên trung tâm nhằm giúp dễ dàng hiểu hơn về hiệu suất an toàn của các hệ thống OpenAI theo thời gian và hỗ trợ nỗ lực của cộng đồng để tăng tính minh bạch trong toàn bộ lĩnh vực. Những kết quả này không phản ánh toàn bộ nỗ lực và chỉ số an toàn được sử dụng tại OpenAI, nhưng cung cấp một bức tranh tổng quan về an toàn và hiệu suất của một mô hình.

Trung tâm mô tả một tập hợp con của các đánh giá an toàn và hiển thị kết quả trên những đánh giá đó. Người dùng có thể chọn đánh giá nào họ muốn tìm hiểu thêm và so sánh kết quả trên các mô hình OpenAI khác nhau. Trang hiện tại mô tả hiệu suất an toàn dựa trên văn bản trên bốn loại đánh giá: nội dung có hại, jailbreak, ảo giác, và thứ bậc chỉ dẫn.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Xem tất cả bình luận (0)0

Bình luận mới nhất

VN30

1,859.51

-0.29

-0.02%

VN100

1,803.15

-7.54

-0.42%

HNX30

487.90

+5.16

+1.07%

US 500

6,732.90

+17.5

+0.26%

Dow Jones

46,519.72

+78.62

+0.17%

Hang Seng

27,140.92

-146.20

-0.54%

FTSE 100

9,493.65

+65.92

+0.70%

Bài Viết Phổ Biến Nhất

Tin tức

Phân tích

Dư nợ tín dụng vượt 17,7 triệu tỉ đồng, dự báo tăng trưởng cả năm cao nhất 15 năm

Theo Investing.co...

03 thg 10, 2025

Bitcoin vượt 120.000 USD nhờ tâm lý thị trường tích cực, sắp khép lại tuần tăng ấn tượng

Theo Investing.co...

03 thg 10, 2025

Việt Nam trở thành nước nhập khẩu gạo lớn thứ 2 thế giới

Theo Investing.co...

02 thg 10, 2025

Ông Trump tạm hoãn áp thuế dược phẩm để đổi lấy thỏa thuận giảm giá thuốc

Theo Investing.co...

02 thg 10, 2025

Ông Bessent: Đóng cửa chính phủ có thể giáng đòn vào tăng trưởng Mỹ

Theo Investing.co...

02 thg 10, 2025

Thêm Tin Tức

Chuyển động Thị trường

Tên	Mới nhất	% T.đổi	KL
NHTM Cổ phần Sài Gòn - Hà Nội	16,700.0	-1.76%	64.64M
Hoà Phát	27,650.0	-1.60%	58.12M
VPBank	29,500.0	-2.16%	30.21M
Chứng khoán SSI	37,650.0	-0.53%	25.06M
Chứng khoán VIX	35,500.0	-1.93%	22.11M
Thế giới Di động	77,000	-0.13%	9.67M
Vingroup	176,500	+3.22%	4.89M

Tên	Mới nhất	% T.đổi	KL
382 Đông Anh	6,300	+40.00%	900.00
CADOVIMEX	600	+20.00%	1.50K
Lilama 45.1	1,800	+20.00%	2.00K
Công nghệ Tin học HPT	27,600	+16.95%	1.00K
Tập đoàn MPT	700.00	+16.67%	546.60K
TCT Công trình đường sắt	25,500	+16.44%	100.00
Xây dựng điện Mê Ca Vneco	8,000	+15.94%	11.90K

Tên	Mới nhất	% T.đổi	KL
EMESCO	9,200	-39.87%	100.00
ORD	4,000.00	-36.51%	33.10K
CMISTONE Việt Nam	500	-28.57%	6.80K
CTCP NTACO	500	-16.67%	6.80K
Khoáng sản Á Cường	500.00	-16.67%	183.80K
In sách giáo khoa Hòa Phát	2,100.0	-16.00%	685.60K
Nam Dược	127,000	-15.28%	100.00

Cổ Phiếu Theo Xu Hướng

Tên	Mới nhất	% T.đổi	KL
FPT	93,400.0	+1,41%	7.68M
Vingroup	176,500	+3,22%	4.89M
Hoà Phát	27,650.0	-1,60%	58.12M
MBBank	26,550.0	-0,93%	14.51M
Chứng khoán SSI	37,650.0	-0,53%	25.06M

Hiển thị thêm

Cài Đặt Ứng Dụng của Chúng TôiQuét mã QR để cài đặt ứng dụng

Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.

Tìm Kiếm Phổ Biến

Hãy thử tìm kiếm với từ khóa khác

OpenAI ra mắt trung tâm đánh giá an toàn để theo dõi hiệu suất mô hình AI

Bình luận mới nhất

Cổ Phiếu Theo Xu Hướng