Dòng tiền chứng khoán dịch chuyển trước tác động thiên tai
Investing.com - Anthropic đã công bố Claude Opus 4.5 vào hôm thứ Hai, một bản nâng cấp lớn cho nền tảng trí tuệ nhân tạo tiên tiến của công ty, cung cấp thứ mà công ty gọi là "mô hình tốt nhất thế giới cho lập trình, tác tử và sử dụng máy tính". Sẵn sàng từ hôm nay trên các ứng dụng, API và các nền tảng đám mây lớn, mô hình này hứa hẹn nâng cao kỹ năng lập luận, hiệu suất tốt hơn trong các lĩnh vực chưa từng thấy và cải tiến đáng kể trong các tiêu chuẩn kỹ thuật phần mềm thực tế.
Với giá 5/25 đô la Mỹ cho mỗi triệu token, sản phẩm mới này nhằm mục đích làm cho các khả năng cấp độ Opus trở nên dễ tiếp cận hơn đối với cá nhân, nhóm và doanh nghiệp. Opus 4.5 dẫn đầu trong bài kiểm tra SWE-bench Verified, vượt trội hơn các mô hình tiên tiến khác trong việc giải quyết vấn đề kỹ thuật, và cung cấp các khả năng mới mà Anthropic cho biết sẽ định hình lại cách thức làm việc.
Theo kiểm nghiệm nội bộ của Anthropic, "Opus 4.5 chỉ cần ’hiểu ngay lập tức’."
Mô hình này thể hiện sự cải thiện rõ rệt trong khả năng hoạt động như một tác tử, giải quyết các nhiệm vụ phức tạp với sự sáng tạo giống con người. Mô hình này cũng đạt điểm số cao nhất từ trước đến nay, vượt qua bất kỳ ứng viên con người nào, trong bài kiểm tra kỹ thuật tại nhà của Anthropic dưới các ràng buộc về thời gian, nhấn mạnh vai trò ngày càng mở rộng của AI trong các vị trí kỹ thuật chuyên môn.
Ngoài lập trình, Claude Opus 4.5 còn thể hiện những cải tiến trong các nhiệm vụ về thị giác, toán học và nghiên cứu. Thông qua các tính năng như kiểm soát nỗ lực trên Claude API, các nhà phát triển giờ đây có thể điều chỉnh hiệu suất đầu ra dựa trên sự đánh đổi về thời gian và tài nguyên, đồng thời sử dụng ít token hơn đáng kể. Khi được đặt ở mức nỗ lực cao, mô hình này vượt qua điểm số của phiên bản tiền nhiệm bằng cách sử dụng ít hơn một nửa khối lượng dữ liệu đầu ra.
Bảo mật và an toàn cũng là trọng tâm của bản phát hành này. Opus 4.5 có khả năng kháng cự tốt hơn đối với các cuộc tấn công tiêm prompt và tỷ lệ "hành vi đáng lo ngại" thấp hơn trong các đánh giá không phù hợp, định vị nó là bản phát hành an toàn nhất của Anthropic cho đến nay. Công ty đã trích dẫn các đánh giá an toàn nâng cao và nghiên cứu liên tục theo chương trình Tác động Xã hội và Tương lai Kinh tế nhằm theo dõi những thay đổi rộng lớn hơn do AI thúc đẩy.
Tích hợp nâng cao trên các công cụ và nền tảng đi kèm với việc ra mắt mô hình, bao gồm các bản cập nhật cho Claude Code, Claude for Excel, Chrome và nền tảng nhà phát triển. Người dùng giờ đây có thể thực hiện quy trình làm việc đa tác tử trong ứng dụng máy tính để bàn hoặc điều phối các nhiệm vụ nghiên cứu mở rộng bằng cách sử dụng bộ nhớ Claude và các nhóm tác tử phụ.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.
