Amazon Bedrock Intelligent Prompt Routing hiện đã được phát hành rộng rãi

Ngày đăng 02:22 23/04/2025
© Reuters.

Investing.com — Amazon (NASDAQ:AMZN) đã thông báo về việc phát hành rộng rãi công cụ Bedrock Intelligent Prompt Routing. Công cụ này, được giới thiệu từ tháng 12, cung cấp một điểm cuối serverless duy nhất để định hướng hiệu quả các yêu cầu giữa các mô hình nền tảng khác nhau trong cùng một họ mô hình. Nó thực hiện điều này bằng cách dự đoán động chất lượng phản hồi của từng mô hình cho một yêu cầu và sau đó chuyển yêu cầu đến mô hình phù hợp nhất dựa trên chi phí và chất lượng phản hồi.

Trong vài tháng qua, Amazon đã triển khai nhiều cải tiến trong hệ thống định tuyến thông minh. Những cải tiến này được thúc đẩy bởi phản hồi của khách hàng và quá trình kiểm tra nội bộ rộng rãi. Mục tiêu là tạo điều kiện cho việc định tuyến tự động, tối ưu giữa các mô hình ngôn ngữ lớn (LLMs) thông qua Amazon Bedrock Intelligent Prompt Routing. Công cụ này có hiểu biết sâu sắc về hành vi mô hình trong mỗi họ mô hình, bao gồm các phương pháp tiên tiến để đào tạo bộ định tuyến cho các bộ mô hình, tác vụ và lệnh nhắc khác nhau.

Người dùng hiện có thể sử dụng Amazon Bedrock Intelligent Prompt Routing với các bộ định tuyến lệnh mặc định do Amazon Bedrock cung cấp hoặc cấu hình bộ định tuyến lệnh riêng của họ. Điều này cho phép điều chỉnh hiệu suất một cách tuyến tính giữa hiệu suất của hai LLM ứng viên. Các bộ định tuyến lệnh mặc định được Amazon Bedrock cung cấp cho mỗi họ mô hình. Những bộ định tuyến này đi kèm với các cài đặt được xác định trước và được thiết kế để hoạt động ngay với các mô hình nền tảng cụ thể. Chúng cung cấp một giải pháp đơn giản, sẵn sàng sử dụng mà không cần phải cấu hình bất kỳ cài đặt định tuyến nào.

Amazon Bedrock Intelligent Prompt Routing hiện hỗ trợ nhiều mô hình hơn từ các họ Amazon Nova, Anthropic và Meta. Điều này bao gồm họ Claude của Anthropic, họ Llama và họ Nova. Người dùng cũng có thể định nghĩa cấu hình định tuyến riêng của họ được điều chỉnh theo nhu cầu và sở thích cụ thể.

Amazon đã giảm chi phí phụ trội của các thành phần bổ sung hơn 20% xuống còn khoảng 85 ms. Khi bộ định tuyến ưu tiên gọi mô hình ít tốn kém hơn trong khi vẫn duy trì cùng độ chính xác cơ bản trong tác vụ, người dùng có thể mong đợi lợi ích tổng thể về độ trễ và chi phí so với việc luôn sử dụng mô hình lớn hơn và đắt hơn, bất chấp chi phí phụ trội bổ sung.

Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.

Bình luận mới nhất

Cài Đặt Ứng Dụng của Chúng Tôi
Công Bố Rủi Ro: Giao dịch các công cụ tài chính và/hoặc tiền điện tử tiềm ẩn mức độ rủi ro cao, bao gồm rủi ro mất một phần hoặc toàn bộ vốn đầu tư, và có thể không phù hợp với mọi nhà đầu tư. Giá cả tiền điện tử có độ biến động mạnh và có thể chịu tác động từ các yếu tố bên ngoài như các sự kiện tài chính, pháp lý hoặc chính trị. Việc giao dịch theo mức ký quỹ gia tăng rủi ro tài chính.
Trước khi quyết định giao dịch công cụ tài chính hoặc tiền điện tử, bạn cần nắm toàn bộ thông tin về rủi ro và chi phí đi kèm với việc giao dịch trên các thị trường tài chính, thận trọng cân nhắc đối tượng đầu tư, mức độ kinh nghiệm, khẩu vị rủi ro và xin tư vấn chuyên môn nếu cần.
Fusion Media xin nhắc bạn rằng dữ liệu có trên trang web này không nhất thiết là theo thời gian thực hay chính xác. Dữ liệu và giá cả trên trang web không nhất thiết là thông tin do bất kỳ thị trường hay sở giao dịch nào cung cấp, nhưng có thể được cung cấp bởi các nhà tạo lập thị trường, vì vậy, giá cả có thể không chính xác và có khả năng khác với mức giá thực tế tại bất kỳ thị trường nào, điều này có nghĩa các mức giá chỉ là minh họa và không phù hợp cho mục đích giao dịch. Fusion Media và bất kỳ nhà cung cấp dữ liệu nào có trên trang web này đều không chấp nhận bất cứ nghĩa vụ nào trước bất kỳ tổn thất hay thiệt hại nào xảy ra từ kết quả giao dịch của bạn, hoặc trước việc bạn dựa vào thông tin có trong trang web này.
Bạn không được phép sử dụng, lưu trữ, sao chép, hiển thị, sửa đổi, truyền hay phân phối dữ liệu có trên trang web này và chưa nhận được sự cho phép rõ ràng bằng văn bản của Fusion Media và/hoặc nhà cung cấp. Tất cả các quyền sở hữu trí tuệ đều được bảo hộ bởi các nhà cung cấp và/hoặc sở giao dịch cung cấp dữ liệu có trên trang web này.
Fusion Media có thể nhận thù lao từ các đơn vị quảng cáo xuất hiện trên trang web, dựa trên tương tác của bạn với các quảng cáo hoặc đơn vị quảng cáo đó.
Phiên bản tiếng Anh của thỏa thuận này là phiên bản chính, sẽ luôn được ưu tiên để đối chiếu khi có sự khác biệt giữa phiên bản tiếng Anh và phiên bản tiếng Việt.
© 2007-2025 - Công ty TNHH Fusion Media. Mọi quyền được bảo hộ.