Amazon (NASDAQ:AMZN) Web Services (AWS) đã công bố giới thiệu các máy chủ trung tâm dữ liệu mới được trang bị chip trí tuệ nhân tạo (AI) độc quyền của mình, đặt ra một thách thức đối với sự thống trị của Nvidia (NASDAQ:NVDA) trong lĩnh vực này. Apple Inc (NASDAQ:AAPL). đã được xác nhận là khách hàng, có kế hoạch sử dụng các chip Trainium2 mới này. Đơn vị đám mây của AWS tiết lộ rằng các máy chủ này sẽ là một phần của một siêu máy tính khổng lồ, sẽ kết hợp hàng trăm nghìn chip. Thông báo này được đưa ra vào thứ Ba.
Siêu máy tính này, được hỗ trợ bởi chip Trainium2 của AWS, sẽ được công ty khởi nghiệp AI Anthropic sử dụng với tư cách là công ty đầu tiên sử dụng công nghệ này. Anthropic được biết đến với việc tạo ra các hệ thống AI đáng tin cậy và có thể diễn giải được, đồng thời sẽ tận dụng sức mạnh tính toán để nâng cao khả năng của các mô hình Apple.
Benoit Dupin, một giám đốc điều hành tại Apple, cũng thừa nhận rằng gã khổng lồ công nghệ đang sử dụng chip Trainium2, đánh dấu sự áp dụng đáng kể dịch vụ mới của AWS.
Matt Garman, Giám đốc điều hành AWS, tiết lộ thêm rằng công ty đã làm việc trên Trainium3, sự phát triển tiếp theo của chip AI của họ, dự kiến sẽ ra mắt vào năm tới.
Các phiên bản Amazon Elastic Compute Cloud (Amazon EC2) mới, được hỗ trợ bởi AWS Trainium2, hiện đã được cung cấp rộng rãi và giới thiệu Trn2 UltraServers. Các UltraServer này được thiết kế để cung cấp hiệu suất vượt trội và hiệu quả chi phí để đào tạo và triển khai các mô hình AI hiện đại, bao gồm các mô hình ngôn ngữ lớn (LLM) và mô hình nền tảng (FM).
Các phiên bản Trn2 hứa hẹn cải thiện hiệu suất giá 30-40% so với các phiên bản EC2 dựa trên GPU hiện tại và tự hào có 16 chip Trainium2, cung cấp 20,8 petaflops điện toán cao nhất. Điều này làm cho chúng trở nên lý tưởng để xử lý khối lượng công việc AI với hàng tỷ tham số.
Đối với các tác vụ AI thậm chí còn đòi hỏi khắt khe hơn, Trn2 UltraServers cung cấp dịch vụ EC2 mới, có 64 chip Trainium2 được kết nối với nhau cho tối đa 83,2 petaflops điện toán tối đa. Thiết lập này tăng gấp bốn lần khả năng tính toán, bộ nhớ và mạng của một phiên bản duy nhất, cho phép đào tạo và triển khai các mô hình AI lớn nhất thế giới.
Dự án hợp tác giữa AWS và Anthropic, có tên là Dự án Rainier, nhằm mục đích xây dựng EC2 UltraCluster gồm Trn2 UltraServer, sẽ trở thành cụm điện toán AI lớn nhất thế giới sau khi hoàn thành.
AWS cũng nhấn mạnh chip Trainium3 sắp tới, sẽ được sản xuất bằng nút xử lý 3 nanomet, hứa hẹn sẽ tăng gấp bốn lần hiệu suất của Trn2 UltraServer hiện tại.
Bộ công cụ phát triển phần mềm (SDK) AWS Neuron tạo điều kiện tối ưu hóa các mô hình AI để chạy trên chip Trainium, hỗ trợ các khung phổ biến như JAX và PyTorch, đồng thời được tích hợp với trung tâm mô hình Hugging Face, nơi lưu trữ hơn 100.000 mô hình.
Phiên bản Trn2 hiện đã có sẵn tại Khu vực AWS Miền Đông Hoa Kỳ (Ohio), với kế hoạch sẽ sớm mở rộng tính khả dụng sang các khu vực khác. Trong khi đó, Trn2 UltraServers đang được cung cấp trong giai đoạn xem trước.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.