Chính phủ họp với các tập đoàn bất động sản, công ty chứng khoán lớn
Investing.com — Trong cuộc đua không ngừng nhằm nâng cao khả năng trí tuệ nhân tạo tạo sinh (AI), công ty khởi nghiệp Trung Quốc DeepSeek đã âm thầm công khai mã nguồn một mô hình AI chuyên biệt mới, theo báo cáo từ South China Morning Post. Động thái này diễn ra chỉ một ngày sau khi Alibaba ra mắt thế hệ thứ ba của dòng Qwen.
Công ty khởi nghiệp có trụ sở tại Hàng Châu đã tải lên mô hình mã nguồn mở Prover-V2 mới nhất của mình lên Hugging Face, cộng đồng AI mã nguồn mở lớn nhất thế giới. Việc này được thực hiện mà không có bất kỳ thông báo nào trên các kênh truyền thông xã hội chính thức của công ty. Động thái này đã làm tăng sự mong đợi đối với mô hình lập luận R2 sắp ra mắt của DeepSeek.
Dòng Prover của DeepSeek bao gồm các mô hình chuyên biệt được thiết kế để giải quyết các vấn đề liên quan đến toán học. Công ty vẫn chưa cung cấp bất kỳ thông tin chi tiết nào về mô hình mới trên trang Hugging Face của mình. Tuy nhiên, các tệp đã tải lên cho thấy mô hình này được xây dựng dựa trên mô hình V3 của DeepSeek, với 671 tỷ tham số và áp dụng kiến trúc kết hợp chuyên gia (mixture-of-experts) để đào tạo và vận hành hiệu quả về chi phí.
Việc phát triển một mô hình tập trung vào toán học đã dẫn đến suy đoán rằng DeepSeek sẽ sớm ra mắt các mô hình bổ sung. Tuy nhiên, công ty đã không phản hồi yêu cầu bình luận về vấn đề này.
Bài viết này được tạo và dịch với sự hỗ trợ của AI và đã được biên tập viên xem xét. Để biết thêm thông tin, hãy xem Điều Kiện & Điều Khoản của chúng tôi.