Anthropic vừa gửi thư lên Thượng viện Mỹ tố cáo Alibaba và lab AI Qwen của tập đoàn này đã thực hiện chiến dịch lớn nhất từ trước đến nay nhằm sao chép các năng lực của Claude. Điều đặc biệt là trong suốt quá trình, Alibaba vẫn trả tiền API cho Anthropic như một khách hàng bình thường, tạo ra nghịch lý: Anthropic vừa là nạn nhân vừa là bên thu lợi trực tiếp.
Chi tiết cuộc tấn công chưng cất lớn nhất lịch sử
Theo thư tố cáo, Alibaba đã sử dụng 25.000 tài khoản giả mạo để thực hiện 28,8 triệu cuộc hội thoại với Claude thông qua API công khai. Chiến dịch kéo dài hơn 6 tuần, từ ngày 22/04 đến ngày 05/06/2026. Mục tiêu không phải là toàn bộ mô hình, mà tập trung vào hai năng lực thương mại giá trị nhất của Claude: khả năng lập trình phần mềm và khả năng lý luận agentic – tức khả năng tự lập kế hoạch và thực thi chuỗi tác vụ phức tạp mà không cần can thiệp từng bước.
Điểm khác biệt so với các cuộc tấn công mạng thông thường: Alibaba không hack hay đột nhập hệ thống Anthropic. Các tài khoản liên kết với Alibaba truy cập Claude qua API công khai, cùng cơ chế mà hàng chục nghìn người dùng khác sử dụng hàng ngày. Vấn đề nằm ở mục đích và quy mô: hành vi này vi phạm điều khoản sử dụng của Anthropic, vốn cấm dùng dữ liệu đầu ra của Claude để huấn luyện mô hình cạnh tranh, còn gọi là distillation hay “chưng cất”.
Kỹ thuật chưng cất tri thức và chi phí khổng lồ
Về bản chất, đây là kỹ thuật “chưng cất tri thức” (knowledge distillation): một mô hình lớn (Claude) được hỏi hàng loạt câu hỏi được thiết kế sẵn, toàn bộ câu trả lời được thu thập để huấn luyện mô hình nhỏ hơn (Qwen) nhằm đạt năng lực tương đương với chi phí thấp hơn nhiều so với tự nghiên cứu từ đầu.
Giá API của Claude dao động tùy model: Claude Opus 4.8 có giá 5 USD/triệu token đầu vào và 25 USD/triệu token đầu ra; Claude Sonnet 4.6 rẻ hơn ở mức 3 USD và 15 USD tương ứng. Dựa trên số cuộc hội thoại (28,8 triệu) và độ dài trung bình mỗi phiên (vài nghìn đến hơn chục nghìn token), ước tính Alibaba đã chi từ vài trăm nghìn đến vài triệu USD trong hơn 6 tuần – toàn bộ nộp thẳng vào doanh thu của Anthropic.
Giới hạn của chưng cất và tác động thực tế
Dù quy mô lớn, “chưng cất” không phải ma thuật. Quy trình này chỉ giúp mô hình nhỏ bắt chước cách mô hình lớn phản hồi, không tiếp thu được kiến trúc bên trong hay quá trình training gốc. Nếu kiến trúc nền của Qwen khác Claude, dữ liệu chưng cất chỉ cải thiện bề mặt câu trả lời, không đảm bảo cải thiện thực chất trên mọi tác vụ.
Hơn nữa, chiến dịch kết thúc ngày 05/06, trong khi các phiên bản Qwen gần nhất đã ra mắt trước khi chiến dịch bắt đầu (22/04). Dữ liệu thu thập được sẽ phục vụ cho thế hệ model tiếp theo, nếu có, với khoảng cách thời gian đáng kể để xử lý và training.
Bối cảnh rộng hơn: Làn sóng chưng cất từ Trung Quốc
Vụ Alibaba không phải đơn lẻ. Tháng 2/2026, Anthropic công bố phát hiện ba chiến dịch tương tự từ các công ty AI Trung Quốc khác: DeepSeek với hơn 150.000 cuộc hội thoại, Moonshot AI với hơn 3,4 triệu và MiniMax với hơn 13 triệu. Tổng số cuộc hội thoại thu hoạch Claude vượt 45 triệu trong vòng chưa đầy một năm.
Anthropic cho biết đã hợp tác cùng OpenAI và Google để chia sẻ thông tin về các chiến dịch vi phạm. Lá thư gửi ngày 10/06 cho Thượng nghị sĩ Tim Scott và Elizabeth Warren kêu gọi Chính phủ Mỹ làm rõ hướng dẫn chống độc quyền, cho phép các hãng AI Mỹ chia sẻ thêm thông tin, đồng thời tiếp tục ủng hộ kiểm soát xuất khẩu chip AI tiên tiến.
Alibaba chưa đưa ra bình luận về cáo buộc. Cổ phiếu ADR của tập đoàn giảm hơn 3% ngay sau khi thông tin xuất hiện trên Bloomberg chiều 24/06. Theo Đời sống Pháp luật.



