Chỉ 3 ngày sau khi Anthropic công bố hai mô hình AI thế hệ mới là Claude Fable 5 và Claude Mythos 5 vào ngày 9/6/2026, Chính phủ Mỹ áp đặt lệnh kiểm soát xuất khẩu khẩn cấp vào ngày 12/6, buộc Anthropic phải chặn quyền truy cập toàn cầu do không thể xác minh quốc tịch thời gian thực. Sau 18 ngày đàm phán, các mô hình đã được gỡ bỏ rào cản pháp lý và quay trở lại thị trường với những thay đổi lớn về chi phí và trải nghiệm người dùng.
Nguyên nhân từ báo cáo của Amazon
Các nhà nghiên cứu bảo mật của Amazon phát hiện lỗ hổng nghiêm trọng trong bộ lọc an toàn của Fable 5, cho phép 'jailbreak' để chỉ ra hàng loạt lỗ hổng bảo mật phần mềm và viết mã nguồn hướng dẫn khai thác. Thông tin được chuyển tới giới chức Mỹ, dẫn đến lệnh cấm vận xuất khẩu có hiệu lực ngay lập tức. Quyết định này phản ánh lo ngại về việc siêu AI rơi vào tay các thế lực thù địch để tiến hành tấn công mạng quy mô lớn. Claude Mythos 5, phiên bản có màng lọc an toàn lỏng hơn dành cho phòng thủ không gian mạng, càng làm tăng tính nhạy cảm. Fable 5, phiên bản thương mại phổ thông, sở hữu khả năng viết mã độc, trở thành vũ khí công nghệ nguy hiểm nếu không kiểm soát chặt chẽ.
Trong hai tuần đàm phán, Anthropic phối hợp với Bộ Thương mại Mỹ và các đối tác công nghệ lớn để chứng minh tính an toàn. Các thử nghiệm nội bộ chỉ ra rằng việc phát hiện và khai thác lỗi bảo mật là năng lực chung của hầu hết mô hình ngôn ngữ lớn như GPT-5.5 hay Kimi K2.7, không riêng Fable 5. Dù vậy, để đổi lấy tấm vé thông hành, Anthropic buộc phải nâng cấp hệ thống phòng thủ lên tiêu chuẩn khắc nghiệt chưa từng có.
Bộ lọc an toàn mới và tác động đến trải nghiệm
Để thuyết phục Trung tâm Sáng tạo và An toàn AI thuộc Bộ Thương mại Mỹ (CAISI) gỡ bỏ lệnh cấm, Anthropic phát triển bộ phân loại an toàn mới, đóng vai trò chốt chặn tự động bảo vệ mô hình khỏi các yêu cầu nhạy cảm liên quan đến an ninh mạng. Kết quả thử nghiệm cho thấy bộ lọc mới ngăn chặn hơn 99% các kỹ thuật bẻ khóa từng được Amazon báo cáo. Tuy nhiên, do siết quá chặt, bộ lọc tạo ra tỷ lệ nhận diện nhầm cực kỳ cao. Đối với lập trình viên sử dụng Fable 5 cho viết code hoặc gỡ lỗi thông thường, hệ thống dễ nhầm lẫn các dòng lệnh này với hành vi tìm kiếm lỗ hổng bảo mật. Khi bộ lọc bị kích hoạt nhầm, hệ thống tự động chuyển hướng yêu cầu sang mô hình cũ Claude Opus 4.8 và gửi thông báo hiển thị trên màn hình. Anthropic thừa nhận đây là giải pháp tình thế và cam kết tinh chỉnh bộ lọc trong những tuần tới để giảm thiểu việc chặn nhầm.
Chi phí sử dụng tăng cao
Người dùng phổ thông và doanh nghiệp sẽ đối mặt với cú sốc chi phí đáng kể sau khi thời gian thử nghiệm kết thúc. Kể từ ngày 2/7/2026, Fable 5 được mở lại toàn cầu qua Claude.ai, Claude Code và các gói dịch vụ trả phí. Đối với tài khoản Pro, Max, Team hay Enterprise, Fable 5 chỉ được bao gồm trong gói thuê bao đến hết ngày 7/7/2026 với giới hạn tối đa 50% hạn mức sử dụng hàng tuần. Sau ngày 7/7/2026, Fable 5 bị tách khỏi các gói đăng ký định kỳ. Người dùng muốn tiếp tục sử dụng phải nạp thêm tiền qua tính năng 'usage credits' dựa trên mức tiêu thụ thực tế, với mức giá API là 10 USD cho mỗi 1 triệu token đầu vào và 50 USD cho mỗi 1 triệu token đầu ra. Đây là mức chi phí không dễ chịu đối với nhà phát triển độc lập hoặc doanh nghiệp quy mô vừa và nhỏ. Quyết định định giá cao phản ánh chi phí vận hành khổng lồ của các mô hình AI tiên tiến và cách Anthropic sàng lọc tệp khách hàng, ưu tiên đối tác sẵn sàng chi trả lớn để đổi lấy hiệu suất tối ưu.
Tác động đến toàn ngành AI
Biến cố lần này châm ngòi cho làn sóng định hình lại tiêu chuẩn an toàn của toàn bộ ngành công nghiệp AI thế giới. Việc thiếu bộ quy chuẩn chung để đánh giá mức độ nghiêm trọng của các vụ bẻ khóa khiến cả doanh nghiệp lẫn chính phủ rơi vào thế bị động. Để giải quyết khoảng trống pháp lý, Anthropic cùng Amazon, Microsoft, Google và các thành viên trong chương trình Glasswing đang xây dựng Khung đồng thuận đánh giá mức độ nghiêm trọng của việc bẻ khóa AI. Dự thảo đề xuất chấm điểm dựa trên bốn tiêu chí: biên độ tăng trưởng năng lực mà kẻ tấn công đạt được so với công cụ hiện có, số lượng tác vụ tấn công có thể thực hiện từ cùng một phương thức bẻ khóa, mức độ nỗ lực và kỹ năng cần thiết để biến lỗi hệ thống thành tấn công thực tế, và mức độ dễ dàng tiếp cận kỹ thuật bẻ khóa trên internet.
Anthropic cam kết nâng tầm hợp tác với Chính phủ Mỹ bằng cách cung cấp quyền tiếp cận sớm cho các cơ quan chức năng để kiểm định độc lập các mô hình trước khi phát hành rộng rãi. Hãng cũng thiết lập cơ chế chia sẻ thông tin tình báo đe dọa mạng theo thời gian thực và thành lập đội ngũ giám sát 24/7 để phát hiện sớm lỗ hổng. Sự can thiệp sâu của Chính phủ Mỹ vào quá trình phát hành sản phẩm AI thương mại cho thấy công nghệ AI đã trở thành vấn đề an ninh quốc gia mang tầm địa chính trị. Sự trở lại của Fable 5 mở ra chương mới đầy tính kỷ cương, nơi rào cản pháp lý và chi phí tài chính là thử thách lớn nhất cho bất kỳ ai muốn bước vào thế giới siêu trí tuệ nhân tạo.



