Anthropic vô tình tiết lộ mã nguồn Claude Code, lập trình viên viết lại bằng Python
Rò rỉ mã nguồn Claude Code, coder viết lại bằng Python

Anthropic vô tình tiết lộ toàn bộ mã nguồn Claude Code trong sự cố bảo mật nghiêm trọng

Anthropic, công ty tự định vị là "phòng thí nghiệm AI ưu tiên an toàn", vừa trải qua sự cố bảo mật nghiêm trọng khi vô tình để lộ toàn bộ mã nguồn của Claude Code - công cụ lập trình AI phổ biến nhất của hãng. Đây là lần rò rỉ thứ hai trong vòng chưa đầy một năm, làm dấy lên nghi vấn về an ninh vận hành tại công ty công nghệ hàng đầu này.

Sự cố xảy ra do lỗi đóng gói bản phát hành

Sự việc diễn ra vào lúc 4 giờ sáng khi Anthropic đẩy một bản cập nhật thường lệ cho Claude Code. Một file debugging vô tình được đóng gói bên trong và tải lên registry công khai - nơi các lập trình viên tải xuống và cập nhật gói phần mềm. File này nhanh chóng được phát hiện bởi Chaofan Shou, trỏ đến kho lưu trữ nén trên cloud storage của chính Anthropic chứa toàn bộ mã nguồn với gần 2.000 file và 512.000 dòng code.

Phát ngôn viên Anthropic cho biết: "Sáng nay, một bản phát hành Claude Code đã bao gồm một số mã nguồn nội bộ. Không có dữ liệu khách hàng nhạy cảm hoặc thông tin đăng nhập nào liên quan hoặc bị lộ. Đây là vấn đề đóng gói bản phát hành do lỗi con người, không phải là vi phạm bảo mật. Chúng tôi đang triển khai các biện pháp để ngăn chặn điều này xảy ra nữa."

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Lập trình viên Hàn Quốc viết lại toàn bộ mã nguồn bằng Python

Phần kịch tính nhất của câu chuyện nằm ở phản ứng của cộng đồng lập trình. Một lập trình viên Hàn Quốc tên Sigrid Jin - người dùng Claude Code tích cực nhất thế giới với 25 tỷ token được sử dụng năm ngoái theo Wall Street Journal - đã thức dậy lúc 4 giờ sáng khi điện thoại reo liên tục thông báo về sự cố.

Lo ngại về vấn đề pháp lý, Jin đã làm điều mà bất kỳ kỹ sư nào cũng sẽ làm: viết lại toàn bộ mã nguồn bằng Python từ đầu trước khi mặt trời mọc. Anh đặt tên cho dự án là claw-code và đẩy lên GitHub. Một bản viết lại bằng Python được coi là tác phẩm sáng tạo mới, không vi phạm DMCA.

Kho lưu trữ này nhanh chóng đạt 30.000 star, phá vỡ kỷ lục về tốc độ tích lũy star trong lịch sử GitHub. Không dừng lại ở đó, Jin tiếp tục viết lại mã nguồn một lần nữa bằng Rust. Hiện tại, dự án đã có khoảng 52.000 star và 56.000 fork, với một số người dùng sao chép bản gốc lên nền tảng phi tập trung với thông điệp: "sẽ không bao giờ bị gỡ xuống."

Những thông tin nhạy cảm bị lộ

Mã code bị rò rỉ chứa nhiều thông tin quan trọng:

  • Hàng chục feature flags cho các tính năng đã hoàn thiện nhưng chưa phát hành
  • Khả năng để Claude xem lại phiên làm việc gần nhất để nghiên cứu cải tiến
  • "Persistent assistant" chạy ở chế độ nền cho phép Claude Code tiếp tục làm việc khi người dùng nhàn rỗi
  • Khả năng điều khiển từ xa cho phép người dùng điều khiển Claude từ điện thoại hoặc trình duyệt khác

Code bị rò rỉ cũng tiết lộ thông tin về mô hình mới với tên nội bộ Capybara mà Anthropic đang tích cực chuẩn bị ra mắt. Theo Roy Paz, nhà nghiên cứu bảo mật AI cấp cao tại LayerX Security, có khả năng công ty sẽ phát hành phiên bản "nhanh" và "chậm" của mô hình mới này.

Hệ quả và bài học an ninh

Sự rò rỉ tiềm ẩn nhiều rủi ro cho Anthropic:

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình
  1. Cho phép đối thủ cạnh tranh đảo ngược kỹ thuật cách hoạt động của agentic harness
  2. Cung cấp kiến thức để cải thiện sản phẩm của đối thủ
  3. Tạo điều kiện cho nhà phát triển tạo phiên bản mã nguồn mở của agentic harness

Điều trớ trêu là Anthropic mới xây dựng hệ thống Undercover Mode đặc biệt để ngăn Claude rò rỉ bí mật nội bộ, nhưng chính con người lại trở thành nhân tố mắc sai lầm nghiêm trọng nhất. Sự việc xảy ra chỉ vài ngày sau khi Fortune báo cáo rằng công ty đã vô tình công khai gần 3.000 file, bao gồm bài blog nháp về mô hình mạnh mẽ sắp tới.

Sự rò rỉ này không chỉ là sai lầm bảo mật lớn thứ hai của Anthropic trong vòng một tuần, mà còn trao cho mọi đối thủ cạnh tranh một khóa học kỹ thuật miễn phí về cách xây dựng AI coding agent cấp độ sản xuất. Công ty tự định vị mình là phòng thí nghiệm AI ưu tiên an toàn đã tự tay gửi mã nguồn của mình ra công chúng, tạo nên một bài học đắt giá về quản lý bảo mật trong kỷ nguyên AI.