Claude Mythos: Mô Hình AI Phát Hiện Lỗ Hổng Gây Chấn Động Và Nguy Cơ An Ninh Mạng Toàn Cầu

Anthropic, công ty công nghệ hàng đầu, vừa gây chấn động với việc công bố mô hình AI mới mang tên Claude Mythos Preview. Tuy nhiên, thay vì phát hành rộng rãi, công ty quyết định hạn chế quyền truy cập chỉ cho hơn 40 đối tác công nghệ lớn như Apple, Amazon, Microsoft và Google. Động thái này xuất phát từ lo ngại sâu sắc rằng mô hình có thể bị lạm dụng để tấn công cơ sở hạ tầng quan trọng trên toàn cầu.

Dự Án Glasswing: Liên Minh Bảo Mật Đặc Biệt

Liên minh này, được đặt tên là Dự án Glasswing, không chỉ bao gồm các gã khổng lồ công nghệ mà còn có sự tham gia của các nhà cung cấp phần cứng như Cisco và Broadcom, cùng với Linux Foundation – tổ chức duy trì nhiều phần mềm mã nguồn mở thiết yếu. Anthropic cam kết đóng góp lên đến 100 triệu USD dưới dạng tín dụng sử dụng Claude cho nỗ lực chung nhằm tìm kiếm và vá lỗ hổng bảo mật phần mềm. Mục tiêu tối thượng là tăng cường an ninh mạng trong bối cảnh các mối đe dọa ngày càng tinh vi.

Khả Năng Vượt Trội Và Những Phát Hiện Gây Sửng Sốt

Điều khiến Claude Mythos Preview trở nên đặc biệt nguy hiểm và đáng lo ngại chính là khả năng tự động phát hiện lỗ hổng bảo mật zero-day. Đây là những lỗi trong phần mềm mà ngay cả nhà phát triển cũng chưa từng biết đến, thường được tìm thấy sau nhiều tháng nghiên cứu của các chuyên gia bảo mật hàng đầu. Tuy nhiên, mô hình AI mới nhất của Anthropic có thể thực hiện điều này ở quy mô lớn, tự động và liên tục, một bước nhảy vọt chưa từng có trong lĩnh vực an ninh mạng.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Theo Anthropic, Claude Mythos đã phát hiện hàng nghìn lỗi trong các hệ điều hành và trình duyệt phổ biến. Một trong những phát hiện gây chấn động là lỗ hổng tồn tại suốt 27 năm trong OpenBSD, hệ điều hành mã nguồn mở được thiết kế chuyên biệt cho bảo mật và được tích hợp vào nhiều bộ định tuyến. Một lỗ hổng khác nằm trong phần mềm video phổ biến, mà các công cụ tự động đã quét đến 5 triệu lần mà không thể phát hiện.

Logan Graham, người đứng đầu nhóm thử nghiệm độ nguy hiểm của mô hình tại Anthropic, nhấn mạnh: "Mô hình Claude Mythos tìm ra lỗ hổng mà giới nghiên cứu bảo mật trong nhiều thập kỷ cũng bỏ sót." Điều này cho thấy sức mạnh đáng kinh ngạc của AI trong việc cách mạng hóa quy trình bảo mật.

Nguy Cơ Tiềm Tàng Và Cảnh Báo Từ Chuyên Gia

Elia Zaitsev, Giám đốc công nghệ của CrowdStrike, cảnh báo rằng mô hình này mang đến rủi ro an ninh mạng toàn cầu. "Những việc trước đây mất hàng tháng trời giờ chỉ mất vài phút nhờ AI", Zaitsev nói. Ông cũng lo ngại rằng các đối thủ và tin tặc sẽ tìm cách khai thác những khả năng tương tự, biến Claude Mythos thành công cụ nguy hiểm nếu rơi vào tay kẻ xấu.

Nikesh Arora, CEO của Palo Alto Networks, mô tả Claude Mythos mang theo hiểm họa khó lường. "Hãy tưởng tượng nó giống như một đám đông đặc vụ đang liên tục và tỉ mỉ lập danh mục mọi điểm yếu trong cơ sở hạ tầng công nghệ của bạn", Arora nhận định. Sự so sánh này làm nổi bật mức độ đe dọa mà AI có thể tạo ra nếu không được kiểm soát chặt chẽ.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Bối Cảnh Phát Triển Và Những Mâu Thuẫn Nội Tại

Jared Kaplan, Giám đốc khoa học Anthropic, giải thích rằng khả năng bảo mật của Claude Mythos không phải là kết quả của huấn luyện đặc biệt. Thay vào đó, nó là hệ quả tự nhiên từ việc mô hình giỏi lập trình và tự động sửa lỗi qua thời gian. Ông dự báo các mô hình AI khác sẽ sớm có khả năng tương tự, dẫn đến cuộc chạy đua leo thang giữa tin tặc và đội ngũ bảo mật ở cấp độ mới.

Quyết định giữ lại mô hình bảo mật có tiền lệ từ năm 2019, khi OpenAI từ chối phát hành GPT-2 vì lo ngại nó có thể bị dùng để tự động hóa sản xuất thông tin sai lệch. Điều thú vị là những người từng lãnh đạo dự án GPT-2 sau đó rời OpenAI và thành lập Anthropic, cho thấy sự kế thừa trong cách tiếp cận thận trọng với AI mạnh.

Thông báo này được đưa ra chỉ một ngày sau khi Anthropic công bố doanh thu hàng năm dự kiến tăng hơn gấp 3 lần trong năm 2026, từ 9 tỷ USD lên hơn 30 tỷ USD. Phần lớn tăng trưởng đến từ nhu cầu sử dụng Claude như công cụ lập trình, và chính năng lực vượt trội đó cũng tạo ra mô hình có khả năng tìm lỗ hổng bảo mật theo cách chưa từng thấy.

Anthropic hiện đang ở vị trí rất mâu thuẫn trong lĩnh vực AI. Công ty vừa chạy đua phát triển các hệ thống mạnh mẽ để tăng doanh thu, vừa phải liên tục cảnh báo về rủi ro của chính công nghệ mình tạo ra. Sự cân bằng này đặt ra những câu hỏi sâu sắc về đạo đức và trách nhiệm trong kỷ nguyên AI, khi ranh giới giữa tiến bộ và nguy cơ ngày càng mong manh.