AI Claude Opus 4.6 viết trình biên dịch C trong 2 tuần, tiêu tốn nửa tỷ đồng
AI Claude viết trình biên dịch C trong 2 tuần, tốn nửa tỷ

AI Claude Opus 4.6 tạo trình biên dịch C chỉ trong hai tuần với chi phí nửa tỷ đồng

Một thử nghiệm đột phá trong lĩnh vực phát triển phần mềm tự động vừa được công bố, khi nhóm nghiên cứu của Anthropic sử dụng 16 AI Claude hoạt động song song để xây dựng trình biên dịch C từ đầu. Dự án kéo dài hai tuần này tiêu tốn chi phí API lên tới 20.000 USD, tương đương khoảng 528 triệu đồng, nhưng đã tạo ra sản phẩm có thể biên dịch nhân Linux 6.9 trên nhiều kiến trúc.

Cách thức hoạt động của đội AI agents

Khác với các phiên bản Claude thông thường chỉ hoạt động độc lập, hệ thống này được thiết kế đặc biệt để cho phép nhiều agents làm việc đồng thời trên cùng mã nguồn mà không cần giám sát trực tiếp của con người. Mỗi agent hoạt động trong container riêng biệt với context riêng, sử dụng vòng lặp liên tục để nhận nhiệm vụ, xử lý và đẩy kết quả về kho git chung.

Hệ thống đồng bộ thông minh được triển khai để tránh xung đột: mỗi Claude ghi lại tập tin khóa cho tác vụ đang xử lý, và nếu agent khác cố gắng nhận cùng nhiệm vụ, nó sẽ buộc phải chọn nhiệm vụ khác. Khi hoàn thành, Claude tự động hợp nhất mã nguồn, xử lý xung đột và tiếp tục vòng lặp.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Đáng chú ý, dù chỉ là nguyên mẫu đơn giản không có hệ thống điều phối tổng thể, các Claude vẫn có khả năng tự xác định nhiệm vụ tiếp theo và ghi lại tiến trình. Ngoài các agents chính viết trình biên dịch, một số agents khác được giao nhiệm vụ chuyên biệt như:

  • Rà soát mã trùng lặp
  • Tối ưu hiệu năng
  • Đánh giá kiến trúc mã từ góc nhìn lập trình viên Rust
  • Hoàn thiện tài liệu kỹ thuật

Những thách thức kỹ thuật và giới hạn hiện tại

Dù đạt được kết quả ấn tượng, nhà nghiên cứu Nicholas Carlini thừa nhận trình biên dịch này vẫn còn nhiều hạn chế so với các công cụ hiện có như GCC:

  1. Chưa có khả năng xử lý chế độ thực 16-bit cần thiết để khởi động Linux, phần này vẫn phụ thuộc vào GCC
  2. Chưa tích hợp bộ hợp dịch và bộ liên kết của riêng mình - hai thành phần Claude mới bắt đầu xây dựng và còn tồn tại lỗi
  3. Mã biên dịch đầu ra kém hiệu quả hơn so với mã do GCC tạo ra, ngay cả khi đã bật tất cả tối ưu hóa
  4. Chất lượng mã Rust nhìn chung ổn định nhưng vẫn còn khoảng cách lớn so với sản phẩm của lập trình viên chuyên nghiệp

Một giải pháp sáng tạo được áp dụng là sử dụng GCC làm trình biên dịch tham chiếu. Claude chỉ biên dịch một phần mã, phần còn lại được xử lý bằng GCC để xác định chính xác vị trí lỗi, từ đó mỗi agent có thể làm việc song song và khắc phục các lỗi riêng biệt.

Bước tiến đáng kể trong bối cảnh lịch sử

Thành tựu của Claude Opus 4.6 càng trở nên đáng chú ý khi so sánh với lịch sử phát triển phần mềm. Trình biên dịch C đầu tiên do Dennis Ritchie viết vào đầu thập niên 1970 đã mất khoảng 2 năm để hoàn thiện, với sự tham gia của nhiều kỹ sư tại Bell Labs. Khi đó, tài nguyên tính toán hạn chế, ngôn ngữ lập trình còn non trẻ, và quy trình phát triển phần mềm chưa được chuẩn hóa.

So sánh này cho thấy, dù Claude chưa tạo ra sản phẩm hoàn chỉnh, việc hệ thống AI có thể xây dựng trình biên dịch khả thi chỉ trong hai tuần, với chi phí tương đương mức lương hai tháng của kỹ sư phần mềm tại Mỹ, là bước tiến công nghệ đáng kể.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Rủi ro an ninh trong phát triển phần mềm tự động

Carlini nhấn mạnh rằng, dù khả năng lập trình bằng agents team mở ra tiềm năng lớn, rủi ro an toàn cần được đặc biệt lưu ý. Việc triển khai phần mềm do AI viết mà không qua kiểm tra thủ công tiềm ẩn nhiều nguy cơ, nhất là trong các hệ thống đòi hỏi độ tin cậy cao, bởi agents team thường hoạt động tự động mà không cần con người can thiệp.

Dự án này không chỉ là thử nghiệm kỹ thuật mà còn là công cụ đánh giá năng lực của các thế hệ mô hình Opus. Carlini cho biết Claude Opus 4.5 mới chỉ đủ khả năng tạo trình biên dịch vượt qua bộ kiểm thử cơ bản. Chỉ đến phiên bản 4.6, mô hình mới đạt đủ năng lực để xây dựng phần mềm ở quy mô lớn như biên dịch nhân Linux.

Dù vẫn còn nhiều hạn chế, tác giả tin rằng hướng phát triển này sẽ tiếp tục mở rộng. Carlini kết luận: "Tôi không nghĩ khả năng này có thể đạt được sớm như vậy trong năm 2026. Chúng ta đang bước vào kỷ nguyên mới của phát triển phần mềm, nơi cần có chiến lược phù hợp để khai thác hiệu quả và an toàn sức mạnh của AI."