Claude Opus 4.7 chính thức trình làng với cải tiến đột phá
Anthropic vừa công bố phiên bản Claude Opus 4.7, đánh dấu bước nâng cấp quan trọng so với Opus 4.6 trước đó. Mô hình trí tuệ nhân tạo mới này mang đến những cải tiến vượt trội trong lĩnh vực lập trình phần mềm và xử lý hình ảnh, nhưng đồng thời cũng đi kèm với cảnh báo đặc biệt dành cho cộng đồng lập trình viên đang sử dụng các phiên bản cũ.
Khả năng xử lý hình ảnh tăng gấp ba lần
Một trong những điểm nhấn ấn tượng nhất của Opus 4.7 chính là khả năng xử lý hình ảnh được nâng cấp đáng kể. Mô hình mới có thể xử lý ảnh với độ phân giải lên đến 2.576 pixel ở cạnh dài, tương đương khoảng 3,75 megapixel. Con số này tăng gấp hơn ba lần so với các thế hệ Claude trước đây.
Sự cải thiện này mở ra nhiều ứng dụng thực tế quan trọng:
- Các tác nhân sử dụng máy tính giờ đây có thể đọc được những ảnh chụp màn hình chứa thông tin dày đặc
- Khả năng trích xuất dữ liệu từ các sơ đồ kỹ thuật phức tạp
- Thực hiện các công việc đòi hỏi tham chiếu chính xác từng pixel trong hình ảnh
Tự kiểm tra code trước khi báo cáo
Opus 4.7 được trang bị tính năng tự kiểm tra đầu ra trước khi trình bày kết quả cuối cùng. Theo phản hồi từ những người dùng thử nghiệm sớm, họ có thể giao phó những công việc lập trình phức tạp nhất - loại công việc trước đây cần giám sát chặt chẽ - cho Opus 4.7 với mức độ tin cậy cao.
Mô hình này xử lý các tác vụ kéo dài với sự nghiêm ngặt và nhất quán, chú ý chính xác đến từng hướng dẫn, đồng thời tự động nghĩ ra phương pháp xác minh đầu ra của chính nó trước khi đưa ra kết quả cuối cùng.
Cảnh báo quan trọng cho lập trình viên
Tuy nhiên, cải tiến đáng chú ý nhất cũng chính là điểm cần lưu ý lớn nhất. Opus 4.7 tuân thủ hướng dẫn theo nghĩa đen chặt chẽ hơn nhiều so với phiên bản trước. Anthropic đưa ra cảnh báo rõ ràng: "Các đoạn prompt được viết cho các mô hình trước đây đôi khi giờ đây có thể tạo ra kết quả không mong đợi."
Công ty giải thích thêm: "Trong khi các mô hình trước diễn giải hướng dẫn một cách lỏng lẻo hoặc bỏ qua hoàn toàn một số phần, Opus 4.7 thực hiện hướng dẫn theo nghĩa đen. Người dùng nên tinh chỉnh lại các đoạn prompt và công cụ của họ cho phù hợp."
Nói cách khác, nếu Opus 4.6 có thể "đoán" được ý định của người dùng ngay cả khi lệnh không rõ ràng, thì Opus 4.7 sẽ thực hiện chính xác những gì được yêu cầu - bất kể đó có phải là điều người dùng thực sự muốn hay không. Sự thay đổi này có thể ảnh hưởng đến toàn bộ quy trình làm việc của những ai đã xây dựng hệ thống tự động dựa trên các phiên bản trước.
Những thay đổi kỹ thuật quan trọng
Opus 4.7 sử dụng bộ tokenizer được cập nhật, giúp cải thiện cách mô hình xử lý văn bản. Tuy nhiên, đánh đổi là cùng một đầu vào có thể được ánh xạ thành nhiều token hơn - khoảng từ 1,0 đến 1,35 lần tùy thuộc vào loại nội dung.
Hơn nữa, Opus 4.7 suy nghĩ nhiều hơn ở các mức độ nỗ lực cao hơn, đặc biệt trong các tình huống tác nhân. Điều này cải thiện độ tin cậy khi giải quyết các vấn đề khó, nhưng đồng thời cũng tạo ra nhiều token đầu ra hơn - ảnh hưởng trực tiếp đến chi phí sử dụng.
Để giúp người dùng kiểm soát tốt hơn, Anthropic đã giới thiệu mức nỗ lực mới "xhigh" (cực cao) nằm giữa "high" và "max", cho phép cân bằng tốt hơn giữa khả năng suy luận và độ trễ. Trong Claude Code, mức nỗ lực mặc định đã được nâng lên xhigh cho tất cả các gói.
Tính năng mới đáng chú ý
Một tính năng mới đáng chú ý khác là lệnh /ultrareview trong Claude Code, tạo ra một phiên đánh giá chuyên sâu đọc qua các thay đổi và gắn cờ các lỗi cũng như vấn đề thiết kế mà một người đánh giá cẩn thận sẽ phát hiện. Người dùng Pro và Max của Claude Code được tặng ba lần ultrareview miễn phí để dùng thử.
Ngoài ra, chế độ auto - cho phép Claude đưa ra quyết định thay mặt người dùng, giúp chạy các tác vụ dài hơn với ít gián đoạn hơn - đã được mở rộng cho người dùng Max.
Hiệu suất và khả năng tiếp cận
Về mặt hiệu suất thực tế, Opus 4.7 đạt điểm cao nhất trong đánh giá Finance Agent và là mô hình tiên tiến nhất trên GDPval-AA, một đánh giá của bên thứ ba về công việc tri thức có giá trị kinh tế. Mô hình cũng tốt hơn trong việc sử dụng bộ nhớ dựa trên hệ thống tệp, ghi nhớ các ghi chú quan trọng trong công việc dài, nhiều phiên và sử dụng chúng để chuyển sang các tác vụ mới.
Về mặt giá cả, Opus 4.7 vẫn giữ nguyên mức giá như Opus 4.6: 5 USD cho mỗi triệu token đầu vào và 25 USD cho mỗi triệu token đầu ra. Mô hình đã có sẵn ngay hôm nay trên tất cả các sản phẩm Claude và API của công ty, cũng như trên Amazon Bedrock, Vertex AI của Google Cloud và Microsoft Foundry.
Lời khuyên cho người dùng hiện tại
Nhìn chung, Claude Opus 4.7 là một bước nâng cấp nghiêm túc so với Opus 4.6, đặc biệt trong lĩnh vực kỹ thuật phần mềm và các tác vụ tác nhân kéo dài. Tuy nhiên, với những thay đổi căn bản trong cách xử lý lệnh và tokenization, người dùng hiện tại cần dành thời gian để kiểm tra lại và tinh chỉnh các prompt cũng như quy trình làm việc của mình trước khi chuyển đổi hoàn toàn sang phiên bản mới.
Anthropic đã công bố một hướng dẫn di chuyển chi tiết để giúp người dùng nâng cấp từ Opus 4.6 lên 4.7 một cách suôn sẻ nhất. Điều quan trọng là các lập trình viên và tổ chức cần đánh giá kỹ lưỡng tác động của phiên bản mới đối với hệ thống hiện có của họ trước khi triển khai trên diện rộng.



