OpenAI đặt tên bí danh 'Strawberry' cho AI theo lỗi đếm chữ r trong 'strawberry'

Năm 2024, một câu hỏi đơn giản lan truyền khắp mạng xã hội khiến ChatGPT liên tục trả lời sai: "Có bao nhiêu chữ r trong từ strawberry?" Câu trả lời đúng là 3, nhưng ChatGPT nhất quán đưa ra đáp án 2. Thay vì âm thầm vá lỗi, OpenAI đã làm điều không ai ngờ tới: biến chính câu hỏi đó thành tên bí danh cho dự án quan trọng nhất trong lịch sử công ty.

Lỗi đếm chữ r và sự châm biếm của cộng đồng công nghệ

Giữa năm 2024, thử thách nhỏ này bắt đầu lan truyền trên mạng xã hội, gây sốt trong cộng đồng công nghệ. Một AI có khả năng viết luận văn tiến sĩ, giải đề thi đại học, lập trình ứng dụng phức tạp, nhưng lại đếm sai chữ cái trong một từ mà học sinh tiểu học có thể dễ dàng nhận ra. Điều này dẫn đến nhiều cuộc thảo luận sôi nổi về bản chất của trí tuệ nhân tạo.

Vấn đề không nằm ở việc AI "ngu", mà là cách nó xử lý văn bản. Các mô hình ngôn ngữ lớn như ChatGPT không đọc từng chữ cái riêng lẻ như con người. Thay vào đó, văn bản được chia thành các token – những khối ngôn ngữ lớn hơn ký tự, thường là từ, tiền tố, hậu tố hoặc cụm âm tiết phổ biến.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Với GPT-4, từ "strawberry" không phải là 10 chữ cái s-t-r-a-w-b-e-r-r-y, mà được tách thành 3 token: str + aw + berry. Trong ba khối này, chỉ có str và berry chứa chữ r, dẫn đến AI đếm được 2. Đây là hệ quả của kiến trúc AI, được thiết kế để hiểu nghĩa hơn là phân tích chính tả chi tiết.

Dự án bí mật mang tên 'Strawberry' và sự ra mắt của o1

Tháng 11/2023, sự kiện Sam Altman bị sa thải khỏi OpenAI gây chấn động ngành công nghệ. Trong những ngày hỗn loạn sau đó, tin đồn về một dự án AI bí mật tên "Q*" – được cho là đạt đột phá trong khả năng lý luận toán học – bắt đầu lan rộng.

Tám tháng sau, vào tháng 7/2024, Reuters xác nhận OpenAI đang phát triển một model mới với bí danh nội bộ là "Strawberry". Bí danh Q* và Strawberry thực chất là một. Theo xác nhận từ OpenAI, cái tên này là một tuyên ngôn nội bộ: đội ngũ đang xây dựng một model cuối cùng sẽ làm được điều mà các model trước không thể – đếm đúng số chữ r trong "strawberry".

Khi o1 ra mắt vào tháng 9/2024, OpenAI thậm chí đưa câu hỏi về strawberry vào danh sách gợi ý trên giao diện, như một lời thách thức công khai với sản phẩm cũ của mình. O1 không thay đổi cách tokenization hoạt động, mà được huấn luyện để "suy nghĩ thành tiếng" trước khi trả lời, sử dụng kỹ thuật chain-of-thought reasoning (suy luận từng bước).

Thay vì trả lời ngay lập tức, o1 tự nhẩm: tách từng chữ cái ra, đếm từng bước, kiểm tra lại. Kết quả là 3 – đúng. Tuy nhiên, cách làm này có giá đắt: o1 cần 20-30 giây để trả lời, so với GPT-4o chỉ mất chưa đầy 3 giây, và chi phí API cao hơn nhiều lần. OpenAI giải thích đây là model dành cho tác vụ phức tạp, không phải để thay thế GPT-4o.

Phần tiếp theo ít được kể và sự phát triển của các model mới

Tháng 12/2025, OpenAI ra mắt GPT-5.2. Khi được hỏi lại câu hỏi cũ, model mới nhất này vẫn trả lời: 2 – lại sai theo cùng một cách. GPT-5.x sử dụng tokenization scheme mới hơn tên o200k_harmony, nhưng "strawberry" vẫn bị tách thành str + aw + berry.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Chain-of-thought reasoning của o1 không được tích hợp vào dòng GPT-5.x do sự đánh đổi rõ ràng: tốc độ phản hồi và chi phí. Người dùng ChatGPT thông thường không muốn chờ 30 giây cho mỗi câu trả lời. Tính đến thời điểm hiện tại, các model mới nhất như GPT-5.3 và GPT-5.4 (tính đến tháng 4/2026) đã khắc phục phần nào vấn đề này.

Trong khi đó, các đối thủ như Claude, Gemini, Grok và Perplexity rất ít khi trả lời sai từ trước đến nay vì sử dụng tokenization khác. O1-preview và o1-mini đã bị deprecated từ tháng 4/2025, nhưng câu chuyện đằng sau cái tên "Strawberry" vẫn chưa có hồi kết.

Ý nghĩa sâu xa của cái tên 'Strawberry'

Điều thú vị nhất trong toàn bộ câu chuyện này không phải là kỹ thuật hay khả năng giải bài toán của o1, mà là cách một đội ngũ gồm hàng nghìn kỹ sư, nhà nghiên cứu và nhà khoa học hàng đầu thế giới chọn đặt tên cho dự án quan trọng nhất của mình – theo đúng điều họ chưa làm được, như một lời nhắc nhở tự đặt ra cho chính mình.

Trong ngành công nghệ, nơi mỗi sản phẩm mới thường được quảng bá với những tính từ hoa mỹ, "Strawberry" là cái tên đặc biệt trung thực một cách hiếm gặp. Nó phản ánh tinh thần khiêm tốn và sự cam kết không ngừng cải tiến, ngay cả khi đối mặt với những giới hạn kỹ thuật cơ bản.