Kỷ lục 'token' AI: Kỹ sư OpenAI xử lý 210 tỷ đơn vị, người dùng chi 150.000 USD/tháng
Kỷ lục token AI: 210 tỷ đơn vị xử lý, hóa đơn 150.000 USD

Kỷ nguyên 'Tokenmaxxing': Token trở thành thước đo quyền lực mới trong ngành công nghệ

Theo báo cáo từ tờ New York Times (NYT), một kỹ sư tại OpenAI đã lập kỷ lục ấn tượng khi xử lý tới 210 tỷ token chỉ trong vòng một tuần. Con số này tương đương với lượng văn bản đủ để lấp đầy 33 lần trang Wikipedia, cho thấy sức mạnh xử lý ngôn ngữ khổng lồ của các hệ thống AI hiện đại.

Cuộc đua tiêu thụ token và những con số khổng lồ

Không chỉ tại OpenAI, tại Anthropic, một người dùng khác cũng khiến giới công nghệ ngỡ ngàng với hóa đơn sử dụng AI lên tới 150.000 USD chỉ trong một tháng. NYT nhận định, ngành công nghệ đang bước vào kỷ nguyên của "Tokenmaxxing", nơi năng suất lao động không còn được đo bằng mồ hôi hay giờ làm việc, mà bằng tốc độ tiêu thụ dữ liệu của các cỗ máy AI.

Trong giới công nghệ hiện nay, token – đơn vị cơ bản mà AI dùng để xử lý ngôn ngữ – đang trở thành thước đo quyền lực mới. Tại các gã khổng lồ như Meta hay OpenAI, một thực tế mới đang hình thành: các bảng xếp hạng nội bộ không còn vinh danh người làm việc muộn nhất, mà vinh danh người tiêu tốn nhiều token nhất.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Token như phúc lợi nghề nghiệp và công cụ sinh tồn

Các công ty công nghệ lớn bắt đầu coi "ngân sách token" là một phúc lợi nghề nghiệp xa xỉ, tương đương với bảo hiểm nha khoa hay những bữa trưa miễn phí. Một số lập trình viên đang chi hàng ngàn USD mỗi tháng để tự động hóa tối đa công việc của mình. Kỹ sư phần mềm Max Linder tại Stockholm chia sẻ với NYT rằng anh có thể chi tiêu cho AI nhiều hơn cả mức lương của mình, nhưng may mắn là doanh nghiệp chủ quản đang thanh toán hóa đơn đó thay cho anh.

Sự khác biệt về quy mô tiêu thụ giữa người thường và giới công nghệ là rất kinh khủng. Nếu một sinh viên viết tiểu luận chỉ tiêu tốn khoảng 10.000 token, thì giới chuyên gia tại Thung lũng Silicon đang vận hành những hệ thống tiêu thụ hàng tỷ đơn vị. Điều này chỉ trở nên khả thi nhờ sự ra đời của các công cụ lập trình mang tính "tác nhân" (agentic tools), những hệ thống có thể hoạt động độc lập hàng giờ liền, tự soát lỗi, chỉnh sửa mã nguồn và viết toàn bộ phần mềm chỉ từ một yêu cầu duy nhất.

Áp lực cạnh tranh và nỗi sợ bị thay thế

Thuật ngữ "Tokenmaxxing" không chỉ đơn thuần là việc sử dụng công cụ mà đã trở thành một chiến thuật sinh tồn. Tại Shopify hay Meta, các nhà quản lý đã bắt đầu đưa việc sử dụng AI vào các kỳ đánh giá hiệu suất. Những nhân viên tận dụng tối đa AI được khen thưởng, trong khi những người chậm chân bị nhắc nhở.

Nhà đầu tư Nikunj Kothari tại San Francisco nhận định với tờ NYT rằng sự lo âu về năng suất đang bao trùm thị trường. Những cuộc trò chuyện bên bàn ăn không còn bắt đầu bằng câu "Bạn đang xây dựng cái gì?" mà chuyển thành "Bạn đang vận hành bao nhiêu tác nhân AI?". Ông Ege Erdil, người đồng sáng lập startup AI Mechanize, ước tính mức tiêu thụ cá nhân của mình rơi vào khoảng 1 tỷ đến 10 tỷ token mỗi tuần. Theo ông, nếu có các tác nhân chạy liên tục, việc cán mốc 700 triệu token một tuần từ một tác nhân duy nhất là điều không hề khó khăn.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Trên thực tế, nỗi sợ hãi về một "ngày tận thế" của các công việc văn phòng đang khiến các lập trình viên tin rằng: Nếu bạn không phải là người điều khiển một đội quân AI làm việc 24/7, bạn sẽ là người đầu tiên bị thay thế.

Mặt trái: Lãng phí và câu hỏi về giá trị thực

Cơn sốt này đang biến các công ty AI thành những cỗ máy in tiền thực thụ. Anthropic đã tăng gấp đôi dự báo doanh thu chỉ trong hai tháng đầu năm nay nhờ sự tăng trưởng chóng mặt của các công cụ lập trình. OpenAI cho biết công cụ Codex của họ đã tăng gấp ba lượng người dùng hoạt động hàng tuần và mức sử dụng token tăng gấp năm lần kể từ đầu năm. Năm ngoái, Google cũng tiết lộ các mô hình của họ đã xử lý hơn 1,3 triệu tỷ token mỗi tháng.

Tuy nhiên, sự bùng nổ này cũng đi kèm với những lỗ hổng và sự hoang phí. Một nhà sáng lập start-up đã phát hiện ra lỗ hổng trong công cụ của Figma, cho phép anh ta sử dụng lượng token tương đương 70,000 USD của Claude nhưng chỉ phải trả 20 USD mỗi tháng. Figma sau đó đã phải gấp rút thắt chặt quy định để ngăn chặn tình trạng này.

Ngoài ra, câu hỏi lớn nhất đặt ra là: Liệu hàng tỷ token đó có tạo ra giá trị thực sự hay chỉ là một màn trình diễn để đối phó với sếp? Các bảng xếp hạng hiện nay mới chỉ đo lường số lượng, chưa đo lường được chất lượng đầu ra. Một nhân viên của OpenAI giấu tên thừa nhận rằng việc "nghiện" đốt token để chứng tỏ năng suất có vẻ là một hướng đi không bền vững.

Liệu giới lập trình đang thực sự trở thành những "kỹ sư nhân 100 lần năng suất", hay họ chỉ đang xoay vòng trong một tòa tháp token ảo tưởng, được xây dựng trên sự cạnh tranh và nỗi sợ hãi? Dù câu trả lời là gì, có một sự thật không thể chối cãi: Cuộc chơi này đang tiêu tốn một nguồn lực kinh khủng. Để duy trì cơn khát token của giới công nghệ, thế giới sẽ cần nhiều trung tâm dữ liệu hơn, nhiều năng lượng hơn và có lẽ là một cách tiếp cận tỉnh táo hơn về khái niệm "làm việc hiệu quả".