Ứng dụng AI đọc hóa đơn: Cứu cánh cho nỗi ám ảnh 'sai một li đi tù một dặm' của dân kế toán
Câu nói "kế toán - nghề dễ đi tù nhất" từ lâu đã trở thành meme phổ biến trên mạng xã hội Việt Nam, đặc biệt trong các hội nhóm tài chính và nền tảng như TikTok. Đằng sau sự hài hước đó là nỗi ám ảnh có thật: chỉ một sai sót nhỏ trong sổ sách, khai man chứng từ hoặc ghi nhận không đúng quy định đều có thể dẫn đến những hậu quả pháp lý nghiêm trọng theo luật kế toán Việt Nam.
Giải pháp từ một lập trình viên freelancer
Vasily Zubarev, lập trình viên gốc Siberia hiện sống tại Berlin (Đức), đã trực tiếp trải nghiệm nỗi khổ này. Làm freelancer, mỗi năm đến mùa thuế, anh phải dành cả tuần để phân loại hàng trăm hóa đơn tích lũy từ đầu năm. Sau nhiều năm thử nghiệm các phần mềm kế toán thương mại không phù hợp với workflow cá nhân hoặc có mức phí quá cao, Zubarev quyết định tự tạo giải pháp cho chính mình.
Anh đã phát triển TaxHacker - một ứng dụng mã nguồn mở sử dụng mô hình ngôn ngữ lớn (LLM) để tự động đọc và phân loại hóa đơn, sau đó phát hành miễn phí dưới giấy phép MIT cho cộng đồng.
Cách thức hoạt động của TaxHacker
Ứng dụng này hoạt động theo quy trình đơn giản nhưng hiệu quả:
- Người dùng upload ảnh hóa đơn, biên lai hoặc file PDF
- Hệ thống gửi tài liệu qua LLM đa phương thức (hỗ trợ OpenAI, Google Gemini hoặc Mistral)
- AI nhận diện và trích xuất thông tin: ngày tháng, số tiền, tên nhà cung cấp, danh sách sản phẩm, thuế
- Tự động phân loại và lưu vào database dạng bảng tính
TaxHacker có khả năng xử lý đa dạng tài liệu: hóa đơn cửa hàng, bill nhà hàng, sao kê ngân hàng, thậm chí cả hóa đơn viết tay bằng nhiều ngôn ngữ khác nhau. Ứng dụng còn có thể tách từng item trong một invoice thành các transaction riêng biệt.
Điểm đột phá trong thiết kế
Khác với nhiều giải pháp OCR bằng AI khác, TaxHacker nổi bật với triết lý thiết kế mở:
- Toàn bộ prompt AI đều mở và cho phép chỉnh sửa
- Người dùng có thể tạo custom fields không giới hạn, mỗi field đi kèm prompt riêng
- System prompt chung cũng có thể sửa đổi trực tiếp trong settings
Zubarev giải thích: "Các phần mềm kế toán tôi từng dùng đều ép người dùng vào khuôn mẫu cố định, với những trường dữ liệu bắt buộc không liên quan. Một ứng dụng thậm chí yêu cầu nhập email và 'State' cho mỗi giao dịch đơn lẻ."
Tính năng hỗ trợ đa tiền tệ
Một điểm mạnh khác của TaxHacker là khả năng hỗ trợ tiền tệ:
- Tự nhận diện loại tiền trong tài liệu
- Quy đổi theo tỷ giá lịch sử tại ngày giao dịch thực tế
- Hỗ trợ hơn 170 loại tiền tệ thế giới
- Hỗ trợ 14 loại tiền mã hóa phổ biến như BTC, ETH, LTC, DOT
Tính năng này đặc biệt hữu ích cho freelancer nhận thanh toán từ nhiều quốc gia hoặc bằng cryptocurrency.
Công nghệ và triển khai
Về mặt kỹ thuật, TaxHacker được xây dựng trên nền:
- Next.js 15+ với PostgreSQL 17+
- Deploy bằng Docker Compose gồm 2 container
- Toàn bộ dữ liệu lưu trên máy chủ của người dùng
Ứng dụng còn tích hợp nhiều tính năng hữu ích khác: full-text search trong nội dung tài liệu đã nhận diện, filter nâng cao theo nhiều tiêu chí, export CSV kèm file đính kèm, và thao tác hàng loạt.
Những hạn chế cần lưu ý
Tuy nhiên, người dùng cần nhận thức rõ một số hạn chế của dự án:
- Dự án vẫn đang trong giai đoạn phát triển sớm, người dùng tự chịu rủi ro
- Không có tính năng invoicing, payroll hay hệ thống sổ kép
- Bản chất là expense tracker kết hợp document analyzer, không phải phần mềm kế toán chuyên nghiệp
- Chưa có tính năng cộng tác nhiều người dùng đầy đủ
- Chưa có mobile app chính thức
- Vẫn phát sinh chi phí sử dụng AI do phụ thuộc API từ các nhà cung cấp
- Quy mô cộng đồng hiện còn nhỏ (khoảng 250 stars trên GitHub)
Lộ trình phát triển và tương lai
Zubarev cho biết đã sử dụng ứng dụng của mình để xử lý hơn 200 hóa đơn cho năm 2024. Trong lộ trình phát triển tiếp theo, TaxHacker sẽ được bổ sung nhiều tính năng mới:
- Tự động tạo báo cáo VAT theo quý
- Nhắc nhở deadline thuế
- Đánh dấu giao dịch thiếu dữ liệu
- Cho phép phân tích lại hàng loạt khi thay đổi prompt
- Hỗ trợ LLM local (đang trong lộ trình)
Mã nguồn được phát hành miễn phí dưới giấy phép MIT, dành cho những người biết sử dụng Docker và muốn tự kiểm soát dữ liệu tài chính của mình. Dù vậy, như Zubarev nhấn mạnh: "Chị kế toán vẫn là người đáng tin cậy nhất mà không AI nào thay thế được."
TaxHacker đại diện cho xu hướng tự động hóa trong quản lý tài chính cá nhân và doanh nghiệp nhỏ, giúp giảm thiểu rủi ro sai sót trong bối cảnh các quy định kế toán ngày càng trở nên phức tạp và nghiêm ngặt.



