Ngành xuất bản chật vật phân biệt con người với AI: Bài học từ tiểu thuyết Shy Girl

Theo New York Times, ngành xuất bản sách hiện có rất ít cơ chế để phát hiện và ngăn chặn việc vô tình phát hành một cuốn sách phần lớn do trí tuệ nhân tạo (AI) tạo ra. Sự việc xoay quanh tiểu thuyết kinh dị Shy Girl (tạm dịch: Cô gái nhút nhát) đã làm dấy lên mối lo ngại sâu sắc về khả năng xâm nhập của công nghệ này vào lĩnh vực sáng tạo truyền thống.

Vụ bê bối Shy Girl: Từ nghi ngờ đến thu hồi

Nhiều tháng qua, cộng đồng mạng rộ lên suy đoán rằng tiểu thuyết kinh dị Shy Girl được viết với sự hỗ trợ của AI. Cuốn sách kể về cô gái trẻ bị một người đàn ông quen qua mạng bắt cóc rồi ép sống như thú cưng, ra mắt dưới hình thức tự xuất bản vào tháng 2/2025 và nhanh chóng thu hút độc giả dòng kinh dị. Tập đoàn Hachette đã mua bản quyền để phát hành tại Vương quốc Anh vào mùa thu năm ngoái, với kế hoạch ra mắt tại Mỹ vào mùa xuân năm nay, quảng bá đây là "tiểu thuyết kinh dị báo thù trần trụi, không khoan nhượng".

Sau khi sách phát hành tại Anh, ngày càng nhiều độc giả bày tỏ nghi ngờ tác giả đã sử dụng AI, dựa trên bằng chứng là các ẩn dụ vô nghĩa và lối diễn đạt lặp lại, kỳ lạ. Làn sóng cáo buộc dâng cao vào cuối tháng 1, nhưng Hachette vẫn giữ im lặng cho đến khi có kết quả kiểm tra độc lập.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Đầu năm nay, Max Spero, nhà sáng lập kiêm giám đốc điều hành Pangram - một chương trình phát hiện AI - đã kiểm tra toàn bộ tiểu thuyết và phát hiện 78% nội dung do AI tạo ra. Kết quả này được đăng tải lên mạng xã hội X vào tháng 1, gây chấn động. Tờ The Times cũng phân tích các đoạn trích bằng nhiều công cụ phát hiện AI và nhận thấy những dấu hiệu đặc trưng của văn bản do máy tạo ra, như lỗ hổng logic, lạm dụng tính từ kịch tính và phụ thuộc quá mức vào quy tắc ba.

Chuyên gia tư vấn xuất bản Thad McIlroy đã đưa bản sách cho ba công cụ Pangram, GPTZero và Originality.ai kiểm tra, và cả ba đều kết luận văn bản khả năng cao do AI tạo ra một phần hoặc phần lớn. Những cụm như "khoảnh khắc im lặng như con dao cắm vào ngực tôi, sắc bén và không lay chuyển" được chỉ ra là mang dấu hiệu đặc trưng của chatbot.

Trả lời The New York Times, Hachette cho biết Nhà xuất bản Orbit của họ đã hủy kế hoạch phát hành cuốn sách tại Mỹ, đồng thời sẽ ngừng xuất bản tại Anh. Quyết định này được đưa ra sau quá trình phân tích kỹ lưỡng và kéo dài, nhấn mạnh rằng công ty đề cao sáng tạo của con người và yêu cầu tác giả xác nhận tác phẩm là nguyên gốc.

Theo phần giới thiệu, tác giả của Shy Girl, Mia Ballard, là một người viết thơ sống ở Bắc California. Cô gần như không hiện diện trên mạng xã hội và trong một email gửi The Times vào 19/3, Ballard phủ nhận sử dụng AI viết sách, cho rằng một người quen mà cô thuê chỉnh sửa bản tự xuất bản đã sử dụng AI mà cô không hay biết.

AI len lỏi vào hệ thống xuất bản truyền thống

Shy Girl dường như là tiểu thuyết thương mại đầu tiên từ một nhà xuất bản lớn bị thu hồi do bằng chứng liên quan đến AI. Sự việc cho thấy văn bản do AI tạo ra không chỉ xuất hiện trong ebook tự xuất bản giá rẻ tràn ngập Amazon, mà còn đang len lỏi vào cả hệ thống xuất bản truyền thống, vốn được xem là "pháo đài cuối cùng" của văn chương nguyên bản do con người chọn lọc và biên tập.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Việc Shy Girl có thể đi xa đến vậy trong quy trình biên tập, thậm chí phát hành tại Anh trước khi bị điều tra kỹ lưỡng, cho thấy ngành xuất bản đang thiếu chuẩn bị trước sự trỗi dậy của AI. Nó báo hiệu một kỷ nguyên mới đầy bất định, khi cả biên tập viên lẫn độc giả phải tự hỏi liệu văn bản mình đang đọc là do con người hay máy móc viết ra.

Rất ít nhà xuất bản hoặc biên tập viên sẵn sàng phát biểu công khai về cách đối mặt với AI, bởi công nghệ này vẫn còn gây tranh cãi và mơ hồ về mặt đạo đức. Tuy vậy, một số lãnh đạo ngành xuất bản lo ngại rằng khó có thể ngăn chặn AI xâm nhập, nhất là khi công nghệ ngày càng tinh vi.

"Cũng giống với vấn đề đạo văn, bạn phải đặt niềm tin vào tác giả. Chúng tôi phải tin tưởng đối tác của mình", Morgan Entrekin, điều hành nhà xuất bản Grove Atlantic, chia sẻ.

Tác động sâu rộng và ranh giới mơ hồ

Hiện tại, tác động rõ rệt nhất của AI đang diễn ra trong lĩnh vực tự xuất bản, mà nhiều tác giả nhận định đã “ngập lụt” nội dung AI kém chất lượng. Năm ngoái, có hơn 3,5 triệu cuốn sách tự xuất bản, tăng từ 2,5 triệu vào năm 2024, theo dữ liệu của Bowker. Trong khi đó, các nhà xuất bản truyền thống phát hành chỉ hơn 642.000 đầu sách.

Tuhin Chakrabarty, giáo sư khoa học máy tính tại Đại học Stony Brook, đã dùng Pangram để kiểm tra hơn 14.000 tiểu thuyết tự xuất bản trên Amazon, chủ yếu trong giai đoạn 2024-2025. Kết quả cho thấy gần 20% số này có phần đáng kể do AI viết. Danh sách của Chakrabarty tập trung vào những cuốn được độc giả đón nhận, và Shy Girl thuộc số những cuốn nổi bật, với hơn 4.840 lượt đánh giá và điểm trung bình 3,5 sao trên Goodreads.

Nhiều nhà xuất bản hiện không ghi rõ cấm sử dụng AI trong hợp đồng, mà dựa vào điều khoản yêu cầu tác phẩm phải "nguyên gốc". Tuy nhiên, ranh giới sử dụng phù hợp vẫn rất mơ hồ, vì AI được dùng rộng rãi trong nghiên cứu, lập dàn ý và các khâu khác. Thiếu vắng ranh giới rõ ràng đang gây ra sự mơ hồ: một tiểu thuyết gia có thể nhờ AI gợi ý tình tiết mà vẫn coi đó là tác phẩm nguyên gốc không?

Sử dụng AI trong viết lách vẫn gây chia rẽ sâu sắc. Một số xem đó là gian lận, đặc biệt khi độc giả không biết mình đang đọc nội dung do chatbot tạo ra. Số khác gọi đó là hành vi "ăn cắp", bởi lẽ nhiều AI được huấn luyện bằng tác phẩm có bản quyền mà không được cấp phép.

"Với tác giả, đây không chỉ là công nghệ, mà là vấn đề đạo đức. Họ cảm thấy tác phẩm của mình đã bị đánh cắp", Seth Fishman, một đại diện văn học, cho biết.

Hướng đi tương lai và thách thức

Hiện chưa có đồng thuận về cách kiểm soát nội dung AI trong ngành xuất bản. Một số đại diện và biên tập viên cho rằng cần quy định rõ ràng hơn để tránh nhầm lẫn hoặc gian lận. Penguin Random House đã đưa ra hướng dẫn về việc sử dụng AI, trong khi các nhà xuất bản lớn khác như HarperCollins, Simon & Schuster và Macmillan chủ yếu nhấn mạnh điều khoản "tính nguyên gốc".

Tuy nhiên, sự mơ hồ và kỳ thị xoay quanh AI có thể khiến tác giả càng ít minh bạch hơn. "Càng tránh né thảo luận, thì người ta càng dễ lạm dụng. Nỗi xấu hổ về AI đang gây hại nhiều hơn là giúp ích", Chakrabarty nói.

Vụ việc Shy Girl là một hồi chuông cảnh tỉnh cho ngành xuất bản toàn cầu, đòi hỏi sự phối hợp chặt chẽ giữa công nghệ, đạo đức và pháp lý để bảo vệ sự sáng tạo chân chính của con người trong kỷ nguyên số.