Bộ Công An cảnh báo bất thường điểm thi tốt nghiệp THPT, nghi vấn từ khâu chấm tự luận
Tại hội nghị tập huấn công tác tổ chức thi và kiểm tra kỳ thi tốt nghiệp THPT năm 2026 do Bộ Giáo dục và Đào tạo tổ chức tuần qua, đại tá Nguyễn Anh Tuấn, Phó cục trưởng Cục An ninh chính trị nội bộ (A03), Bộ Công an, đã đưa ra thông tin quan trọng. Ông cho biết những năm qua dư luận tiếp tục phản ánh nghi vấn một số địa phương có điểm thi cao bất thường và đặt vấn đề liệu có sự buông lỏng trong quá trình chấm thi.
Những năm gần đây, thứ hạng môn ngữ văn giữa các địa phương trong kỳ thi tốt nghiệp THPT biến động rất lớn, có nơi chênh tới hơn 40 bậc chỉ sau một năm. Sự bất thường này đặt ra câu hỏi: điểm số có phản ánh đúng năng lực học sinh, hay còn chịu ảnh hưởng đáng kể từ cách chấm tự luận?
Tự luận - Ưu thế nhưng cũng dễ "lệch chuẩn"
Không thể phủ nhận, bài thi tự luận và chấm tự luận môn ngữ văn có những ưu thế mà trắc nghiệm không thể thay thế. Bài viết cho phép học sinh thể hiện tư duy phân tích, năng lực lập luận, khả năng cảm thụ và diễn đạt - những yếu tố cốt lõi của môn học. Qua đó, người chấm nhận ra chiều sâu hiểu biết, sự sáng tạo và cá tính người học. Đây cũng là mục tiêu của giáo dục hiện đại: người học không chỉ biết kiến thức mà còn biết tư duy và viết ra những lập luận chắc chắn để giải quyết vấn đề. Tự luận vì thế buộc học sinh phải học thật, đọc, hiểu và viết chắc chắn, có chính kiến.
Tuy nhiên, hạn chế lớn nhất là tính chủ quan. Cùng một bài viết, các giám khảo có thể chấm khác nhau do cách hiểu, mức độ chặt - thoáng và kinh nghiệm. Những bài sáng tạo, lệch chuẩn càng dễ gây chênh lệch. Ngoài ra, việc chấm thi tốn thời gian, áp lực lớn và chịu ảnh hưởng bởi kỹ năng trình bày. Học sinh hiểu bài nhưng diễn đạt kém có thể bị thiệt, trong khi người viết trôi chảy đôi khi được đánh giá cao hơn thực lực. Đây cũng là một trong những nguyên do khiến điểm ngữ văn dễ lệch giữa các địa phương.
Khi phổ điểm không phản ánh phổ năng lực
Về nguyên tắc, một kỳ thi chuẩn hóa phải đảm bảo tính tương đương: học sinh có cùng năng lực phải có cơ hội đạt điểm tương đương, không phụ thuộc vào nơi học, nơi chấm thi.
Vì vậy, trong một kỳ thi, như kỳ thi tốt nghiệp năm 2025, có địa phương (Nghệ An) đạt điểm trung bình toàn tỉnh 8,034 điểm (xếp thứ 1/63) nhưng thành phố Đà Nẵng chỉ đạt 5,58 điểm (xếp thứ 63/63), chênh lệch nhau 2,5 điểm. Đây là vấn đề cần xem xét thấu đáo.
Cần khẳng định sự chênh lệch không phải lúc nào cũng bất thường. Những khác biệt về điều kiện dạy - học, đội ngũ giáo viên hay truyền thống học tập có thể tạo ra khoảng cách nhất định. Tuy nhiên khoảng cách lớn trong một kỳ thi với đề thi chung thì khó có thể chỉ giải thích bằng năng lực thực của học sinh.
Ở đây, có 3 nguyên nhân có thể xảy ra:
- Một là, khác biệt trong cách chấm. Nếu một nơi chấm "chặt", bám sát từng lỗi, còn nơi khác chấm "thoáng", ưu tiên ý tưởng chung, thì điểm số sẽ lệch đáng kể dù đề thi giống nhau.
- Hai là, đáp án và hướng dẫn chấm chưa đủ chuẩn hóa. Khi tiêu chí mở, nhưng thiếu ví dụ cụ thể, mỗi hội đồng chấm có thể hiểu và vận dụng khác nhau.
- Ba là, đề thi chưa đủ phân hóa. Nếu đề quen thuộc, dễ "trúng tủ", học sinh có thể tái hiện bài mẫu, khiến phổ điểm dồn lên cao mà không phản ánh đúng năng lực. Tuy nhiên, đề thi môn ngữ văn năm 2025 là đề thi đánh giá năng lực, ngữ liệu không bám sách giáo khoa nên khó luyện đề, trúng tủ.
Điều quan trọng là chênh lệch điểm không đồng nghĩa với chênh lệch năng lực. Trong nhiều trường hợp, nó phản ánh sự thiếu đồng bộ của hệ thống đánh giá (cách chấm thi) hơn là chất lượng người học.
Biến động thứ hạng bất thường: Dấu hỏi từ khâu chấm thi
Biến động thứ hạng môn ngữ văn giai đoạn 2022 - 2025 cho thấy một thực tế đáng suy nghĩ: sự dao động ở nhiều địa phương vượt xa mức có thể lý giải bằng thay đổi năng lực học sinh. Những trường hợp như Ninh Thuận có thứ hạng các năm là (43 → 5 → 61 → 56), Quảng Trị (58 → 46 → 57 → 15) hay Trà Vinh (56 → 33 → 2 → 6) cho thấy sự "nhảy vọt" rồi "rơi sâu" chỉ trong thời gian rất ngắn. Ngay cả các địa phương vốn có vị trí cao như Ninh Bình (4 → 14 → 1 → 45) hay Bắc Ninh (9 → 7 → 8 → 48) cũng không tránh khỏi những cú tụt hạng mạnh. Nếu chỉ dựa vào năng lực học sinh, vốn mang tính tích lũy và ổn định theo thời gian, thì khó có thể giải thích những biến động hàng chục bậc như vậy.
Kinh nghiệm quốc tế: Không bỏ tự luận mà kiểm soát việc chấm
Các quốc gia có nền giáo dục phát triển không loại bỏ tự luận, mà vẫn coi đây là công cụ đánh giá quan trọng, đồng thời kiểm soát rất chặt chẽ.
- Ở Anh, giám khảo phải chấm thử trên các bài mẫu đã "neo chuẩn" trước khi chấm đại trà; bài thi được phân bổ ngẫu nhiên toàn quốc.
- Tại Mỹ, mỗi bài thường do ít nhất hai người chấm độc lập, nếu lệch lớn sẽ có người thứ ba, kèm theo rubric chi tiết cho từng tiêu chí.
- Pháp tổ chức chấm chéo giữa các vùng và có hội đồng rà soát điểm bất thường; Phần Lan đẩy mạnh số hóa để giám sát toàn bộ quy trình.
Điểm chung của các hệ thống này là không để địa phương tự chấm bài của mình. Bài thi được trộn ngẫu nhiên, người chấm không biết nguồn gốc, qua đó giảm ảnh hưởng của tâm lý "nới tay" hay áp lực thành tích, tránh hình thành "chuẩn riêng".
Bên cạnh đó, rubric được chuẩn hóa đến từng mức điểm. Thay vì mô tả chung, tiêu chí được tách nhỏ: xác định vấn đề, lập luận, dẫn chứng, diễn đạt… Thậm chí có bài mẫu minh họa cho từng thang điểm để giám khảo "so chuẩn", bảo đảm cách hiểu thống nhất.
Đề thi có thể là một yếu tố ảnh hưởng khi thay đổi mức độ mở, độ khó hay cách tiếp cận, nhưng vì đề thi là chung cho cả nước nên khó tạo ra sự đảo chiều thứ hạng mạnh giữa các địa phương. Trong khi đó, đặc thù của chấm tự luận - với độ phụ thuộc lớn vào cảm nhận và độ "chặt - lỏng" của giám khảo - lại có khả năng tạo ra chênh lệch đáng kể về điểm trung bình. Chỉ cần lệch khoảng 0,25 - 0,5 điểm ở quy mô toàn tỉnh cũng đủ làm thay đổi thứ hạng hàng chục bậc.
Cần tăng cường chấm chéo
Từ các bằng chứng trên, có thể rút ra kết luận: biến động thứ hạng môn ngữ văn hiện nay chịu tác động mạnh nhất từ cách thức chấm thi, tiếp đến mới là đề thi, còn năng lực học sinh chỉ đóng vai trò nền tảng dài hạn. Điều này đặt ra yêu cầu cấp thiết phải chuẩn hóa quy trình chấm và tăng cường chấm chéo, nếu muốn thứ hạng thực sự phản ánh đúng chất lượng giáo dục.
Theo đó, mỗi tỉnh, thành phố thành lập 2 - 3 cụm chấm thi tự luận và phân phối bài thi của thí sinh giữa các cụm để giám khảo không chấm bài của học sinh trường mình.
Ngoài ra, cần chuẩn hóa rubric (mô tả chi tiết có tính hệ thống) theo hướng tiêu chí hóa rõ ràng. Đáp án không chỉ mô tả ý mà cần chuyển thành hệ tiêu chí cụ thể như nội dung, lập luận, dẫn chứng, diễn đạt… Mỗi mức điểm kèm ví dụ minh họa, giúp giám khảo ở các nơi có thể "chấm giống nhau" hơn.
Kết hợp chấm hai vòng độc lập với số hóa quy trình chấm. Mỗi bài thi có ít nhất 2 giám khảo chấm độc lập; nếu lệch vượt ngưỡng phải chấm lần ba. Đồng thời, đẩy mạnh chấm chung một số bài toàn tỉnh nhất định để đảm bảo cách thức chấm thi giống nhau giữa các cụm chấm thi và trên phạm vi toàn quốc.
Bắt buộc phân tích phổ điểm sau thi gắn với hậu kiểm. Những địa phương có phổ điểm bất thường cần được rà soát, thậm chí chấm lại một phần bài thi, nhằm hiệu chỉnh và đảm bảo công bằng cho toàn hệ thống.
Cuối cùng, cải tiến đề thi theo hướng tăng phân hóa. Đề cần buộc học sinh phải tư duy thực, hạn chế học thuộc mẫu. Khi đề tốt, việc chấm cũng trở nên rõ ràng và công bằng hơn.



