Đại học Bách khoa Hà Nội công bố phương pháp chấm điểm bài thi Đánh giá tư duy TSA

Đại học Bách khoa Hà Nội áp dụng phương pháp chấm điểm hiện đại cho bài thi Đánh giá tư duy TSA

Ngày 25/3, Đại học Bách khoa Hà Nội đã chính thức thông tin về phương pháp chấm điểm bài thi Đánh giá tư duy TSA dành cho thí sinh. Đây là một bước tiến quan trọng trong việc nâng cao độ chính xác và công bằng trong công tác tuyển sinh đại học.

Mục tiêu và bối cảnh ra đời của bài thi TSA

Từ năm 2020, Đại học Bách khoa Hà Nội đã tiến hành nghiên cứu, thiết kế và triển khai tổ chức Kỳ thi Đánh giá tư duy (TSA - Thinking Skills Assessment) nhằm mở rộng các phương thức tuyển sinh. Mục tiêu chính của bài thi là đánh giá năng lực tư duy tổng quát của thí sinh, được thể hiện qua ba nội dung chính: tư duy toán học, tư duy đọc hiểu và tư duy khoa học/giải quyết vấn đề. Bài thi này giúp lựa chọn những sinh viên có khả năng học tập tốt nhất tại môi trường giáo dục đại học, đặc biệt trong các lĩnh vực như khoa học kỹ thuật, công nghệ, kinh tế, tài chính, ngân hàng, thương mại. Đồng thời, TSA tiệm cận với các kỳ thi đánh giá tư duy hiện đại trên thế giới, chẳng hạn như SAT hay ACT.

Hạn chế của phương pháp chấm điểm thô truyền thống

Theo Đại học Bách khoa Hà Nội, hầu hết các kỳ thi quan trọng hiện nay vẫn đang sử dụng điểm thô để làm kết quả đánh giá cuối cùng. Điểm thô là tổng điểm của các câu hỏi trong đề thi, dựa trên lý thuyết trắc nghiệm cổ điển. Ví dụ, nếu một đề kiểm tra có 100 câu hỏi và mỗi câu trả lời đúng đạt 1 điểm, thí sinh làm đúng 70 câu sẽ được 70 điểm.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Tuy nhiên, Phó Giáo sư, Tiến sĩ Vũ Duy Hải, Trưởng ban Tuyển sinh-Hướng nghiệp Đại học Bách khoa Hà Nội cho biết: "Một trong những nhược điểm của việc sử dụng điểm thô là khó phân biệt được khả năng của các thí sinh có cùng điểm thô khi làm cùng một đề thi ở cùng một thời điểm. Ngoài ra, khi tính điểm năng lực bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó khác nhau ở cùng một thời điểm."

Thực tế, trong một đợt thi, các thí sinh làm đúng 70 câu hỏi bất kỳ sẽ có cùng điểm thô là 70 điểm, nhưng họ có thể trả lời đúng tập hợp các câu hỏi khác nhau với độ khó khác nhau. Do đó, 70 điểm không phản ánh đúng năng lực thực sự của từng thí sinh.

Giải pháp với mô hình lý thuyết ứng đáp câu hỏi IRT

Để khắc phục những hạn chế này, Đại học Bách khoa Hà Nội đang triển khai áp dụng mô hình lý thuyết ứng đáp câu hỏi IRT (Item Response Theory) - một lý thuyết đo lường hiện đại được sử dụng rộng rãi trong các kỳ thi quan trọng trên thế giới, đặc biệt trong công tác tuyển sinh. Mô hình này giúp ước lượng năng lực của thí sinh một cách chính xác và tin cậy hơn.

Mô hình IRT dựa trên giả thuyết rằng mỗi thí sinh có một mức năng lực nhất định, và thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kỳ cao hơn so với thí sinh có năng lực thấp. Dựa vào đó, có thể định lượng được các tham số về độ khó và độ phân biệt của câu hỏi, cũng như năng lực của thí sinh. Các yếu tố này độc lập với nhau, nghĩa là tham số là đặc trưng của câu hỏi, không phụ thuộc vào mẫu thí sinh, và ngược lại, năng lực của thí sinh là bất biến đối với các câu hỏi mà họ trả lời.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Đại học Bách khoa Hà Nội đang áp dụng mô hình IRT 2 tham số (độ khó và độ phân biệt) trong việc chấm điểm bài thi TSA. Hiểu một cách đơn giản, với phương pháp này, thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao, và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp. Điều này dẫn đến việc các thí sinh có thể có điểm thô giống nhau nhưng sẽ đạt được điểm TSA khác nhau, phản ánh chính xác hơn năng lực thực tế.

Quy trình 4 bước chấm điểm IRT hai tham số trong TSA

Để đảm bảo tính chính xác và công bằng giữa các đợt thi khác nhau, thuật toán chấm điểm theo mô hình IRT 2 tham số được thực hiện qua bốn bước chi tiết:

Ước lượng tham số câu hỏi: Căn cứ theo kết quả làm bài của toàn bộ thí sinh trong từng kíp thi, phần mềm chấm thi sẽ ước lượng độ khó và độ phân biệt của từng câu hỏi trong đề thi hiện tại.
Ước lượng điểm năng lực thí sinh: Phần mềm chấm thi thực hiện ước lượng điểm năng lực tư duy của từng thí sinh dựa trên kết quả làm bài thi và thang đo của đề thi hiện tại.
Quy đổi về thang tham chiếu chung: Phần mềm chấm thi thực hiện quy đổi thang đo của đề thi hiện tại về thang tham chiếu chung với các đợt thi trước, đưa điểm năng lực tư duy của thí sinh về cùng một thang đo để đảm bảo công bằng.
Quy đổi sang điểm TSA: Phần mềm chấm thi thực hiện quy đổi điểm năng lực tư duy của thí sinh đã tham chiếu sang thang điểm TSA cuối cùng.

Với quy trình này, điểm TSA không được tính bằng cách cộng điểm của từng câu hỏi, mà là kết quả của quá trình ước lượng năng lực tư duy từ toàn bộ bài thi của thí sinh. Nếu thí sinh làm đúng nhiều câu hỏi ở dải khó và có độ phân biệt cao, điểm năng lực tư duy được ước lượng sẽ cao và điểm TSA cũng sẽ cao. Ngược lại, nếu thí sinh chủ yếu làm đúng các câu dễ và trung bình, điểm TSA sẽ thấp.

Bên cạnh đó, phương pháp chấm này đảm bảo rằng điểm TSA không phải là điểm thô bị cộng thêm hoặc trừ bớt, và cũng không phụ thuộc vào điểm số của thí sinh đạt mức cao nhất trong đợt thi, từ đó tăng cường tính minh bạch và công bằng trong đánh giá.