Lời cảm ơn
Với lòng biết ơn sâu sắc em xin chân thành cảm ơn GS.TSKH. LÂM QUANG THIệp đã tận tình giúp đỡ và chỉ bảo em trong quá trình làm khoá luận. Em xin được gửi lời cảm ơn đến trường PTTH Hai Bà Trưng Hà Nội, cô giáo Vũ Thị Liên, tập thể lớp 11E1, 11G1, 11H2; công ty EDTECH, anh Lâm Quang Minh cùng toàn thể các thầy cô giáo trong khoa và các bạn đã động viên và giúp đỡ em để em hoàn thành khoá luận của mình.
Em xin gửi lời chúc sức khoẻ – thành đạt – hạnh phúc tới thầy cô và các bạn cù
60 trang |
Chia sẻ: huyen82 | Lượt xem: 1466 | Lượt tải: 1
Tóm tắt tài liệu Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ng các em học sinh.
Sinh viên: Hoàng thị lý
Kí hiệu
TN : Trắc nghiệm
TNKQ: Trắc nghiệm khách quan
TL : Tự luận
GD : Giáo dục
TS : Thí sinh
HS : Học sinh
GV : Giáo viên
TL : Trả lời
CH : Câu hỏi
MCQ : Câu hỏi nhiều lựa chọn
Mở ĐầU
1. Lí do chọn đề tài
1.1 . Từ thực tiễn
Trong các lĩnh vực của đời sống khi so sánh một số lĩnh vực nào đó với nhau người ta thường đưa ra những con số những loại thang đo để thuyết phục người khác. Giống như khi so sánh sự phát triển của hai quốc gia, người ta đưa ra những con số về GDP, GNP, bình quân đầu người trên một năm…. Hay khi ta muốn biết hai thành phố cách nhau bao nhiêu thì ta biểu thị khoảng cách giữa hai thành phố đó bằng kilomet . Vì vậy ai cũng hiểu được và có thể so sánh chúng với nhau và với các đối tượng khác. Thế nhưng trong lĩnh vực đo lường tâm lí và giáo dục thì chúng ta chưa có một phép đo lường và một loại thang đo nào được toàn thể mọi người chấp nhận. Chúng ta chỉ biết đánh giá năng lực của học sinh và mức độ đạt được mục tiêu của người dạy qua bài kiểm tra của học sinh và qua sự ước lượng của chính bản thân GV mà thôi. Nếu như thế thì liệu có chính xác và tin cậy không?! Và đặc biệt khi ngày nay KHKT càng ngày càng phát triển thế giới đang theo xu hướng nhanh, mạnh, chính xác và hiệu quả. Ngành GD đóng vai trò chủ đạo đối với sự phát triển của một nước thì không có lí do gì lại không ứng dụng những thành tựu của KHKT để tự hoàn thiện mình đảm bảo với sự đi lên của xã hội. Chính vì thế khoa học về đánh giá và đo lường đã và đang phát triển. Một trong những ứng dụng rộng rãi của nó là đo lường bằng phương pháp TNKQ. Trên thế giới, các nước phát triển đã sử dụng hệ thống câu hỏi TNKQ để đo lường và đánh giá kết quả học tập của học sinh một cách chính xác và hiệu quả, từ đó hướng nghiệp cho học sinh ngay từ khi các em học xong PTTH. Nhưng khoa học về đánh giá và đo lường của nước ta thì lại rất kém phát triển so với thế giới. Làm sao để chúng ta có thể đo lường được kết quả học tập một cách chính xác nhất và khoa học nhất?
1.2. Lí luận
Trong phạm trù giáo dục có một động từ quan trọng nhất, có lẽ mọi người cũng dễ nhất trí, đó là học. Gắn với việc học và hỗ trợ cho việc học là hoạt động DạY. Giữa dạy và học có nhiều mối tương tác, nhưng chắc rằng mối tương tác quan trọng nhất là đánh giá (5, tr1).
Bất kỳ một quá trình giáo dục nào mà một con người tham gia cũng nhằm tạo ra những biến đổi nhất định trong con người đó. Muốn biết những biến đổi đó xảy ra ở mức độ nào phải đánh giá hành vi của người đó trong một tình huống nhất định. Sự đánh gía cho phép chúng ta xác định, một là mục tiêu giáo dục được đặt ra có phù hợp hay không và có đạt được hay không, hai là việc giảng dạy có thành công hay không, người học có tiến bộ hay không. Đánh giá có thể thực hiện đầu quá trình giảng dạy để giúp tìm hiểu và chẩn đoán về đối tượng giảng dạy, có thể triển khai trong tiến trình dạy và học để tạo thông tin phản hồi giúp điều chỉnh quá trình dạy và học, cũng có thể thực hiện lúc kết thúc để tổng kết. Như vậy, sự đánh giá phải được xem là một bộ phận quan trọng và hợp thành một thể thống nhất của quá trình GD - ĐT. Không có đánh giá thì không thể biết việc học và việc dạy xảy ra như thế nào, thậm chí có thực sự xảy ra hay không, dù rằng bề ngoài có thể vẫn có các hình thức tổ chức dường như là để dạy và học.
Phương thức TNKQ là một phương pháp đo lường và đánh giá có nhiều ưu điểm đang được ứng dụng rộng rãi. Phương pháp này đã và đang đáp ứng được yêu cầu của khoa học đánh giá và đo lường trong giáo dục. Đó là một phương pháp tương đối khách quan, không phụ thuộc vào người chấm bài, nó bao phủ được hầu hết nội dung môn học, hạn chế được may rủi quay cóp bài, thích hợp với kì thi đại trà, ứng dụng được KHKT…phương pháp này cũng khắc phục được nhiều nhược điểm của phương pháp tự luận.
Xuất phát từ các lí do trên nên em đã chọn đề tài này để tìm hiểu sâu về môn khoa học này và ứng dụng vào sự nghiệp giảng dạy của mình sau này.
2. Mục đích
Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11.
3. Đối tượng và khách thể
3.1. Đối tượng
Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11.
3.2. Khách thể
Học sinh lớp 11 ( Gián tiếp: đối tượng khảo sát).
Chương trình môn hoá lớp 11. ( trực tiếp).
4. Giả thuyết khoa học
Từ sự nghiên cứu đề tài này sẽ cho ta bộ câu trắc nghiệm khách quan chất lượng và chiếm ưu thế cao hơn so với câu hỏi tự luận trong việc đánh giá năng lực về môn Hoá của học sinh lớp 11.
5. Nhiệm vụ:
5.1. Nghiên cứu lý luận
Lý luận về TNKQ.
Nghiên cứu chương trình hoá lớp 11.
Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11.
5.2. Nghiên cứu thực tiễn khảo sát và đánh giá
Bộ câu hỏi xây dựng sẽ đưa ra để khảo sát học sinh lớp 11 đphân tích kết quả đ Đánh giá chất lượng câu hỏi đ Sửa đổi đ Khảo sát đ Sửa đổi đBộ câu hỏi tốt nhất có thể.
6. Giới hạn phạm vi nghiên cứu của đề tài
Đối tượng: câu hỏi trắc nghiệm khách quan về môn hoá học lớp 11-phần hữu cơ.
Địa bàn nghiên cứu: Một số trường trên địa bàn Hà Nội.
Khách thể nghiên cứu: Một số học sinh lớp 11.
7. Phương pháp nghiên cứu
Phương pháp lí luận.
Phương pháp trắc nghiệm.
Phương pháp thống kê.
Phương pháp phỏng vấn.
8. Kết quả dự kiến đề tài
Một bộ câu hỏi trắc nghiệm khách quan về môn hoá học lớp 11.
9. Cấu trúc chương trình
Mở đầu: 4 trang.
Chương 1: 43 trang.
Chương 2: 7 trang.
Chương 3: 5 trang.
10. Kế hoạch nghiên cứu
02/02á14/03: Nghiên cứu lí luận và Xây dựng bộ câu trắc nghiệm khách quan.
15/03 á15/05: Khảo sát trên học sinh (Trắc nghiệm thử).
16/05 á 24/05: Phân tích kết quảđ Sửa.
Chương 1: CƠ Sở Lí LUậN
1.1 lịch sử những phép đo lường và trắc nghiệm
1.1.1 Trên thế giới
Các phương pháp khoa học đầu tiên bắt nguồn từ khoa vật lí vào thế kỉ 17&18 rồi lan dần vào các ngành động vật học. Năm 1879, phòng thí nghiệm tâm lí đầu tiên được Wichelm Weent thiết lập tại Leipzig. Trước tiên, các nhà tâm lí học chú trọng đến các phép đo liên quan đến thị giác, thính giác, tốc độ học tập… Cũng trong thời kì ấy, các thí nghiệm sinh học của Darwin và Francis Galton được đề cập và áp dụng thì Calpearson và độ đệ ở Anh đã tìm ra những kĩ thuật thống kê, giúp cho việc khảo sát và phân tích các điểm cá biệt giữa những người khác nhau được dễ dàng hơn. Trong khi đó ở Pháp Alfred Binet và các bạn đồng sự đã phát minh ra bài trắc nghiệm để khảo sát tâm linh, sau này trở thành bài trắc nghiệm trí thông minh. Bài trắc nghiệm này đã giúp các nhà giáo dục phân biệt được trẻ trì độn với trẻ lười biếng một cách hữu hiệu hơn bất kì phương pháp nào khác.
Vào lúc thế chiến thứ hai, các bài trắc nghiệm kĩ năng kĩ xảo cá biệt được đặt ra để tuyển chọn, phân loại binh sĩ cũng như phỏng đoán khả năng chữa bệnh tâm lí, làm cho nhu cầu TN ngày càng cao. Sau các loại TN thông minh, kĩ xảo, các TN về khả năng, sở thích, nhân cách… đã không ngừng được phát triển và áp dụng một cách rộng rãi trong những năm qua.
Cùng với sự phát triển của khoa học đo lường và TN, ngành giáo dục đã nhanh chóng ứng dụng thành quả của khoa học này. Nhưng một khoa học đo lường trong giáo dục thật sự có thể xem như bắt đầu cách đây chỉ khoảng một thế kỉ (Thorndike 1904). ở châu Âu và đặc biệt là Mĩ lĩnh vực khoa học này phát triển mạnh vào thời kì từ trước và sau thế chiến thứ hai, với những đầu mốc quan trọng như: TN trí tuệ Stanford-Binet xuất bản năm 1916, bộ TN thành quả học tập đầu tiên Standford Achievement Test ra đời vào năm 1923. Với việc đưa vào chấm trắc nghiệm bằng máy của IBM năm 1935 , việc thành lập National Council on Measuament in Education (NCME) vào thập niên 1950 và ra đời Education Testing Services (ETS) năm 1947. Một ngành công nghiệp đã hình thành ở Mĩ. Tại Hoa Kì khoa học về đo lường và đánh giá trong giáo dục đã phát triển mạnh mẽ từ giáo dục phổ thông-đại học và sau đại học. Tính đến nay khoa học về đo lường trong tâm lí và giáo dục đã phát triển liên tục, những phê bình chỉ trích đối với khoa học này cũng xuất hiện thường xuyên nhưng cũng không đánh đổ được nó mà chỉ làm cho nó tự điều chỉnh và phát triển mạnh mẽ hơn. Ước tính ở Mĩ hiện nay số lượt TN tiêu chuẩn hoá ở 1/4 tỉ và TN do giáo viên soạn lên đến 5 tỉ trên 1 năm. Khi ngành công nghệ TN phát triển đồ sộ thì ngành CNTT cũng phát triển rầm rộ tạo điều kiện để phát triển nhanh hơn nữa lí thuyết đo lường, nâng cao độ chính xác của câu trắc nghiệm, tự động hoá các công việc soạn thảo đề thi và chấm bài , phân tích kết quả.
Sự phát triển của KH đo lường và đánh giá không chỉ dừng lại ở Hoa Kì, châu Âu mà ở các nước châu á cũng rất phát triển. Nhật Bản, Thái Lan, Trung Quốc… cũng đã có một cơ sở vững chắc về lĩnh vực này. Tại Nhật Bản kì thi “Trắc nghiệm trung tâm Quốc Gia tuyển sinh Đại Học” ( National Center Test for University Admission) duy trì từ năm 1990 đến nay, với hình thức đề thi được soạn thảo hoàn toàn theo phương thức TNKQ. Các tổ chức JHEE (Join High Education Entrance Examination) và NEEA (National Education Examination Authority). Tại Thái Lan và Trung Quốc đã tổ chức các kì thi tuyển Đại Học chủ yếu bằng TNKQ.
Như vậy ta thấy rõ, Khoa học về Đo lường và TNKQ mới ra đời nhưng nó đã nhanh chóng khẳng định ưu thế và xác định vị trí của mình trong lĩnh vực giáo dục và dần được ứng dụng rộng rãi cho mọi lĩnh vực của xã hội.
1.1.2. ở nước ta
Khác với các nước phát triển, khi khoa học về đo lường và TN ra đời đã nhanh chóng ứng dụng trên mọi lĩnh vực của cuộc sống - đặc biệt là lĩnh vực giáo dục, thì ở nước ta gần như “thờ ơ” với sự xuất hiện của lĩnh vực khoa học này. Cách đây khoảng 10 năm khi các nước phát triển đã sử dụng TNKQ cho các kì thi tuyển thì ở Việt Nam chỉ có GS.Dương Thiệu Tống là người có bằng Ed.D của Mĩ về lĩnh vực này, còn lại các cơ sở GD & SP không có người nào chuyên sâu về đo lường trong GD. Chính vì vậy các tài liệu về lĩnh vực này gần như không có.
Trước tình hình đó Bộ Giáo Dục đã dần đưa ngành GD tiếp xúc với khoa học này: mời chuyên gia từ nước ngoài sang tổ chức hội thảo, dịch sách, cử một số giáo chức đại học đi học ở nước ngoài. Và cho đến nay các trường Đại Học nước ta có khoảng hơn 10 người có bằng Ph.D hoặc Master về lĩnh vực liên quan. Đến tháng 7/ 1996 kì thi tuyển Đại Học thí điểm tại trường ĐH Đà Lạt bằng phương pháp TNKQ đã có những thành công nhất định.
Từ năm 1997 đến nay hoạt động đổi mới phương pháp đo lường & đánh giá trong giáo dục ở các trường ĐH lắng xuống. Cho đến mùa tuyển sinh ĐH năm 2002 lại rộ lên. Hiện nay, BGD & ĐT đã thành lập “Cục khảo thí & Kiểm định chất lượng” để cải tiến việc thi cử và đánh giá chất lượng các trường ĐH, quyết định sẽ dùng phương pháp TNKQ để làm đề thi tuyển ĐH vào mùa thi 2005. Trong khi nước ta vẫn còn nhiều ý kiến trong việc áp dụng kiểu ra đề nào cho các kì thi tuyển ĐH? Thì tại Hoa Kì dựa vào kết quả của kì thi tuyển ĐH hoàn toàn bằng TNKQ đã giúp cho thí sinh định hướng ngay nghề nghiệp cho mình. Đó là vấn đề rất quan trọng đối với sự phát triển của đất nước. Nhưng trong bước đường phát triển của bất kì một ngành KH nào cũng đều gặp những chông gai nhất định, khi vượt được qua trở ngại đó thì nó càng toả sáng hơn.
1.2. Các khái niệm
1.2.1. Trắc nghiệm là gì?
1.2.1.1. Khái niệm
Giáo dục là một quá trình tác động lên con người nhằm tạo ra những biến đổi nhất đinh trong đối tượng đó. Muốn biết những biến đổi đó xảy ra ở mức độ nào ta phải đo lường và đánh giá hành vi của đối tượng trong một tình huống nhất định. Qua sự đánh giá cho chúng ta xác định những vấn đề sau: Mục tiêu giáo dục được đặt ra có phù hợp không và có đạt được không? Việc giảng dạy có thành công hay không, người học có tiến bộ không? Như vậy chúng ta hiểu đo lường và đánh giá là gì?
Đo lường là một cách lượng giá, là việc gán những con số hoặc thứ bậc theo một hệ thống quy tắc nào đó (5, tr 2).
Lượng giá bao gồm các việc phán xét TS theo các hệ thống quy tắc hoặc tiêu chuẩn xác định. Nếu thực hiện đầu quá trình giảng dạy sẽ giúp tìm hiểu và chẩn đoán về đối tượng giảng dạy. Nếu thực hiện trong quá trình giảng dạy để tạo những thông tin phản hồi giúp điều chỉnh quá trình dạy và học. Cũng có thể thực hiện cuối quá trình để tổng kết.
Đánh giá là việc nhận định sự xứng đáng của một đối tượng nào đó (trích theo 3, tr 16). Lượng gía năng lực hoặc thành quả học tập của người học thường là các thành tố lượng giá trong giáo dục. Đánh giá có thể là định lượng dựa vào các con số hoặc định tính dựa vào các ý kiến và giá trị.
Trắc nghiệm theo nghĩa rộng là một phép lượng giá cụ thể mức độ khả năng thể hiện hành vi trong lĩnh vực nào đó của một người cụ thể. Trong giáo dục, trắc nghiệm là một loại dụng cụ đo lường khả năng của người học. Dựa vào trắc nghiệm cho biết được thành tích của cá nhân như thế nào? So sánh với những người khác hay so với một lĩnh vực các nhiệm vụ học tập được dự kiến.Thường có hai dạng thức trắc nghiệm: một là trắc nghiệm thành quả (đo lường mức độ học được sau một thời kì giảng dạy); hai là TN năng khiếu hay năng lực (đánh giá năng khiếu hay năng lực hiện có của một đối tượng bất kể chúng được hình thành bằng cách nào).
1.2.1.2. Phân lọai các phương pháp TN
Có nhiều cách phân loại tuỳ theo từng hình thức TN. Sau đây ta sẽ đưa ra một số phương pháp TN:
1.2.1.2.1. Về cách thức thực hiện TN (trích 4, tr 7)
Các phương pháp trắc nghiệm
Quan sát
Viết
Vấn đáp
Trắc nghiệm khách quan
(Objective tests)
Trắc nghiệm tự luận
(Essay tests)
Tiểu luận
Cung cấp thông tin
Ghép đôi
Điền khuyết
Trả lời ngắn
Đúng sai
Nhiều lựa chọn
H.1. Phân loại các phương pháp trắc nghiệm
Bao gồm ba loại lớn:
a). Loại quan sát: Giúp đánh giá các thao tác, hành vi, phản ứng vô thức, các kĩ năng thực hành và cả một số kĩ năng về nhận thức, chẳng hạn cách giải quyết vấn đề trong một tình huống nào đó đang được nghiên cứu.
b). Loại vấn đáp: Có tác dụng tốt để đánh giá khả năng đáp ứng các câu hỏi được nêu một cách tự phát trong một tình huống cần kiểm tra, cũng thường được sử dụng khi sự tương tác giữa người hỏi và người đối thoại…
c). Loại viết: thường được sử dụng nhiều nhất vì:
Trong cùng một thời gian mà kiểm tra được nhiều thí sinh.
Thí sinh được cân nhắc nhiều hơn khi trả lời.
Có thể kiểm tra sự phát triển tư duy ở mức độ cao.
Cung cấp một bản ghi rõ ràng các câu trả lời để nghiên cứu kĩ khi chấm bài.
Dễ quản lí hơn vì người chấm không tham gia trực tiếp vào bối cảnh kiểm tra.
Qua bản trả lời của thí sinh ta có thể dùng để phân tích câu hỏi và khả năng dạy của người giáo viên
Trong TN nghiệm viết lại được chia ra làm hai loại sau:
Trắc nghiệm tự luận: Các câu hỏi buộc phải trả lời theo dạng mở, TS phải tự trình bày ý kiến trong một bài viết để giải quyết vấn đề mà câu hỏi đưa ra.
Trắc nghiệm khách quan: Đề thi thường bao gồm rất nhiều câu hỏi ,mỗi câu nêu lên vấn đề và những thông tin cần thiết để TS có thể trả lời từng câu một cách ngắn gọn.
1.2.1.2.2. Về cách chuẩn bị đề TN
Bao gồm hai loại.
a). TN tiêu chuẩn hoá: Thường do các chuyên gia TN soạn thảo, thử nghiệm tu chỉnh. Vì thế các câu TN ở đây đã có sẵn một độ khó và độ phân biệt riêng phản ánh nội dung và mức độ kĩ năng nào, mỗi đề thi TN có một độ tin cậy xác định.
b). TN dùng ở lớp học: do giáo viên tự soạn để sử dụng trong quá trình giảng dạy có thể chưa được thử nghiệm và tu chỉnh công phu, thường chỉ sử dụng trong các kì kiểm tra với số lượng học sinh không lớn và không thực sự quan trọng 1.2.1.2.3. Về thời gian làm bài
a). TN theo tốc độ: Hạn chế thời gian, chỉ một ít thí sinh làm nhanh mới có thể làm hết số câu của bài TN, nhằm đánh giá khả năng làm nhanh của thí sinh.
b). TN không theo tốc độ: thường cung cấp đủ thời gian cho phần lớn TS
1.2.1.2.4. Về phương hướng sử dụng kết quả trắc nghiệm
Gồm hai loại.
a).TN theo chuẩn: là TN được soạn nhằm cung cấp một số đo lường thành tích mà người ta có thể giải thích được căn cứ trên vị thế tương đối của một cá nhân so với một nhóm người nào đó đã được biết.
b) TN theo tiêu chí: là TN được xác định nhằm cho phép giải thích thành tích của người được khảo sát liên quan đến một tập hợp các khái niệm đã được xây dựng rõ ràng (3, tr 20).
1.2.2. Trắc nghiệm khách quan là gì?
1.2.2.1. Khái niệm
Trắc nghiệm khách quan là một phương pháp trắc nghiệm mà đề thi gồm có nhiều câu hỏi, ở mỗi câu đều nêu lên vấn đề và những thông tin cần thiết giúp thí sinh trả lời một cách ngắn gọn nhất.
1.2.2.2. Phép so sánh giữa TNKQ và TL
Ngày nay khi hầu hết GV đang sử dụng phương pháp TL là công cụ đắc lực cho việc đánh giá năng lực của thí sinh, thì phương pháp TNKQ được coi là phương pháp có nhiều nhược điểm và hạn chế. Nhưng đứng trên quan điểm của những nhà khoa học hãy xem xét lại ưu nhược điểm của từng phương pháp.
Trước tiên tại sao ta lại có khái niệm phương pháp TNKQ? Câu trả lời nằm trong chính tên của phương pháp. Bài TN được coi là khách quan vì việc cho điểm là khách quan. Nếu một bài thi tự luận thì điểm số của bài thi còn phụ thuộc vào sự chủ quan của người chấm. Chính vì thế mới có sự chênh lệch điểm văn thi ĐH là hai điểm thì không được sửa điểm khi phúc tra bài. Ngược lại bài TNKQ điểm số phụ thuộc hoàn toàn vào phương án lựa chọn của TS và chỉ có một phương án duy nhất. Kết quả sẽ được chấm điểm như nhau không phụ thuộc vào người chấm.
Số câu hỏi trong bài TL luôn ít hơn số câu hỏi trong bài TNKQ nhưng việc chấm bài thi vẫn ít tốn công chấm thi hơn bài TL. Cách trả lời bài thi TNKQ đơn giản hơn nên cũng không đánh giá được khả năng diễn đạt đặc biệt là tư duy hình tượng của TS. Song song với việc ít tốn công chấm bài thi thì TNKQ rất tốn công làm đề thi. Để có một đề thi công phu hoàn hảo chúng ta phải đầu tư khá tốn kém. Nhưng GD là quốc sách hàng đầu nên để có chất lượng GD thực sự hiệu quả thì phải có sự đầu tư chính đáng.
Nếu như bài TL có số câu hỏi ít hơn thì nội dung thi sẽ không thể phủ kín nội dung môn học nó chỉ đề cập đến một chủ đề nào đó. Ngược lại bài thi TNKQ số câu nhiều và được chia nhỏ nên đã phủ kín hoàn toàn nội dung môn học. Chỉ trong một khoảng thời gian ngắn với TNKQ ta có thể kiểm tra được một lượng kiến thức rất lớn liên quan đến toàn bộ môn học. Đặc biệt là ngày nay GD đang hướng đến chất lượng toàn diện thì TNKQ có phải là một công cụ hữu hiệu?! Với TL khi kiểm tra theo chủ đề thì tuỳ từng lĩnh vực, có người giỏi lĩnh vực này người giỏi lĩnh vực khác chưa chắc ai tài hơn ai. Như vậy có nên kết hợp giữa hai phương pháp này trong việc kiểm tra năng lực của TS tuỳ mục đích sử dụng năng lực đó.
Một lí do nữa mà mọi người thường quan niệm sai lầm về TNKQ là: TNKQ dễ đem lại may rủi cho TS. Nếu chúng ta cho rằng một anh chàng nếu không biết gì mà làm bài TNKQ và anh ta tích bừa thì vẫn có khả năng đúng và có thể anh ta đạt tiêu chuẩn thì hoàn toàn sai lầm. Với một đề thi TL TS rất dễ gặp may rủi do trúng tủ trật tủ vì đó có phải là lĩnh vực của mình hay không? Còn với đề thi TNKQ thì sự may rủi hoàn toàn không xảy ra bởi đề thi đã phủ kín chương trình học. Nếu học sinh nắm vững nội dung môn học thì sẽ làm đúng phần lớn các câu trắc nghiệm và TS mà không nắm vững một vài chi tiết của môn học thì số ít câu không làm được cũng không ảnh hưởng lớn đến kết quả bài thi. Ngược lại đề thi TL ngoài những TS học chắc thật sự và những thí sinh trúng tủ là điểm khá còn lại những TS trật tủ là bị đánh hạng hết bất kể phần lớn nội dung môn học đó TS có học tốt đi chăng nữa.Vậy số đỏ sẽ đến với anh chàng không biết gì và đánh dấu bừa?! TNKQ là một phương pháp được dựa trên lí thuyết thống kê nên đó là một phương pháp hết sức khoa học – nó tuân theo luật số lớn: “Khi tăng phép thử lên thì tần suất tiến dần đến xác suất”. VD: một thí sinh làm bài thi gồm 100 câu hỏi nhiều lựa chọn, với 5 phương án trả lời, nếu thí sinh đánh dấu hú hoạ vào các phương án trả lời, xác suất để anh ta làm đúng là 20% do đó tần suất làm đúng của anh ấy sẽ gần với xác suất, có nghĩa là: bằng cách đánh dấu hú hoạ số câu anh ta “làm đúng” chỉ chiếm trên dưới 20/100 câu hỏi. Với cách chấm điểm của TNKQ thì thành tích mà anh ta đạt được bằng cách đánh dấu hú hoạ như trên là lân cận điểm không.
Ngày nay, khi khoa học kĩ thuật ngày càng phát triển thì TNKQ đã kịp thời ứng dụng thành quả KH để tăng thêm vai trò của mình. “Lí thuyết ứng đáp câu hỏi”, và tin học, công nghệ là các phương tiện để đánh giá từng câu hỏi và đề thi TNKQ, giúp chọn các mẫu thử nghiệm hợp lí để nâng cao chất lượng và độ tin cậy của đề thi, cũng tạo điều kiện cho phép nhiều người có thể đóng góp trong một thời gian dài để chuẩn bị cho một đề thi TNKQ có chất lượng cao, vừa giữ an toàn và bí mật cho đề thi. ứng dụng của KHKT giúp TNKQ hạn chế được nạn quay cóp, gian lận trong quá trình thi. Khi nội dung bao phủ rộng TS sẽ không đủ thời gian để mở tài liệu. Với các phần mềm vi tính sẽ cho ta một sự sắp xếp đảo đề kĩ thuật. Điều này khiến cho những học sinh ở gần nhau không thể nhìn bài nhau.
Như vậy với tiến bộ của KH đã giúp cho phương pháp TNKQ khắc phục được những điểm yếu của mình đồng thời nó còn đẩy mạnh ưu thế của phương pháp này càng khách quan hơn trong chấm thi. Sử dụng máy để chấm điểm chúng ta có thể chấm hàng loạt, rất nhanh gọn và chính xác. ứng dụng được KHKT tiên tiến vào giảng dạy là tốt song không nên quá lạm dụng vào nó.
Khi đề cập đến phương pháp này, có những ý kiến cho rằng TNKQ không đánh giá được khả năng tư duy ở mức độ cao của học sinh và đối với các môn khoa học xã hội thì không làm được TNKQ. Thật ra, thực tế đã chứng minh rằng chúng ta hoàn toàn có thể viết câu hỏi TNKQ để đánh giá tất cả 6 mức nhận thức (Nhớ – Hiểu - áp dụng – phân tích – tổng hợp - đánh giá). Nếu một đề TL tồi cũng chỉ đo được khả năng ghi nhớ của học sinh. Dù là lĩnh vực nào TN hay XH đều có thể xây dựng bộ câu hỏi TNKQ hoàn hảo, nhưng đối với mỗi loại môn học cách viết câu hỏi có cái khó riêng, sắc thái riêng. Vậy vấn đề đặt ra ở đây là chất lượng đề thi ra sao chứ không phải phương pháp ra đề. Qua chất lượng bài kiểm tra bằng TNKQ chúng ta không những đo được năng lực của học sinh mà ta còn đo được khả năng của người dạy cũng như người ra đề. Năng lực của người ra đề thể hiện trong chất lượng câu hỏi. Để có được bộ câu hỏi TN tốt đòi hỏi sự thuần thục trong kĩ năng viết câu hỏi.
Ưu điểm
TN
TL
1. Khách quan trong chấm thi
Ú
2. ít tốn công chấm thi
Ú
3. ít may rủi do trúng tủ, trật tủ
Ú
4. Đề thi phủ kín nội dung môn học
Ú
5. Đánh giá được khả năng diễn đạt, sáng tạo khi trả lời
Ú
6. ít tốn công ra đề thi
Ú
7. áp dụng được công nghệ mới trong việc nâng cao chất lượng đề thi, giữ bí mật đề thi, hạn chế quay cóp khi thi, hạn chế tiêu cực trong chấm thi và giúp phân kết quả thi.
Ú
8. Đỡ tốn kém
Ú
H.2. Bảng so sánh giữa trắc nghiệm khách quan và tự luận
Qua những tìm hiểu ở trên cho ta thấy cả hai phương pháp TNKQ và TL đều là những phương pháp hữu hiệu để đánh giá kết quả học tập. Cần nắm vững bản chất từng phương pháp và công nghệ triển khai cụ thể để có thể sử dụng mỗi phương pháp đúng lúc đúng chỗ nhằm đem lại hiệu quả cao.
Các chuyên gia về đánh giá cho rằng PPTL nên dùng trong các trường hợp sau:
Khi thí sinh không quá đông.
Khi muốn khuyến khích hay đánh giá cách diễn đạt.
Khi muốn tìm hiểu ý tưởng của TS hơn là khảo sát thành quả học tập
Khi có thể tin tưởng khả năng chấm bài TL của giáo viên là chính xác.
Khi không có nhiều thời gian soạn đề thi nhưng có đủ thời gian chấm bài.
Phương pháp TN nên dùng trong những trường hợp sau:
Khi số TS rất đông.
Khi muốn chấm bài nhanh.
Khi muốn có điểm số đáng tin cậy, không phụ thuộc vào người chấm bài.
Khi phải coi trọng yếu tố công bằng, vô tư, chính xác và muốn ngăn chặn sự gian lận trong thi cử.
Khi muốn kiểm tra một phạm vi hiểu biết rộng, muốn ngăn ngừa nạn học tủ, học vẹt và giảm thiểu sự may rủi.
Tóm lại, không có một phương pháp nào được coi là tốt nhất, mỗi phương pháp đều có ưu nhược điểm nhất định. Chúng ta là những nhà giáo phải biết linh động khi sử dụng các phương pháp TN. Nếu một phương pháp được sử dụng đúng, hợp lí thì nó sẽ đem lại kết quả tốt còn nếu quá lạm dụng, phiến diện thì không bao giờ có một kết quả tốt được.
1.2.2.3 Các kiểu câu hỏi TNKQ (trích theo 1, tr 49-73)
1.2.2.3.1 Câu ghép đôi (xứng – hợp).
Đặc điểm: Loại này có hai cột gồm danh sách các phần tử (những chữ, nhóm chữ hay câu). Dựa trên một hệ thức tiêu chuẩn nào đó định trước, học sinh sẽ ghép mỗi phần tử của cột một với một phần tử của cột hai. Số phần tử trong hai cột có thể bằng nhau hay khác nhau. Mỗi phần tử trong cột trả lời có thể dùng một hay nhiều lần.
Trắc nghiệm ghép đôi rất thông dụng nó được dùng để đo lường kiến thức về các mối tương quan, học sinh có thể ghép các từ với ý nghĩa tương ứng, các phát minh KH với tên các nhà bác học đã khám phá, ngày tháng với các biến cố, các chữ, tên với các phần khác nhau của một giản đồ hay bản đồ. Hoặc sắp các chữ hay câu thành từng loại dựa trên căn bản nào đó cho trước (phân loại động vật theo chủng loại, sắp xếp các biến cố theo thứ tự thời gian, sắp xếp các câu phát biểu theo một chuỗi lí luận, đánh giá một tác phẩm dựa trên các tiêu chuẩn cho trước).
Ưu điểm của TN ghép đôi:
Dễ viết và dễ dùng, đặc biệt rất thích hợp khi cần thẩm định các mục tiêu ở mức tâm linh thấp. Tuy nhiên chúng ta nên cố gắng viết những câu hỏi ở mức trí năng cao hơn.
Học sinh ở lứa tuổi học trường phổ thông cơ sở rất thích loại TN ghép đôi.
So với những loại câu hỏi nhiều lựa chọn loại ghép đôi ít tốn giấy nhất.
Yếu tố may rủi giảm đi nhiều khi số phần tử trong mỗi cột tăng và khác nhau.
Là loại câu hỏi hữu hiệu nhất trong việc đánh giá khả năng nhận biết các hệ thức, hay lập những mối tương quan.
Nhược điểm của loại TN ghép đôi:
Khó đo dược các mức trí năng cao ở TS.
Nếu số phần tử trong một cột quá dài thì sẽ không thuận lợi cho TS.
Các quy tắc khi soạn câu TN ghép đôi:
Số phần tử của mỗi cột phải ít nhất là 6 và nhiều nhất là 12. Nếu danh sách trong mỗi cột dài quá, chúng ta nên bỏ bớt các câu trả lời không hợp lí, nên phân chia danh sách dài thành những danh sách ngắn gồm 7, 8 phần tử ở mỗi cột. Ngược lại, nếu mỗi cột chỉ có ít hơn 5 phần tử chúng ta nên ghép hai hay ba bài tập lại với nhau.
Phải xác định rõ tiêu chuẩn để ghép một phần tử của cột trả lời vào phần tử của cột câu hỏi. Phải nói rõ mỗi phần tử trong cột trả lời chỉ được dùng một lần hay được dùng nhiều lần.
Số phần tử trong cột trả lời phải lớn hơn số phần tử trong cột câu hỏi, hoặc mỗi phần tử trong cột trả lời có thể được dùng nhiều lần. Điều này sẽ giảm bớt yếu tố may rủi.
Đôi khi có thể dùng hình vẽ để tăng sự thích thú của học sinh, cũng như để thay đổi dạng câu hỏi.
Các câu hỏi nên có tính chất đồng nhất hoặc liên hệ nhau.
Sắp các phần tử trong danh sách theo một thứ tự hợp lí nào đó.
Các phần tử cùng danh sách nên nằm trong cùng một trang để học sinh đỡ nhầm lẫn hoặc gặp khó khăn khi phải lật trang.
Các câu hỏi loại ghép đôi cũng có thể được sắp đặt dưới dạng tương tự loại có nhiều câu trả lời để chọn lựa.
Khi chúng ta đã nắm chắc được các quy tắc soạn câu hỏi ghép đôi ta sẽ có một câu hỏi khá hoàn chỉnh và đánh giá được các mức tư duy cao của học sinh.
1.2.2.3.2. Câu điền khuyết hay có câu trả lời ngắn
đặc điểm: hai loại trắc nghiệm điền khuyết hay có câu trả lời ngắn thực ra chỉ là một, chúng chỉ khác nhau về dạng thức vấn đề được đặt ra. Nếu được trình bày dạng câu hỏi thì chúng ta gọi là loại câu trả lời ngắn, nếu được trình bày dưới dạng một câu phát biểu chưa đầy đủ, được gọi là loại điền khuyết. Nội dung đây là loại trắc nghiệm khách quan có câu trả lời tự do.
Ưu điểm:
Thí sinh có được cơ hội trình bày những câu trả lời khác thường, phát huy óc sáng tạo.
Phương pháp chấm điểm nhanh hơn và đáng tin cậy hơn so với loại luận đề, mặc dù phần cho điểm có phần phức tạp hơn so với các loại trắc nghiệm khách quan khác.
Thí sinh mất cơ hội đoán mò câu trả lời như trong trường hợp các loại trắc nghiệm khách quan khác. Thí sinh phải nhớ hoặc nghĩ ra câu trả lời, thay vì chỉ chọn lựa câu trả lời đúng trong các câu cho sẵn.
Loại này dễ soạn câu hỏi hơn loại ghép đôi hoặc câu nhiều lựa chọn. Tuy nhiên cũng không nên lạm dụng quá sự dễ dãi này mà lấy y nguyên câu trong sách giáo khoa.
Thiếu yếu tố khách quan lúc chấm điểm. Dù cho phải chấm điểm loại trắc nghiệm điền khuyết có tính chất khách quan hơn loại luân đề, giáo viên vẫn gặp nhiều phiền phức hơn khi chấm các câu trắc nghiệm điều kiện vì giới hạn câu trả lời đúng rộng rãi hơn. Giáo viên có thể phải cho điểm toàn phần hay một phần cho một câu trả lời khác với đáp án để chấm bài. Do đó các nhân viên phục vụ không thể chấm giúp, cũng như không thể dùng phương pháp chấm bằng máy.
Loại trắc nghiệm này thường làm học sinh rối trí do vậy điểm số có độ tương quan cao với mức thông minh hơn là với thành quả học tập của học sinh điều này làm cho độ giá trị của bài thi giảm.
Các quy tắc soạn thảo trắc nghiệm loại điền khuyết:
Lời chỉ dẫn phải rõ ràng. Thí sinh phải biết mình cần làm gì và làm như thế nào?
Tránh soạn câu hỏi một cách quá lạm dụng do lấy nguyên văn các câu từ sách hoặc đã dạy cho học sinh để khỏi bắt buộc học sinh học thuộc lòng.
Các câu viết ý nghĩa phải rõ ràng tránh mơ hồ, không rõ nghĩa.
Vị trí cần học sinh điền vào phải là những từ ngữ chắt lọc, quan trọng và phải rõ ràng đơn vị.
Không nên để trống quá nhiều vị trí làm học sinh rối và không biết ý của người ra đề như thế nào? Nên để chỗ trống ở cuối câu để thí sinh không bị hẫng.
Khi tính điểm, mỗi chỗ điền vào nên tính một điểm (trừ câu trả lời đòi hỏi phải điền nhiều chữ) không nên trừ điểm chính tả.
Nếu trong bài trắc nghiệm có nhiều chỗ phải điền thì nên đánh số sắp xếp ra cạnh để thí sinh điền câu trả lời. Những chỗ trống phải đủ để học sinh điền vào và chiều dài bằng nhau để tránh sự đoán mò.
Khuyến khích sự sáng tạo của học sinh bằng cách công bằng khách quan khi cho điểm với những câu trả lời không giống đáp án.
Nên dùng câu hỏi thế nào với những câu trả lời ngắn.
1.2.2.3.3. Trắc nghiệm loại đúng sai
Đặc điểm:
Loại câu trắc nghiệm đúng sai thường gồm một câu phát biểu để thí sinh phán đoán xem nội dung đó đúng hay sai. Để giảm bớt khuyết điểm của loại trắc nghiệm này người ta tìm cách cải tiến phương pháp: những chữ chính yếu quyết định sự đúng sai trong câu được gạch chân hay in đậm nét hơn. Và yêu cầu thí sinh sửa lại._. nếu thí sinh cho là sai. Đây là một yếu tố làm giảm sự đoán mò và do đó làm tăng độ tin cậy của bài trắc nghiệm.
Ưu điểm của loại trắc nghiệm đúng sai
Đây là loại đơn giản nhất để trắc nghiệm kiến thức về những sự kiện.
Nếu trắc nghiệm theo loại này sẽ kiểm tra được một lượng kiến thức rộng lớn trong khoảng thời gian ngắn.
Trong cùng một khoảng thời gian giáo viên có thể soạn được nhiều câu hỏi hơn loại câu hỏi nhiều lựa chọn (cứ khoảng 5 câu nhiều lựa chọn thì tương ứng ít nhất là 10 câu hỏi đúng sai).
Hoàn toàn khách quan khi chấm điểm.
Việc trả lời câu hỏi rất đơn giản.
Nhược điểm của loại trắc nghiệm đúng sai:
Có thể khuyến khích sự đoán mò. Theo luật số lớn thì cho dù cô giáo có sử dụng công thức hiệu chỉnh, học sinh vẫn có khuynh hướng đoán may rủi để có 50% hy vọng trả lời đúng.
Khó dùng để chẩn định điểm yếu của học sinh, do yếu tố đoán mò.
Rất khó khăn cho các môn thuộc lĩnh vực KHXH trong việc soạn thảo câu hỏi vì lĩnh vực này có nhiều quan điểm khác nhau. Do đó người soạn phải nói rõ tác giả, xuất sứ của ý kiến, tư tưởng, lời nói nêu trong mỗi câu.
Loại TN đúng sai có độ tin thấp do xác suất đoán đúng của học sinh là 50%. Để có độ tin cậy tương đương với các loại TNKQ khác thì câu hỏi loại này phải dài hơn nhiều.
Xu hướng trích nguyên văn các câu trong sách dễ làm cho học sinh tập thói quen học thuộc hơn là tìm hiểu suy nghĩ.
Trong khuôn khổ của câu đúng sai làm cho học sinh khá cảm thấy khó chịu khi phải ràng buộc ý kiến trả lời. Đồng thời với các em còn bé, những câu phát biểu sai có thể khiến các em học những điều sai lầm một cách vô ý thức.
Quy tắc soạn câu hỏi loại “Đúng, Sai”:
Nên dùng những chữ chính xác và thích hợp để câu hỏi đơn giản và rõ ràng.
Các câu hỏi loại đúng sai chỉ nên mang một ý tưởng chính yếu để câu được rõ ý và mang nghiã trong sáng hơn.
Tránh dùng những từ gây cho TS đoán ra được phương án trả lời như: “luôn luôn”, “tất cả”,”không bao giờ”, “không thể được”, “chắc chắn”, vì các từ này thường có triển vọng sai,còn những từ như: “thường thường”, “đôi khi”,”ít khi” lại thường đi với những câu để trả lời đúng
Nên cố gắng soạn các câu có nội dung hoàn toàn đúng hoặc hoàn toàn sai. Quan điểm đúng sai nên lấy theo sự đồng ý thuần nhất của những nhà chuyên môn có thẩm quyền.
Nên soạn các câu đúng văn phạm và áp dụng đựơc kiến thức đã học nhưng tránh những chi tiết vụn vặt không cần thiết
Tránh dùng câu phủ định kép, không để học sinh đoán được câu trả lời nhờ chiều dài của câu, nên dùng các từ định tính hơn định lượng
Phương pháp chấm điểm loại TN đúng sai:
Có hai phương pháp được áp dụng cho loại TN đúng sai:
Phương pháp thứ nhất là cho mỗi câu trả lời đúng một điểm và không kể đến câu sai hoặc không làm.
Phương pháp thứ hai thường dùng hơn đếm số câu trả lời đúng R và trừ đi số câu trả lời sai W . Công thức tính điểm khi đó sẽ là:
Điểm số = Số câu đúng R - Số câu sai W
Nguyên nhân dùng công thức này là, theo lí thuyết, một học sinh không biết gì, dùng cách đoán mò, có thể trả lời 50 câu và sai 50 câu trong một bài 100 câu hỏi. Nhiều nhà TN cho rằng một người đoán mò như thế phải bị điểm không, nên điểm số của học sinh trên bằng số câu hỏi đúng nhờ may rủi (50) trừ số câu sai (50). Nhiều chuyên viên TN như W.B.Michacl, J.A.R.Wilson và M.C Robeck (1969) khuyên không nên dùng công thức hiệu chỉnh cho số câu TL sai trừ trường hợp bài TN tốc độ. Việc dùng công thức hiệu chỉnh thường đưa vào một nguồn sai số làthói quen trả lời câu hỏi theo một khuynh hướng nào đó (liều lĩnh hay thận trọng) sẽ làm giảm giá trị của bài trắc nghiệm.
1.2.2.3.4. Trắc ngiệm có nhiều phương án trả lời (MCQ).
ở phần trên chúng ta đã tìm hiểu về một số loại câu hỏi TNKQ và cũng thấy được rằng các loại đó vẫn còn nhiều nhược điểm. Một loại câu hỏi mà khắc phục được nhiều nhược điểm đó chính là TN-MCQ (TN có nhiều phương án TL). Đây là dạng TNKQ được ưa chuộng nhất, thường được kí hiệu là MCQ.
Đặc điểm: Một CH loại này gồm một phần phát biểu chính,thường gọi là lời dẫn, hay CH, và bốn, năm, hay nhiều phương án trả lời cho sẵn để TS chọn ra câu TL đúng nhất, hay hợp lí nhất. Ngoài một câu đúng, các câu TL khác trong các phương án chọn lựa phải có vẻ hợp lí với TS.
Ưu điểm của TN-MCQ:
Có thể đo được các mức khả năng tâm linh khác nhau. Với sự phối hợp của nhiều phương án TL để chọn cho mỗi CH có thể kiểm tra, đánh giá những mục tiêu giảng dạy, học tập khác nhau một cách khá toàn diện.
Độ tin cậy cao hơn. Yếu tố đoán mò may rủi của học sinh giảm đi nhiều so với các loại TNKQ khác khi số phương án chọn lựa tăng lên.
Học sinh phải xét đoán và phân biệt kĩ càng khi TLCH. Tính chất tuyệt đối trong loại đúng sai nhường chỗ cho tính chất tương đối khi HS phải chọn lựa câu TL đúng nhất hay hợp lí nhất trong số các phương án TL đã cho.
Tính chất giá trị tốt hơn do dạng TN này có thể đo được đầy đủ các mức tâm linh khác nhau như: nhớ, hiểu, áp dụng, phân tích, tổng hợp, đánh giá.
Có thể phân tích được tính chất mỗi CH. Dùng phương pháp phân tích câu hỏi, chúng ta có thể xác định câu nào dễ quá, câu nào khó quá, câu nào mơ hồ hay không giá trị đối với các mục tiêu cần TN. Ngoài ra, chúng ta có thể xét xem câu TL cho sẵn nào không ích lợi, hoặc làm giảm giá trị CH. Phương pháp này không thực hiện với loại CHTL, hay khó thực hiện với loại TN khác.
Tính khách quan khi chấm bài thi. Dựa vào máy, bài thi được quét và vào điểm một cách hoàn toàn khách quan. Ngay cả những khi bài thi được chấm bằng tay thì điểm số trên bài thi của TS cũng không phụ thuộc vào người chấm vì TNMCQ không phụ thuộc vào các yếu tố như phẩm chất của chữ viết, hoặc khả năng diễn đạt tư tưởng.
Ngoài ra, TNMCQ còn có tất cả các ưu điểm khác của TNKQ.
Nhược điểm của loại CHTNMCQ:
Ngoài những nhược điểm của CHTNKQ so với TL mà ta đã so sánh ở trên thì TNMCQ còn có những tồn tại sau:
Khó soạn CH. Việc soạn CHMCQ sẽ mất nhiều thời gian và sự công phu mới viết được những CH đạt tiêu chuẩn, đúng kĩ thuật. Yêu cầu đặt ra ở đây là phải chọn ra phương án đúng nhất trong khi các phương án nhiễu đề ra cũng phải có vẻ hợp lí. Qua đó ta mới có thể đo được các mục tiêu đã định sẵn và các mức kĩ năng cao hơn mức nhớ.
Đối với những TS học khá thường khó chịu với những CH mà họ có thể có phương án TL hay hơn. Vì vậy khi soạn CH thì GV phải cố gắng soạn để có câu TL tốt nhất và hay nhất.
Còn có những nhược điểm khác là: tốn nhiều giấy để in CH, và TS sẽ phải tốn nhiều thời gian để đọc CH.
Nếu so với CHTL thì CHMCQ không thể đo được khả năng giải quyết vấn đề khéo léo hay khả năng phán xét , nhìn nhận vấn đề của TS.
Các quy tắc khi soạn CHTNMCQ:
Một yếu tố không thể thiếu trong TNMCQ là phần chính, hay câu dẫn của CH phải diễn đạt rõ ràng một vấn đề. Các câu TL để chọn phải là những câu khả dĩ thích hợp với vấn đề đã nêu. Tránh dùng những câu có vẻ như CH loại "đúng, sai" không có liên hệ với nhau sắp chung một chỗ.
Phần chính của câu hỏi nên mang chọn ý nghĩa và phần câu TL để chọn nên ngắn gọn. Tránh những từ rườm rà không cần thiết để diễn tả ý nghĩa câu hỏi.
Nên có nhiều phương án TL để TS lựa chọn nhưng cũng không nên nhiều quá gây rối cho TS, làm giảm giá trị của những mồi nhử. Nếu phương án chọn ít qúa sẽ làm tăng yếu tố may rủi nên dừng lại ở bốn hoặc năm phương án.
Đối với câu hỏi: a) Nên tránh thể phủ định, hay hai thể phủ định liên tiếp, nếu có thì phải gạch chân hoặc viết hoa để TS chú ý hơn.
b) Câu hỏi nhằm đo sự hiểu biết, suy luận, hay khả năng áp dụng các nguyên lí vào các trường hợp mới thì phải trình bày dưới nhiều hình thức khác nhau và mới mẻ.
Nếu câu hỏi đề cập đến vấn đề nhiều tranh luận thì phải nêu rõ nguồn gốc, quan điểm... trong lời dẫn.
Đối với các phương án TL:
Phải chắc chắn chỉ có một câu đúng.
Độ dài các câu phải gần bằng nhau.
Phải đồng nhất với nhau. Tính chất đồng nhất có thể dựa trên căn bản ý nghĩa, âm thanh, độ dài, hoặc cùng là động từ, tính từ, danh từ.
Lưu ý đến những điểm liên hệ về văn phạm giúp TS nhận biết câu TL.
Không nên dùng hai phương án trái nghĩa nhau làm cho TS chỉ chú ý đến hai phương án này. Điều này làm cho câu hỏi TNMCQ giông dạng TN " đúng sai".
Phương án đúng nên đặt một cách ngẫu nhiên ở các vị trí và không nên dùng các từ mang ý nghĩa chung chung như: “không câu nào trên đây đúng” hoặc “tất cả các câu trên đây đều đúng”.
Phương án cho điểm loại câu hỏi MCQ:
Giả sử một TS có số câu TL đúng là R và số câu TL sai là W với số phương án TL cho sẵn để lựa chọn là k thì công thức thường được dùng để chấm điểm là:
Điểm =
Đây là công thức có hiệu chỉnh do yếu tố đoán mò may rủi. Nguyên nhân là do nếu bài thi gồm có 60 câu, mỗi câu có năm phương án lựa chọn. Xác suất để một người đoán mò đoán đúng là 20% tức là 12 câu, và sẽ trả lời sai là 48 câu. Chia 48 cho (5-1) thì ta được 12. Khi trừ con số này cho 12 câu trả lời đúng chỉ nhờ may mắn, người đó sẽ được điểm không. Tuy nhiên nhiêu công trình và nhiều tác giả cho thấy là việc áp dụng công thức là không cần thiết vì sẽ dùng điểm âm.
1.2.3. Các tiêu chuẩn để đánh giá các câu TN và bài thi TNKQ
1.2.3.1. Các mức độ mục tiêu trong lĩnh vực nhận thức
1.2.3.1.1. Các mức kĩ năng trong lĩnh vực nhận thức
Theo B. S. Bloom, các hoạt động giáo dục bao gồm ba lĩnh vực, đó là lĩnh vực về nhận thức, lĩnh vực về hoạt động, và lĩnh vực về cảm xúc thái độ. Lĩnh vực về nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh giá có phê phán.
Bloom và các cộng sự của ông ta cũng xây dựng nên các cấp độ của các mục tiêu giáo dục, thường được gọi là cách phân loại B.loom, trong đó lĩnh vực nhận thức được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất như sau (5, tr 3):
nhớ: là sự nhớ lại các dữ liệu đã học được trước đây. Có nghĩa là nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các lí thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức.
hiểu: là khả năng nắm được ý nghĩa của tài liệu. Điều này thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác, bằng cách giải thích tài liệu (hoặc tóm tắt) và bằng cách ước lượng xu hướng tương lai (dự báo các hệ quả hoặc ảnh hưởng). Kết quả học tập ở mức độ nay cao hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật.
áp dụng: là khả năng sử dụng những điều đã học vào một hoàn cảnh cụ thể mới. Điều đó có thể bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm nguyên lí, định luật và lí thuyết. Kết quả học tập ở lĩnh vực này đòi hỏi cấp độ thấu hiểu cao so với cấp độ hiểu ở trên.
phân tích: là khả năng phân chia một tài liệu ra thành các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Bao gồm việc chỉ ra đúng các bộ phận, phân tích các mối quan hệ giữa các bộ phận, và nhận biết được các nguyên lí tổ chức được bao hàm. Phân tích đòi hỏi một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu nên kết quả học tập ở đây thể hiện một mức trí tuệ cao hơn so với mức hiểu.
tổng hợp: là khả năng sắp xếp các bộ phận lại với nhau để hình thành một tổng thể mới. Bao gồm việc tạo ra một cuộc giao tiếp đơn nhất (chủ đề hoặc bài phát biểu), một kế hoạch hành động (dự án nghiên cứu), hoặc một mạng lưới các quan hệ trừu tượng (sơ đồ để phân lớp thông tin). Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình và cấu trúc mới.
đánh giá: là khả năng xác định giá trị của tài liệu (tuyên bố, tiểu thuyết, thơ, báo cáo nghiên cứu). Việc đánh giá dựa trên các tiêu chí nhất dịnh. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.
Các công cụ đánh giá có hiệu quả phải giúp xác định được kết quả học tập ở mọi cấp độ nói trên để đưa ra một nhận định chính xác về năng lực của người được đánh giá về chuyên môn liên quan.
1.2.3.1.2. Mục tiêu giảng dạy
Bất kì một hoạt động nào cũng phải có mục tiêu cần đạt đến. Trong giảng dạy cũng thế, muốn việc giảng dạy có hiệu quả thì ta phải đặt ra các mục tiêu giảng dạy để làm cái đích cho HS và GV hướng đến. TN nói chung và TNKQ nói riêng đều phải đo được cái cần đo, tức là đo được mức độ đạt các mục tiêu cụ thể của môn học, cần phải thiết kế và viết đề thi trắc nghiệm bám sát mục tiêu môn học. Mục tiêu giảng dạy là cơ sở quan trọng để xây dựng các đề thi TN.
Để giảng dạy tốt một môn học cần có một danh mục chi tiết về các mục tiêu giảng dạy, thể hiện ở năng lực hay hành vi cần phát triển của người học qua quá trình giảng dạy. Để viết một bài TN tốt cho môn học đó cần dựa vào các mục tiêu đề ra cho môn học. Khi đã có một mục tiêu chi tiêt của môn học thì chúng ta liệt kê các mục tiêu cụ thể liên quan đến các năng lực cần đo lường đối với từng phần của môn học, sau đó tuỳ thuộc vào mức độ quan trọng của từng mục tiêu ứng với từng phần của môn học mà quyết định là cần bao nhiêu câu hỏi.
Công cụ thuận lợi để thiết kế các thành phần của một đề TN là bảng mục tiêu giảng dạy. Trong bảng đó có chia ra các hàng ứng với các phần của môn học, và các cột ứng với các mức kĩ năng liê n quan đến mục tiêu cụ thể. ứng với mỗi ô của bảng người ta ghi số câu hỏi cần xây dựng cho bài TN. Tuỳ theo tầm quan trọng của nội dung và loại kĩ năng mà quy định số câu TN phải viết.
Việc xác định được chi tiết các mục tiêu cụ thể của môn học và thiết kế đề TN bám sát các mục tiêu đó là một đảm bảo để phép đo bằng đề thi TN có độ giá trị cần thiết.
1.2.3.2. Một số khái niệm và định luật quan trọng trong lí thuyết xác suất thống kê
TNKQ là một phương pháp khoa học dựa trên lí thuyết của xác suất thống kê do vậy chúng ta sẽ điểm lại một số kiến thức quan trọng cần đề cập đến trong lí thuyết thống kê.
1.2.3.2.1. Xác suất là gì?
Đối với các hiện tượng ngẫu nhiên người ta không thể biết chắc chắn một sự kiện hoặc biến cố gì sẽ xảy ra, chỉ có thể nói xác suất xảy ra một biến cố nào đó. Xác suất là một số không âm, có giá trị từ 0 (ứng với một sự cố không xảy ra) đến 1 (ứng với một sự cố chắc chắn xảy ra).
Một động tác để làm xuất hiện một sự cố được gọi là một phép thử. Chúng ta có thể thực hiện nhiều phép thử để khảo sát việc xuất hiện của một sự cố. Tỉ số lần xuất hiện sự cố trên tổng số phép thử được gọi là tần suất.
1.2.3.2.2. Luật số lớn là gì?
Khi số lượng phép thử tăng lên đủ lớn, giá trị tần suất sẽ tiến dần đến giá trị xác suất.
Đây là nội dung của luật số lớn, định luật này làm cơ sở quan trọng cho mọi nghiên cứu thống kê. Ngoài ra đây còn gọi là luật về giá trị trung bình.
1.2.3.2.3. Tổng thể và mẫu
Tổng thể là một tập hợp rất lớn các đối tượng dùng để xem xét các số liệu hoặc tính chất nào đó. VD: xem xét kết qủa TN trong một tổng thể gồm toàn bộ thí sinh tham dự kì thi cuối năm lớp 10.
Do việc thực hiện nghiên cứu trên một tổng thể với số lượng rất lớn đối tượng thường gây nhiều khó khăn và tốn kém, nên người ta thường triển khai một số nghiên cứu trên một tập hợp con với số lượng ít hơn của tổng thể. Tập hợp các con số đó gọi là mẫu nghiên cứu. Người ta phải chọn những mẫu nghiên cứu có tính đại diện cho tổng thể để việc nghiên cứu thu được các kết quả thống kê gần với kết quả thu được từ tổng thể.
1.2.3.2.4. Phân bố tần suất
Đường cong mô tả sự xuất hiện của một đăc trưng nào đó mà ta thực hiện phép đo trên một mẫu nghiên cứu được gọi là đường cong phân bố tần suất. VD: Khi tiến hành điều tra số học sinh phổ thông trung học của các tỉnh thuộc khu vực miền Bắc. Ta mô tả kết quả đo được trên một đồ thị, trục hoành biểu diễn số học sinh trong một trường (theo khoảng), trục tung biểu diễn tần suất xuất hiện của số học sinh trong khoảng nào đó. Nếu chúng ta tiến hành điều tra trên phạm vi cả nước thì ta sẽ được một đường cong có dạng giống như trên nhưng mịn và đều hơn. Khi phân bố tần suất đối với một tổng thể được gọi là phân bố xác suất.
Dạng phân bố kiểu hình chuông đối xứng như trên hình vẽ được gọi là phân bố chuẩn. Các đại lượng đặc trưng để phân bố tần suất là:
Giá trị trung bình của các giá trị đo được trên mẫu (gồm n cá thể).
=
giá trị trung bình xác định vị trí của một phân bố tần suất trên một thang đo nào đó.
Độ lệch tiêu chuẩn của các giá trị đo được so với giá trị trung bình.
S =
Khi n đủ lớn thì giá trị của S tính theo công thức trên gần với căn bậc hai của trung bình các bình phương độ lệch. Độ lệch tiêu chuẩn xác định mức độ phân tán của các số đo của đại lượng: khi độ lệch tiêu chuẩn bé đường phân bố sẽ có dạng hẹp và nhọn, còn khi độ lệch tiêu chuẩn lớn thì đường phân bố sẽ có dạng doãn và tù.
Khi một mẫu không đồng nhất ta sẽ thu được đường cong phân bố lệch (lệch âm hay lệch dương). Từ đó ta có thể phát biểu luật số lớn theo cách khác: Khi kích thước của mẫu chọn càng lớn, giá trị trung bình của các đại lượng đo trên mẫu sẽ tiến gần đến giá trị trung bình đo trên tổng thể.
Định lí giới hạn trung tâm
Nếu một đại lượng nào đó trong một tổng thể tuân theo một phân bố bất kì, từ tổng thể đó thì khi ta chọn nhiều mẫu khác nhau và xác định một đặc trưng nào đó của mẫu, chẳng hạn là giá trị trung bình thì định lí giới hạn trung tâm có nội dung như sau: nếu kích thước của mẫu chọn đủ lớn, phân bố của giá trị trung bình của mẫu theo các mẫu được chọn là gần với phân bố chuẩn, dù rằng phân bố của tổng thể theo quy luật nào đi nữa.
Hệ số tương quan
Biến là một đại lượng đặc trưng nào đó nhận các giá trị khác nhau từ một cá thể này đến một cá thể khác trong một tổng thể thống kê. Số liệu thống kê thường xem xét mối quan hệ giữa các biến khác nhau. Trong trường hợp có hai biến, mối quan hệ giữa chúng thường được biểu diễn bằng hệ số tương quan.
Hệ số tương quan R giữa hai biến x và y là:
R =
Trong đó: , là các độ lệch tiêu chuẩn của biến x và biến y, còn được gọi là hiệp phương sai giữa x và y được tính theo công thức:
S =
Từ đó có thể lập được biểu thức để tính hệ số tương quan Pearson:
R =
Hệ số tương quan là đại lượng để đo mối quan hệ tuyến tính giữa hai biến ngẫu nhiên. Nó có giá trị phân bố trong khoảng từ -1 đến 1.
R < 0 khi các giá trị cao (thấp,trung bình) của biến x tương ứng có liên hệ với các giá trị cao (thấp, trung bình) của biến y.
R > 0 khi các giá trị cao (trung bình, thấp) của biến x có liên hệ với các giá trị thấp (trung bình, cao) của biến y.
R = 0 khi quan hệ của các giá trị của biến x và các giá trị của biến y không tuân theo một quy luật rõ ràng nào.
1.2.3.3. Đánh giá các câu TN
Phân tích các câu trả lời của TS trong một bài TN là việc làm rất cần thiết và rất hữu ích cho người soạn TN. Nó giúp cho người soạn thảo:
Biết được những câu nào là quá khó, câu nào là quá dễ.
Lựa ra các câu có độ phân cách cao, nghĩa là phân biệt được giữa HS giỏi và HS kém.
Biết được lí do vì sao câu TN không đạt được hiệu quả mong muốn và cần phải sửa đổi như thế nào cho tốt hơn.
Một bài TN, sau khi đã được sửa đổi trên căn bản của sự phân tích như nói trên, có khả năng đạt được tính tin cậy cao hơn là một bài TN có cùng số câu hỏi nhưng chưa được thử nghiệm và phân tích.
Chúng ta sẽ phân tích câu TN ở hai tiêu chuẩn đó là: Độ khó và độ phân biệt.
1.2. 3.3.1 Độ khó
Khi soạn thảo xong một câu hoặc một bài TN người soạn thảo chỉ có thể ước lượng độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần TN thử, dựa vào kết quả thu được từ các câu và các bài TN của TS.
Độ khó của câu TN được định nghĩa bằng tỉ lệ của tổng số người trả lời đúng câu TN so với tổng số người làm câu TN ấy:
Tổng số TS trả lời đúng câu hỏi
Độ khó p của câu thứ i=
Tổng số TS trả lời câu hỏi
Việc sử dụng trị số p để đo độ khó là rất có ý nghĩa. Nó thay thế cách xác định độ khó theo các đặc tính nội tại của câu TN bằng cách đếm số người làm đúng câu hỏi. Nó cũng cho thấy rõ mức độ khó dễ phụ thuộc vào cả câu hỏi, lẫn người làm câu hỏi. Ngoài ra cách định nghĩa này cũng cho ta một đại lượng chung phản ánh độ khó dễ của các bài TN thuộc các lĩnh vực khoa học khác nhau.
Các câu hỏi của một bài TN thường phải có các độ khó khác nhau. Theo công thức tính độ khó như trên, rõ ràng gía trị p càng bé câu hỏi càng khó và ngược lại. Vậy p có giá trị như thế nào thì câu hỏi có thể được xem là có độ khó trung bình? Muốn xác định được khái niệm này cần phải lưu ý đến các xác suất làm đúng câu hỏi bằng cách chọn hú hoạ
Một bài TN được gọi là tốt không phải là bài TN gồm toàn những câu khó hay toàn những câu dễ cả, mà là bài TN gồm những câu có mức độ khó trung bình hay mức độ khó vừa phải.
Nhưng thế nào là độ khó vừa phải? Thông thường ta cho rằng một câu TN có độ khó vừa phải là câu có chỉ số khó là 50%, nghĩa là 50% học sinh làm đúng câu hỏi ấy và 50% làm sai. Nhưng muốn cho công bằng và đúng đắn hơn, ta cần phải phân biệt loại câu TN để xác định thế nào là độ khó vừa phải.
Với một câu TN thuộc loại đúng-sai thì độ khó 50% chưa hẳn là độ khó vừa phải vì như ta đã biết, câu hỏi thuộc loại này chỉ gồm có hai lựa chọn, do đó sự may rủi làm đúng câu hỏi ấy là 50%. Vậy ta không thể cho 50% là chỉ số khó thíchs hợp cho loại này. Vì lí do ấy, ta cần phải lưu ý đến một yếu tố khác. Đó là tỉ lệ may rủi kì vọng. Tỉ lệ này thay đổi tuỳ theo số câu lựa chọn trong mỗi câu hỏi. Nếu câu hỏi có hai lựa chọn thì tỉ lệ kì vọng là 50%. Như vậy, độ khó vừa phải của câu hai lựa chọn này phải là trung điểm giữa tỉ lệ may rủi kì vọng và100%, nghĩa là: (100 + 50)/ 2 = 75%. Nói cách khác, câu TN loại đúng-sai có độ khó vừa phải nếu 75% TS trả lời đúng câu hỏi ấy. Theo cách tính này thì tỉ lệ kì vọng của loại câu TN có 5 lựa chọn là 100/5, tức là 20%. Vậy độ khó vừa phải của câu TN có 5 lựa chọn là (100 + 20)/ 2 = 60%. Như vậy độ khó trung bình của một bài TN n phương án chọn là: (100%+1/n)/2. Còn đối với các câu TL tự do, như loại điền khuyết, thì độ khó trung bình là 50%.
Khi chọn các câu TN theo độ khó người ta thường phải loại các câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài TN tốt khi có nhiều câu ở độ khó trung bình.
Độ khó của bài TN được xét bằng cách đối chiếu điểm số trung bình của bài và điểm trung bình lí tưởng của nó. Điểm trung bình lí tưởng của bài TN là điểm số nằm giữa điểm tối đa người làm đúng toàn bộ nhận được và điểm mà người không biết gì có thể đạt được nhờ chọn hú hoạ. Giả sử chúng ta chỉ xét đến điểm thô. VD: một bài TN 50 câu, mỗi câu có 5 phương án TL. Điểm thô tối đa là 50, điểm có thể đạt được do chọn hú hoạ là 0,2 x 50 = 10, điểm trung bình lí tưởng là (50 + 10)/ 2 = 30. Nếu điểm trung bình quan sát được trên hay dưới 30 quá xa thì bài TN ấy sẽ là quá khó hay quá dễ. Nói chung, nếu điểm trung bình lí tưởng nằm ở khoảng giữa phân bố các điểm quan sát được thì bài TN là vừa sức đối với đối tượng TS, còn khi điểm đó nằm ở phía trên hoặc dưới phân bố điểm quan sát được thì bài trắc nghiệm tương ứng là khó hơn hoặc dễ hơn so với đối tượng TS. Thông thường độ khó của một câu hỏi có thể chấp nhận được nằm trong khoảng 0.25 – 0.75; câu có độ lớn hơn 0.75 là quá dễ, có độ nhỏ hơn 0.25 là quá khó. Việc tính độ khó theo cách nêu trên được thực hiện theo lý thuyết đo lường cổ điển. Trong lý thuyết trả lời câu hỏi ( IRT) hiện đại độ khó và năng lực của thí sinh được tính bằng cách ước lượng theo các mô hình toán học xác định.
1.2.3.3.2. Độ phân biệt
Trước hết chúng ta làm quen với phương pháp cổ điển đơn giản để tính độ phân biệt. Độ phân biệt của câu trắc nghiệm dùng để đo lường mức độ khác nhau giữa phản ứng của thí sinh giỏi và thí sinh kém lên câu hỏi đó. Độ phân biệt của một câu trắc nghiệm hoặc một bài trắc nghiệm liên quan đến độ khó. Thật vậy, nếu một bài trắc nghiệm dễ đến mức mọi thí sinh đều làm tốt, các điểm số đạt được chụm ở phần điểm cao, thì độ phân biệt của nó rất kém, mọi thí sinh đều có thể phản ứng như nhau đối với bài trắc nghiệm đó. Cũng vậy, nếu một bài trắc nghiệm khó đến mức mọi thí sinh đều không làm được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém. Từ các trường hợp giới hạn nói trên có thể suy ra rằng muốn có độ phân biệt tốt thì bài trắc nghiệm phải có độ khó ở mức trung bình. Khi ấy điểm số thu được của nhóm thí sinh sẽ có phổ trải rộng.
Cách tính độ phân biệt
Dựa vào tổng điểm thô của từng thí sinh người ta tách từ đối tượng thí sinh ra một nhóm giỏi bao gồm 27% thí sinh đạt điểm cao từ trên xuống và nhóm kém bao gồm 27% thí sinh đạt điểm kém từ dưới lên. Gọi C là số thí sinh làm đúng câu hỏi thuộc nhóm giỏi, T là số thí sinh làm đúng câu hỏi thuộc nhóm kém, S là số lượng thí sinh của 27% tổng số, ta có biểu thức tính độ phân biệt D của câu hỏi như sau:
D = (C – T)/S
Người ta có thể tính theo phân biệt của một câu trắc nghiệm theo một định nghĩa khái quát hơn: đó là hệ số tương quan giữa các điểm của câu trắc nghiệm đó với tổng điểm của toàn bài trắc nghiệm xét trên mọi thí sinh làm bài trắc nghiệm ( hệ số tương quan điểm nhị phân). Hệ số tương quan có giá trị dương lớn ( gần bằng 1) nếu một thí sinh nào đó có điểm của câu trắc nghiệm cao thì điểm của toàn bài cũng cao và ngược lại. Hệ số tương quan có giá trị âm lớn ( gần bằng -1) nếu một thí sinh nào đó có điểm câu trắc nghiệm cao nhất thì điểm của toàn bài trắc nghiệm lại kém nhất, ngược lại. Hệ số tương quan bằng 0 nếu điểm của câu trắc nghiệm và điểm của toàn bài trắc nghiệm không có mối liên hệ chặt chẽ và ổn định nào cả. Nói cách khác, câu trắc nghiệm có độ phân biết tốt khi câu trắc nghiệm và toàn bài trắc nghiệm đều đo lường cùng một mục tiêu. Như vậy để tính độ phân biệt, ta có thể tính hệ số tương quan Pearson giữa điểm của câu trắc nghiệm với tổng điểm của toàn bài trắc nghiệm, sau đó kiểm nghiệm ý nghĩa của hệ số tương quan ấy.
1.2.3.4. Đánh giá bài trắc nghiệm
1.2.3.4.1. Độ tin cậy của bài trắc nghiệm
Trắc nghiệm là một phép đo: dùng thước đo là bài trắc nghiệm để đo lường một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm. Có nhiều phương pháp theo khoa học thống kê để tính độ tin cậy của một bài trắc nghiệm.
Một bài trắc nghiệm được xem là đáng tin cậy khi nó cho ra những kết quả có tính vững chãi. Có nghĩa là nếu làm bài trắc nghiệm ấy nhiều lần, mỗi học sinh sẽ vẫn giữ được thứ hạng tương đối của mình trong nhóm nhưng không có nghĩa là bài trắc nghiệm ấy được làm đi làm lại nhiều lần. Một bài trắc nghiệm có thể gồm rất nhiều câu hỏi và đó là một mẫu trong một ngân hàng câu hỏi dùng để khảo sát kiến thức của học sinh, do đó chúng phải chịu sai số chọn mẫu. Nếu một bài trắc nghiệm có 50 câu hỏi được ra cho học sinh, tiếp theo đó là một bài với 50 câu khác về cùng một lĩnh vực khảo sát, thì chắc chắn sẽ có những sự khác biệt giữa hai điểm số của một số học sinh. Như vậy, một điểm số duy nhất dựa trên một mẫu các câu trắc nghiệm không phải là số đo lường hoàn toàn đáng tin cậy.
Có những yếu tố may rủi đóng góp vào sự thiếu tin cậy trong trường hợp các câu hỏi đúng sai và ở một mức độ ít hơn với các câu có nhiều lựa chọn. Điểm số của học sinh bao gồm trong đó một số câu trả lời đúng bằng lối phỏng đoán và một số câu làm đúng nhờ sự hiểu biết. Càng có nhiều câu phỏng đoán bao nhiêu thì người học sinh ấy càng có ít cơ may có được cùng một điểm số, nếu làm lại bài trắc nghiệm ấy lần thứ 2; do đó tính tin cậy của bài trắc nghiệm sẽ thấp nếu nhiều câu trả lời chỉ là những điều phỏng đoán. Vì yếu tố may rủi chi phối điểm số trắc nghiệm trong trường hợp này, người ta không thể xác định rằng những học sinh có điểm cao biết nhiều hơn hay giỏi hơn các học sinh có điểm thấp hơn. Do đó, nếu có nhiều học sinh đoán mò nghĩa là nhắm mắt mà đoán không cần phải suy nghĩ thì chắc chắn hệ số tin cậy sẽ thấp và điểm số trên một bài trắc nghiệm như vậy sẽ không đáng tin cậy.
Nếu cho học sinh làm một bài trắc nghiệm dễ, các điểm số có khuynh hướng tập trung vào đầu mút cao của thang điểm, như vậy khó mà phân biệt được trình độ khác nhau của học sinh. Ngược lại, nếu là một bài trắc nghiệm rất khó, các điểm số sẽ tập trung vào đầu mút thấp của thang điểm, như vậy chúng sẽ che lấp tính chất khác nhau của các trình độ hiểu biết. Ngay cả khi ta cố giảm thiểu yếu tố may rủi bằng cách sử dụng loại câu điền khuyết, yếu tố chọn mẫu cũng vẫn tồn tại. Một sự khác biệt một vài điểm không thể bộc lộ sự khác biệt về thành tích. Chỉ khi nào các điểm số trắc nghiệm được trải rộng thì các điểm số ấy mới cho thấy rõ sự khác biệt về thành quả học tập. Do vậy, tính chất khó hay dễ của bài trắc nghiệm cũng ảnh hưởng đến tính tin cậy của bài trắc nghiệm.
Ngoài ra, chiều dài của bài trắc nghiệm cũng ảnh hưởng đến tính tin cậy. Một bài trắc nghiệm rất ngắn không khiến cho điểm số được trải rộng ra đủ để cho ra những kết quả vững chãi. Bài trắc nghiệm càng dài thì tính tin cậy của nó càng tăng lên.
Qua những yếu tố ảnh hưởng đến tính tin cậy của một bài trắc nghiệm cho ta thấy muốn đảm bảo tính tin cậy tối đa của bài trắc nghiệm ta cần phải:
1) Giảm thiểu các yếu tố may rủi. Một trong cách giảm các yếu tố may rủi là cố gắng hạn chế việc sử dụng các loại câu hai lựa chọn.
2) Viết những lời chỉ dẫn sao cho thật rõ ràng để học sinh khỏi phải nhầm lẫn.
3) Chuẩn bị trước bản chấm điểm ghi rõ các câu đúng. Nên tham khảo với các đồng nghiệp về những câu được cho là đúng, nhất là những câu thuộc loại điền khuyết.
Người ta có thể tính độ tin cậy của bài trắc nghiệm bằng các cách sau đây:
Phương pháp trắc nghiệm - trắc nghiệm lại: có nghĩa là dùng một bài trắc nghiệm cho một nhóm TS làm hai lần và tính hệ số tương quan giữa hai bộ điểm. Phương pháp này co nhược điểm là: các đáp án của TS trong lần thứ hai không độc lập với lần thứ nhất, trình độ của TS trong lần thứ hai đã có sự thay đổi.
Phương pháp các bài TN tương đương: cho một nhóm TS làm hai bài TN tương đương rồi tính độ tương quan giữa hai bộ điểm số. Sẽ gây khó khăn trong việc soạn thảo các đề TN tương đương thực sự.
Phương pháp phân đôi bài TN: chính là tạo 2 bài TN tương, mỗi bài là một nửa bài TN. Để hai nửa bài thực sự tương đương, người ta sắp xế._.
Các file đính kèm theo tài liệu này:
- V0040.doc