Luận án Bồi dưỡng cho sinh viên sư phạm năng lực thiết kế công cụ đánh giá năng lực trong dạy học vật lí

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI NGUYỄN THỊ DIỆU LINH BỒI DƯỠNG CHO SINH VIÊN SƯ PHẠM NĂNG LỰC THIẾT KẾ CÔNG CỤ ĐÁNH GIÁ NĂNG LỰC TRONG DẠY HỌC VẬT LÍ Chuyên ngành: Lí luận và phương pháp dạy học bộ môn Vật lí Mã số: 9.14.01.11 LUẬN ÁN TIẾN SĨ KHOA HỌC GIÁO DỤC NGƯỜI HƯỚNG DẪN KHOA HỌC: GS. TS. ĐỖ HƯƠNG TRÀ Hà Nội- 2021 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, các kết quả của luận án là trung thực và chưa từng được ai công bố tro

docx174 trang | Chia sẻ: huong20 | Ngày: 15/01/2022 | Lượt xem: 389 | Lượt tải: 0download
Tóm tắt tài liệu Luận án Bồi dưỡng cho sinh viên sư phạm năng lực thiết kế công cụ đánh giá năng lực trong dạy học vật lí, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ng bất kì công trình nào khác. Tác giả luận án Nguyễn Thị Diệu Linh LỜI CẢM ƠN Luận án được hoàn thành tại Bộ môn Lí luận và Phương pháp dạy học Vật lí, Khoa Vật lí, Trường Đại học Sư phạm Hà Nội. Trong quá trình nghiên cứu tôi đã nhận được những sự giúp đỡ vô cùng quý báu của các tập thể và cá nhân. Tôi xin bày tỏ lòng biết ơn sâu sắc đến cô giáo hướng dẫn khoa học: GS.TS. Đỗ Hương Trà đã tận tâm giúp đỡ, hướng dẫn tôi trong quá trình nghiên cứu, thực hiện đề tài. Tôi xin chân thành cảm ơn tập thể bộ môn Phương pháp dạy học Vật lí, khoa Vật lí, Phòng sau đại học, Ban Giám hiệu trường Đại học Sư phạm Hà Nội đã tạo mọi điều kiện cho tôi học tập, nghiên cứu và hoàn thành luận án. Tôi xin chân thành cảm ơn các em SV trường Đại học Sư phạm Hà Nội, đã tham gia vào quá trình khảo sát và thực nghiệm sư phạm, các giáo viên phổ thông đã làm phiếu điều tra và cung cấp các thông tin để luận án được hoàn thiện hơn. Tôi xin chân thành cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động viên, khuyến khích tôi trong suốt quá trình học tập và nghiên cứu. Hà Nội, ngày tháng năm 2021 Nguyễn Thị Diệu Linh DANH MỤC CÁC HÌNH DANH MỤC CÁC BẢNG Bảng 1. 1 Các mô hình của năng lực đánh giá 8 Bảng 1. 2 Các tiêu chí liên quan đến NL thiết kế CCĐG năng lực nằm trong các chuẩn nghề nghiệp của GV. 10 Bảng 1. 3 Tần suất xuất hiện các tiêu chí thuộc các chủ đề theo thời gian 11 Bảng 1.4. So sánh các thành tố NL của các mô hình NLĐG của GV 15 Bảng 2.1. So sánh các bước trong các quy trình thiết kế CCĐG 38 Bảng 2.2. Các mức độ năng lực thiết kế CCĐG năng lực 43 Bảng 2.3. Nội dung, phương pháp, đối tượng điều tra 44 Bảng 2.4. Trung bình và độ lệch chuẩn mức độ tự tin của SV ở các CSHV 49 Bảng 3.1. Tiêu chí chất lượng của NL thiết kế CCĐG năng lực 72 Bảng 3.2. Các mức độ của đường phát triển NL thiết kế CCĐG năng lực 85 Bảng 3.3. Kế hoạch bồi dưỡng NL thiết kế CCĐG năng lực 90 Bảng 4.1. Thống kê đầu vào của các lớp TN 99 Bảng 4.2. Các công cụ đánh giá được sử dụng 95 Bảng 4.3. Kế hoạch TNSP vòng 1 101 Bảng 4.4. Các công cụ đánh giá được sử dụng trong TNSP vòng 1 103 Bảng 4.5. Số bài tập SV tự lực biên soạn được để ĐGNL thiết kế PATN 105 Bảng 4.6. Các công cụ đánh giá được sử dụng trong TNSP vòng 2 124 Bảng 4.7. Dữ liệu để ĐG về tính hữu ích của tài liệu và các nguyên tắc 124 Bảng 4.8. Cách SV đã sử dụng các tài liệu chính của khóa học 129 Bảng 4.9. Điểm kiểm tra NL thiết kế CCĐGNL trao đổi thông tin của một số SV 136 Bảng 4.10. Kết quả so sánh từng chỉ số hành vi của NL thiết kế CCĐGNL 137 BẢNG CÁC CỤM TỪ VIẾT TẮT STT Chữ viết tắt Đọc là ĐG Đánh giá CCĐG Công cụ đánh giá NVĐG Nhiệm vụ đánh giá NL Năng lực NLĐG Năng lực đánh giá NLTN Năng lực thực nghiệm ĐGNL Đánh giá năng lực TN Thực nghiệm TK Thiết kế SVSP Sinh viên sư phạm GV Giáo viên SV SV HS Học sinh HSHT Hồ sơ học tập GD&ĐT Giáo dục và đào tạo LATS Luận án tiến sỹ NC Nghiên cứu TNSP Thực nghiệm sư phạm MỤC LỤC DANH MỤC CÁC HÌNH 4 DANH MỤC CÁC BẢNG 6 MỤC LỤC 8 MỞ ĐẦU 1 1. Tính cấp thiết của đề tài 1 2. Mục tiêu nghiên cứu 4 3. Giả thuyết nghiên cứu 4 4. Đối tượng nghiên cứu và phạm vi nghiên cứu 4 5. Phương pháp nghiên cứu 4 6. Nhiệm vụ nghiên cứu 5 7. Những đóng góp mới của luận án 5 CHƯƠNG 1. TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU 6 1.1 Các mô hình NL thiết kế CCĐG năng lực của GV và SV 6 1.1.1 Khái niệm năng lực thiết kế công cụ đánh giá năng lực: 7 1.1.2. Năng lực thiết kế CCĐG năng lực trong các chuẩn về NLĐG của GV 8 1.1.3. Năng lực thiết kế CCĐG năng lực trong các nghiên cứu 13 1.2. Các nghiên cứu về việc bồi dưỡng NLĐG cho GV và SVSP 16 1.2.1. Hướng nghiên cứu tập trung vào tiếp cận dạy học dựa trên nội dung 17 1.2.2. Hướng nghiên cứu chú trọng đến kĩ thuật dạy học 17 1.2.3. Hướng nghiên cứu nhấn mạnh tầm quan trọng của việc gắn kết lí thuyết với thực hành, tạo cơ hội để GV và SVSP học qua trải nghiệm 18 1.2.4. Hướng nghiên cứu quan tâm đến việc thúc đẩy sự phát triển về siêu nhận thức của người học 21 1.3. Các công cụ đo lường NLĐG của GV 22 CHƯƠNG 2. CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN CỦA VIỆC PHÁT TRIỂN NĂNG LỰC THIẾT KẾ CÔNG CỤ ĐÁNH GIÁ NĂNG LỰC 27 2.1. Công cụ đánh giá 27 2.1.1. Khái niệm công cụ đánh giá 27 2.1.2. Yêu cầu đối với công cụ đánh giá 29 2.2. Đánh giá năng lực 32 2.2.1. Khái niệm năng lực 32 2.2.2. Đặc trưng của đánh giá năng lực 34 2.2.3. Quy trình thiết kế công cụ ĐGNL 35 2.3. Năng lực thiết kế công cụ ĐGNL 38 2.4. Cơ sở thực tiễn của việc bồi dưỡng NL thiết kế CCĐG năng lực 40 2.4.1.Việc thiết kế CCĐG năng lực của GV 41 2.4.2. Việc bồi dưỡng NL thiết kế CCĐG năng lực cho GV 42 2.4.3. Nhận thức của SV khoa vật lí về ĐGNL 43 2.4.4. Việc thiết kế CCĐG năng lực của SVSP 44 2.4.5. Việc bồi dưỡng NL thiết kế CCĐG năng lực 46 2.4.6. Những đặc điểm của SVSP vật lí cần lưu ý khi bồi dưỡng NL thiết kế CCĐG năng lực: 48 KẾT LUẬN CHƯƠNG 2 50 CHƯƠNG 3. XÂY DỰNG MÔ HÌNH NĂNG LỰC THIẾT KẾ CÔNG CỤ ĐÁNH GIÁ NĂNG LỰC VÀ QUY TRÌNH BỒI DƯỠNG CHO SV SƯ PHẠM 52 3.1. Xây dựng mô hình của NL thiết kế CCĐG năng lực của SV sư phạm: 52 3.1.1. Xác định các chỉ số hành vi của NL thiết kế CCĐG năng lực 53 3.1.2. Xác định các tiêu chí chất lượng của NL thiết kế CCĐG năng lực 55 3.2. Thiết kế CCĐG năng lực thiết kế CCĐG năng lực 60 3.2.1. Thiết kế bài tập đánh giá năng lực thiết kế công cụ ĐGNL 60 3.2.2 Xây dựng rubric ĐGNL thiết kế CCĐG năng lực 65 3.2.3. Thử nghiệm công cụ 66 3.3. Xây dựng đường phát triển NL thiết kế CCĐG năng lực của SV Sư phạm: 67 3.4. Đề xuất các nguyên tắc bồi dưỡng năng lực thiết kế công cụ ĐGNL cho SVSP 72 3.4.1. Mục tiêu của khóa học 72 3.4.2. Các nguyên tắc bồi dưỡng năng lực thiết kế công cụ ĐGNL cho SVSP: 73 3.5 Xây dựng quy trình bồi dưỡng cho SVSP năng lực thiết kế CCĐG năng lực 83 3.5.1 Quy trình bồi dưỡng cho SVSP năng lực thiết kế CCĐG năng lực 84 3.5.2 Chương trình bồi dưỡng chi tiết trên lớp và bài tập về nhà 87 KẾT LUẬN CHƯƠNG 3 92 CHƯƠNG 4. THỰC NGHIỆM SƯ PHẠM 93 4.1. Mục đích thực nghiệm sư phạm 93 4.2. Đối tượng và thời gian thực nghiệm sư phạm 93 4.3. Đánh giá trong thực nghiệm sư phạm 94 4.3. Thực nghiệm sư phạm vòng 1 97 4.3.1. Kế hoạch thực nghiệm sư phạm vòng 1 97 4.3.2. Phân tích định tính kết quả TNSP vòng 1 100 4.3.3. So sánh kết quả TNSP vòng 1 giữa nhóm đối chứng và nhóm thực nghiệm 118 4.4. Thực nghiệm sư phạm vòng 2 120 4.4.1. Kế hoạch thực nghiệm sư phạm vòng 2 120 4.4.2. Đánh giá tính hữu ích của tài liệu và các nguyên tắc 121 4.4.3. Đánh giá thái độ của SV sau khi học đối với việc thiết kế CCĐG 127 4.4.4. Đánh giá mức độ đạt mục tiêu của khóa học về NL thiết kế công cụ ĐGNL 131 4.5. Đánh giá chung sau TNSP vòng 2 142 KẾT LUẬN CHƯƠNG 4 144 KẾT LUẬN VÀ KHUYẾN NGHỊ 147 DANH MỤC CÔNG TRÌNH CÔNG BỐ CỦA TÁC GIẢ 151 TÀI LIỆU THAM KHẢO 152 MỞ ĐẦU 1. Tính cấp thiết của đề tài Để đào tạo được những công dân thế kỉ 21, đáp ứng yêu cầu hội nhập quốc tế, nước ta đang đổi mới toàn diện cả chương trình, phương pháp tổ chức dạy học và kiểm tra ĐG kết quả trong quá trình dạy học mỗi môn học. Nghị quyết Hội nghị Trung ương 8 khóa XI về đổi mới căn bản, toàn diện GD và đào tạo nêu rõ: “Đổi mới căn bản hình thức và phương pháp thi, kiểm tra và ĐG kết quả GD, đào tạo, bảo đảm trung thực, khách quan. Việc thi, kiểm tra và ĐG kết quả GD, đào tạo cần từng bước theo các tiêu chí tiên tiến được xã hội và cộng đồng GD thế giới tin cậy và công nhận”. Chương trình giáo dục phổ thông 2018 đã đưa ra những định hướng ĐG kết quả giáo dục nhằm phát triển phẩm chất, NL học sinh. Để quá trình đổi mới này thành công, năng lực kiểm tra đánh giá của GV đóng vai trò rất quan trọng. Đặc biệt, để phù hợp với kết quả giáo dục mong muốn trong khung chương trình giảng dạy, giáo viên phải có năng lực trong việc đánh giá năng lực của học sinh đối với các môn học chính và một số năng lực thiết yếu của thế kỷ 21 như sáng tạo, tư duy phản biện, giải quyết vấn đề, giao tiếp, hợp tác và tự học. Nhiều NC thực nghiệm đã chỉ ra những chuyển biến tích cực ở học sinh khi bồi dưỡng cho GV năng lực ĐG nói chung và NL thiết kế CCĐG năng lực nói riêng. Năm 1998, trong NC tổng hợp 250 NC thực nghiệm về mối liên hệ giữa việc sử dụng ĐG quá trình và thành tích HS, Black và Wiliam đã chỉ ra: ĐG quá trình của GV đã dẫn đến sự tăng đáng kể về điểm số thành tích học sinh trong các kỳ thi chuẩn hóa. Các tính toán trong NC này còn cho thấy tác động của việc ĐG quá trình lớn hơn hầu hết các can thiệp khác về GD. Kết quả này đã khiến cho hai ông đưa ra khuyến nghị: chương trình bền vững để phát triển NL cho hàng ngàn HS là phát triển NLĐG của GV [30]. Nghiên cứu tổng hợp của Hattie (2007) khám phá tác động đối với việc học của hơn 100 NC về các biện pháp can thiệp trong GD. NC này đã cung cấp bằng chứng thực nghiệm để thấy rằng việc ĐG của GV là những can thiệp có ảnh hưởng nhất trong việc cải thiện việc học tập của học sinh. Dựa trên những kết quả này, các chiến lược ĐG của GV được cho là thành phần quan trọng nhất của việc học và dạy hiệu quả. Ngoài ra, NC này cũng cho thấy những GV tham gia các hoạt động phát triển NLĐG đã tạo ra những hiệu quả cao hơn [83]. Công trình của Black & Wiliam (1999) và Hattie (2008) đã cung cấp bằng chứng thực nghiệm mạnh để khẳng định rằng các biện pháp sử dụng ĐG đã tạo ra những tác động có ảnh hưởng nhất đến sự tiến bộ trong học tập của học sinh [30, 31, 33, 85]. Trong các NC này, các tác giả đã so sánh định lượng một số lượng lớn các biện pháp GD và giải thích tác động của các biện pháp này đến thành tích của học sinh. Cả hai NC đều đạt được mức độ tin cậy cao và cùng với các NC khác đã tiếp tục khẳng định vai trò của các hoạt động ĐG của GV trong việc cải thiện kết quả học tập của học sinh [28, 29, 32, 112, 122, 25, 140]. Ở Việt Nam, NC khảo sát trên giảng viên và 150 SV trường Đại học Sư phạm – Đại học Thái Nguyên đã chỉ ra rằng: để việc ĐG đem lại những hiệu quả tích cực cho người học, NLĐG của GV là yếu tố quyết định [7]. Vì vậy, có thể suy ra rằng việc bồi dưỡng NLĐG cho GV và SVSP có vai trò quan trọng trong việc cải thiện kết quả học tập của học sinh. Tuy nhiên, các NC về ĐG lớp học chỉ ra rằng: nhiều GV chưa được đào tạo đầy đủ và chuẩn bị tốt để thực hiện, quản lí và giải thích kết quả ĐG [2, 159]. Nhìn chung, GV chưa có kĩ năng ĐG quá trình nên họ thường sử dụng những phương pháp đánh giá trên giấy mà họ quen thuộc. Hơn nữa, để đánh giá HS, GV thường đưa ra các nhiệm vụ ở trình độ nhận thức thấp nên việc ĐG của GV chưa phù hợp với các mục tiêu dạy học, khiến việc dạy học phát triển năng lực bị chệch hướng. Nhiều GV cũng nhận thấy chất lượng của việc ĐG của họ không tốt. Hơn nữa, các SVSP chịu ảnh hưởng sâu sắc từ việc “học qua quan sát” trong thời gian dài khi họ thường là những HS thành công ở trường phổ thông [2, 3, 34, 113]. Ở Việt Nam, thông tư số 26 nêu rõ “Kiểm tra, đánh giá thường xuyên được thực hiện trong quá trình dạy học và giáo dục. Kiểm tra, đánh giá thường xuyên được thực hiện theo hình thức trực tiếp hoặc trực tuyến thông qua: hỏi - đáp, viết, thuyết trình, thực hành, thí nghiệm, sản phẩm học tập”. Với yêu cầu đó, cần phải vận dụng nhiều hình thức kiểm tra đánh giá còn mới đối với đa số GV hiện nay, khiến họ gặp không ít khó khăn. Việc bồi dưỡng NLĐG cho GV và SVSP đã trở thành vấn đề trọng tâm trong nền GD của nước ta cũng như của nhiều nước trên thế giới. Nhận thức được tầm quan trọng của việc tăng cường đổi mới KTĐG thúc đẩy đổi mới PPDH, trong những năm qua, Bộ GDĐT đã tập trung chỉ đạo đổi mới các hoạt động này nhằm tạo ra sự chuyển biến cơ bản về tổ chức hoạt động dạy học [11]. Gần đây, có nhiều đợt tập huấn về đổi mới KTĐG theo định hướng phát triển NL học sinh. Nhằm hỗ trợ cán bộ quản lý giáo dục, GV về nhận thức và NL thiết kế công cụ KTĐG kết quả học tập của học sinh theo định hướng NL, Vụ Giáo dục Trung học phối hợp với Chương trình phát triển GD trung học tổ chức biên soạn tài liệu “Kiểm tra, ĐG trong quá trình dạy học theo định hướng phát triển NL học sinh” và tập huấn cán bộ quản lý giáo dục và GV trong cả nước về đổi mới KTĐG theo định hướng phát triển NL học sinh trường THPT. Cục Nhà giáo cũng đã phối hợp với chương trình READ tổ chức những đợt tập huấn giảng viên cốt cán về khung ĐGNL người học. Nhằm phát triển các trường sư phạm để nâng cao năng lực đội ngũ giáo viên và cán bộ quản lý cơ sở giáo dục phổ thông, chương trình ETEP đang được thực hiện cũng chú trọng bồi dưỡng NLĐG cho GV và cán bộ quản lý. Thông thường, các đợt tập huấn chỉ tập trung vào việc học các kiến thức, và các thủ tục của việc thiết kế nhiệm vụ và phát triển phiếu đánh giá. Do đó, kết quả bồi dưỡng thực tế còn hạn chế. Qua khảo sát các GV cốt cán trong các đợt tập huấn do Vụ Giáo dục Trung học tổ chức năm 2014 và một số SV tốt nghiệp khoa Vật lý trường Đại học Sư phạm Hà Nội năm 2015, chúng tôi nhận thấy các SV và GV gặp rất nhiều khó khăn khi thiết kế CCĐG năng lực học sinh [5]. Loughran (2006) khẳng định rằng phương pháp được sử dụng trong đào tạo giáo viên là yếu tố chủ yếu làm thay đổi quan niệm và việc thực hành của SVSP, vốn đã được phát triển “từ những năm học nghề thông qua quan sát” [103]. Đối với nhiều SVSP, những năm quan sát này thường đem lại những trải nghiệm tiêu cực về hoạt động ĐG từ cách thức đo lường truyền thống trong đó chủ yếu nhấn mạnh đến các quy trình đánh giá tổng kết [57, 172]. Để thay đổi nhận thức và thực hành của các SVSP, các nghiên cứu này đã thừa nhận rằng các phương pháp sư phạm được sử dụng trong đào tạo giáo viên hiệu quả phải liên quan đến khái niệm giảng dạy rõ ràng, bắt nguồn từ nghiên cứu và nằm trong bối cảnh thực tiễn. Do đó, nếu không có các phương pháp bồi dưỡng NLĐG dựa trên các NC, người ta lo ngại rằng các giáo viên tương lai sẽ sử dụng các chiến lược ĐG giống như các chiến lược ĐG mà họ đã sử dụng khi còn là người học, ít tích hợp các PPĐG hiện đại và sẽ tiếp tục sử dụng triết lý ĐG bắt nguồn từ các giả định và lí thuyết truyền thống [109]. Ở Việt Nam đã có một số NC bồi dưỡng NLĐG cho SVSP trong dạy học toán học và sinh học [8,9]. Tuy nhiên, các NC đề cập đến việc chuẩn bị cho SV sư phạm cách thức tiến hành hoạt động ĐG hoặc sử dụng mô hình NL khoa học để ĐG năng lực khoa học của HS theo quan điểm PISA. Chưa có những giải pháp hỗ trợ SVSP vượt qua nhiều khó khăn khi thiết kế CCĐG năng lực HS. Với mong muốn góp phần đổi mới hoạt động kiểm tra đánh giá, qua đó thúc đẩy việc đổi mới phương pháp dạy học, chúng tôi chọn đề tài nghiên cứu: “Bồi dưỡng cho sinh viên sư phạm năng lực thiết kế công cụ đánh giá năng lực trong dạy học vật lí”. 2. Mục tiêu nghiên cứu Xây dựng mô hình NL thiết kế CCĐG năng lực trong dạy học vật lý, đề xuất các nguyên tắc sư phạm dựa trên quan điểm dạy học hiện đại nhằm bồi dưỡng NL thiết kế CCĐG năng lực cho SV sư phạm vật lý. 3. Giả thuyết nghiên cứu Dựa trên quan điểm dạy học hiện đại có thể xây dựng được mô hình NL thiết kế CCĐG năng lực và xác định được các nguyên tắc sư phạm nhằm bồi dưỡng NL thiết kế CCĐG năng lực trong dạy học vật lí cho SVSP. 4. Đối tượng nghiên cứu và phạm vi nghiên cứu Đối tượng NC: mô hình và CCĐG, các nguyên tắc sư phạm bồi dưỡng NL thiết kế CCĐG năng lực của SVSP vật lí Phạm vi NC: mô hình và CCĐG năng lực thiết kế CCĐG năng lực của SVSP vật lí, hoạt động dạy và hoạt động học khi bồi dưỡng NL thiết kế CCĐG năng lực của SV Sư phạm. 5. Phương pháp nghiên cứu Luận án sử dụng phối hợp các phương pháp nghiên cứu sau: Nghiên cứu sử dụng các PPNC lí thuyết (phân tích, tổng hợp; phân loại và hệ thống hóa lí thuyết) để nghiên cứu tổng quan và cơ sở lý luận về NL, NL thiết kế công cụ ĐGNL và bồi dưỡng NLĐG cho GV và SVSP. Nghiên cứu sử dụng các PP điều tra, phỏng vấn, quan sát để NC thực tiễn của việc bồi dưỡng NL thiết kế CCĐG năng lực của GV và SVSP Vật lí. Nghiên cứu sử dụng PP thực nghiệm sư phạm và phương pháp thống kê toán học để kiểm tra tính hữu ích của các nguyên tắc sư phạm về mặt bồi dưỡng NL thiết kế CCĐG năng lực trong học tập vật lí cho SVSP, để xác định độ giá trị và độ tin cậy của mô hình và CCĐG năng lực thiết kế CCĐG năng lực. 6. Nhiệm vụ nghiên cứu 1. Tổng quan các NC và nghiên cứu cơ sở lý luận về khái niệm và cấu trúc của NL thiết kế công cụ ĐG NL, các giải pháp bồi dưỡng NLĐG cho GV và SVSP, các CCĐG năng lực thiết kế CCĐG năng lực của GV và SVSP. 2. Điều tra thực trạng về NL thiết kế CCĐG năng lực của GV và SVSP Vật lí. 3. Nghiên cứu xác định cấu trúc của NL thiết kế công cụ ĐGNL và các nguyên tắc sư phạm nhằm bồi dưỡng NLĐG cho SVSP vật lí; Thiết kế các mô đun học tập đáp ứng các nguyên tắc sư phạm; Trên cơ sở các mô đun đó, xây dựng tài liệu bồi dưỡng NL thiết kế CCĐG năng lực; Xây dựng CCĐG năng lực thiết kế CCĐG năng lực. 4. Thực nghiệm sư phạm nhằm đánh giá giả thuyết khoa học của đề tài từ đó rút ra các kết luận và khuyến nghị liên quan đến việc bồi dưỡng cho SVSP vật lí NL thiết kế CCĐG năng lực. 7. Những đóng góp mới của luận án - Xác định mô hình của NL thiết kế CCĐG năng lực. - Xác định một số nguyên tắc và quy trình bồi dưỡng NL thiết kế CCĐG năng lực cho SVSP vật lí. - Thiết kế một số công cụ nhằm đánh giá SVSP về NL thiết kế CCĐG năng lực. - Xây dựng tài liệu sử dụng trong đào tạo NL thiết kế công cụ ĐGNL cho SVSP. CHƯƠNG 1. TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU Để xác định rõ những vấn đề cần giải quyết trong phạm vi của luận án và những điểm mà NC cần lưu ý, nhiệm vụ đặt ra trong phần tổng quan là: Tìm hiểu các mô hình NL thiết kế CCĐG năng lực của GV và SVSP. Tìm hiểu các NC về bồi dưỡng NLĐG cho GV và SVSP. Tìm hiểu các NC về các CCĐG năng lực thiết kế CCĐG năng lực của GV và SVSP. 1.1 Các mô hình NL thiết kế CCĐG năng lực của GV và SV Trong nghiên luận án, mô hình được hiểu là toàn bộ khái niệm và cấu trúc của NL gồm các NL thành tố, CSHV và tiêu chí chất lượng. Do đó, việc tìm kiếm và phân tích tài liệu được thực hiện với tất cả các thành phần của mô hình. Cách tìm kiếm và lựa chọn tài liệu: Trước tiên, chúng tôi tiến hành tìm kiếm tài liệu để xác định mô hình NL thiết kế CCĐG năng lực. Từ khóa tiếng Anh được sử dụng để tìm kiếm là sự kết hợp của các từ: ‘framework”, “structure” hoặc “model” hoặc “standard” hoặc “theory”; ‘‘design’’, “process” hoặc “steps” hoặc “develop”; ‘‘assessment competence’’ hoặc ‘‘assessment competency’’ hoặc ‘‘assessment literacy’’, “tool” hoặc “instrument” hoặc “task” hoặc “scale”; ‘‘preservice teacher’’ hoặc ‘‘teacher candidate’’ hoặc “teacher student”. Chúng tôi đã sử dụng các cơ sở dữ liệu chính cho NC giáo dục bao gồm ERIC, Science Direct và Google Scholar và tìm kiếm các ấn phẩm viết bằng tiếng Anh từ năm 1987 đến nay. Từ khóa tiếng Việt có nghĩa tương tự cũng được sử dụng để tìm kiếm trong các thư viện lớn, các thư mục tạp chí về GD và cổng thông tin luận án trên trang web các trường đại học ở Việt Nam. Để giảm khả năng thiên lệch, chúng tôi đã xem xét tất cả các ấn phẩm có liên quan. Việc tìm kiếm thêm dựa vào tham chiếu ngược và xin ý kiến tư vấn của các chuyên gia trong lĩnh vực này. Một số cuốn sách của các tác giả nổi tiếng cũng được coi là nguồn thứ cấp để qua đó chúng tôi tìm đến những công bố ban đầu, là cơ sở để viết các cuốn sách đó [76]. Chúng tôi lựa chọn các mô hình NLĐG trong đó bao gồm NL thiết kế CCĐG năng lực. Khi phân tích những mô hình trên, trước hết chúng tôi làm rõ khái niệm NL thiết kế CCĐG năng lực, sau đó xem xét các mô hình đó để xác định những điểm cần lưu ý khi xây dựng mô hình NL thiết kế CCĐG năng lực. 1.1.1 Khái niệm năng lực thiết kế công cụ đánh giá năng lực: Năng lực thiết kế CCĐG năng lực chính là một năng lực thành phần của NLĐG thông qua định nghĩa được cung cấp bởi Trung tâm nghiên cứu giáo dục của Mĩ: “Năng lực đánh giá là sự sẵn sàng của một nhà GD để thiết kế, thực hiện và thảo luận các chiến lược đánh giá” [133]. Điều này cũng có thể thấy qua việc xem xét hai tài liệu khá phổ biến, có thể xem như đại diện cho chuẩn NL của GV và mô hình NLĐG trong các NC. Đó là Tiêu chuẩn về NLĐG của GV của Bộ Giáo dục Mĩ (1990) [14] và mô hình NLĐG của Stiggins (1999) [158]. Bảng 1. 1 Các mô hình của năng lực đánh giá Bảy tiêu chuẩn về năng lực của GV về đánh giá của Bộ Giáo dục Mĩ (1990) Mô hình năng lực đánh giá của Stiggins (1999) 1. Có kỹ năng trong việc lựa chọn các PPĐG thích hợp cho các quyết định dạy học. 2. Có kỹ năng phát triển các PPĐG thích hợp cho các quyết định dạy học. 3. Có kỹ năng quản lý, chấm điểm và giải thích các kết quả của các PPĐG do GV đánh giá và cả ĐG ngoài. 4. Có kỹ năng sử dụng các kết quả ĐG khi ra quyết định về từng cá nhân học sinh, lập kế hoạch giảng dạy, phát triển chương trình học và cải tiến trường học. 5. Có kỹ năng để phát triển các quy trình chấm điểm học sinh phù hợp sử dụng các bài ĐG của học sinh. 6. Có kỹ năng truyền đạt kết quả ĐG cho học sinh, phụ huynh, các công dân khác và các nhà giáo dục khác. 7. Có NL nhận ra các PPĐG không chính xác, bất hợp pháp và không thích hợp và sử dụng thông tin ĐG. 1. Kết nối các ĐG nhằm mục đích rõ ràng 2. Làm rõ những thành tựu đạt được 3. Áp dụng các PPĐG thích hợp 4. Phát triển các bài tập ĐG chất lượng, các tiêu chí ĐG và lấy mẫu một cách thích hợp 5. Tránh thiên vị trong ĐG 6. Giao tiếp hiệu quả về thành tích của học sinh 7. Sử dụng ĐG như một biện pháp tác động vào dạy học Bảng 1.1 cho thấy các thành tố NL 1,2,3,4 trong mô hình NLĐG của Stiggins và các tiêu chuẩn 1,2,3 và 5 của Bộ Giáo dục Mĩ đều là các NL thành tố của NL thiết kế CCĐG. Từ đó, chúng tôi định nghĩa: NL thiết kế CCĐG năng lực là khả năng kết nối các đánh giá với mục đích rõ ràng, áp dụng các phương pháp đánh giá phù hợp, phát triển các nhiệm vụ đánh giá chất lượng và tiêu chí ĐG phù hợp với mục đích ĐG. 1.1.2. Năng lực thiết kế CCĐG năng lực trong các chuẩn về NLĐG của GV Chuẩn NLĐG của GV là một thành phần không thể thiếu trong các chuẩn nghề nghiệp của GV được sử dụng ở một số quốc gia. Chúng tôi lựa chọn các chuẩn nghề nghiệp của GV Việt Nam và các quốc gia thuộc sáu khu vực nói tiếng Anh (Úc, Canada, New Zealand, Anh, Mỹ và châu Âu). Sáu khu vực này đã có những cam kết về tiến bộ trong chính sách, NC và thực hành ĐG lớp học (từ năm 2001) tại Hội nghị chuyên đề quốc tế về ĐG lớp học với các nhà lãnh đạo về ĐG trong Hiệp hội quốc tế các nhà NC trong ĐG lớp học. Các quốc gia này có các tài liệu chuyên đề để định hướng và hướng dẫn thực hành trong lĩnh vực ĐG lớp học. Trong các quốc gia và khu vực nói trên, các tiêu chuẩn liên quan đến NLĐG được chọn một cách có hệ thống bằng cách xem xét: (a) các trang web của các cơ quan trực thuộc liên bang hoặc chính phủ; (b) các hiệp hội NC về ĐG cấp quốc gia hoặc liên bang, các hiệp hội và các ủy ban tư vấn; và (c) các hiệp hội đào tạo GV quốc gia và khu vực. Chỉ các chính sách cấp quốc gia hoặc liên bang trong đó trình bày rõ các chuẩn NL của GV (mà chúng tôi gọi tắt là chuẩn) mới được chọn cho phân tích này. Có tổng cộng 14 bộ chuẩn được chọn (xem bảng 1.2). Với các chuẩn này, chúng tôi tiến hành phân tích chủ đề theo thời gian và theo không gian để thấy xu thế phát triển của mô hình NL thiết kế CCĐG năng lực. 1.1.2.1. Phân tích NL thiết kế CCĐG năng lực trong các chuẩn theo thời gian Trên cơ sở xác định các điểm chung của các tiêu chí trong các chuẩn, NC đã sắp xếp các tiêu chí thành 3 chủ đề. Đó chính là các chủ đề đại diện cho các khía cạnh của NL thiết kế CCĐG năng lực được đề cập trong khái niệm ở mục 1.1.1: (chủ đề 1) xác định mục đích và mục tiêu ĐG; (chủ đề 2) áp dụng các PPĐG; (chủ đề 3) phát triển các NVĐG và tiêu chí chấm điểm. Trong đó, việc kết nối các ĐG với mục đích liên quan đến việc xác định các mục đích, mục tiêu ĐG phù hợp với đối tượng, tình huống ĐG. Việc áp dụng các PPĐG chính là việc lựa chọn hình thức ĐG phù hợp dựa trên các mục đích và mục tiêu ĐG đã nêu rõ ràng. Xây dựng các NVĐG chất lượng và tiêu chí ĐG bao gồm việc xây dựng các NVĐG và tiêu chí chấm điểm, xác định các thuộc tính tâm lý của ĐG (ví dụ: độ giá trị và độ tin cậy) đảm bảo rằng các điều kiện ĐG công bằng với sự đa dạng của người học. Bảng 1. 2 Các tiêu chí liên quan đến NL thiết kế CCĐG năng lực nằm trong các chuẩn nghề nghiệp của GV. Tên tài liệu Nước Số tiêu chuẩn và hướng dẫn liên quan Tần suất xuất hiện chủ đề 1 (%) Tần suất xuất hiện chủ đề 2 (%) Tần suất xuất hiện chủ đề 3 (%) Tần suất xuất hiện tiêu chí của NL thiết kế CCĐG NL (%) Tiêu chuẩn về NL của GV trong ĐGHS (AFT 1990) [15] Mĩ 7 14,3 21,1 42,3 77,7 Nguyên tắc thực hành ĐG HS công bằng cho giáo dục ở Canada (JAC 1993) [88] Canada 5 25,0 30,3 15,1 55,3 Trách nhiệm nghề nghiệp trong đo lường (NCME 1995) [125] Mĩ 8 3,5 6,8 31,4 41,7 Hướng dẫn cho ĐG công bằng và chất lượng (ACACA 1995) [19] Úc 20 10,0 18,0 50,0 78 Tiêu chuẩn kiểm tra giáo dục và tâm lý (AERA et al. 1999) [14] Mĩ 16 31,2 6,5 57,0 94,7 Những gì GV nên biết và có thể làm được (NBPTS 2001) [123] Mĩ 5 2,9 8,4 0 11,3 Thay đổi thực tiễn ĐG: Quy trình, nguyên tắc và tiêu chuẩn (ARG 2008) [17] Anh 4 10,9 50,3 14,4 75,6 Tiêu chuẩn nghề nghiệp để các tổ chức công nhận sự chuẩn bị của GV (NCATE 2008) [124] Anh 6 0 10,1 4,5 14,6 Tiêu chuẩn tốt nghiệp của GV (Hội đồng GV New Zealand 2008) [127] New Zealand 7 3,4 3,4 0 6,8 Các tiêu chuẩn giảng dạy cốt lõi của mô hình Hiệp hội Đánh giá và hỗ trợ GV liên bang: Tài nguyên cho đối thoại nhà nước (InTASC 2011) [85] Mĩ 10 3,4 10,6 7,9 21,9 Tiêu chuẩn nghề nghiệp GV Úc (Bộ giáo dục Úc 2012) [62] Úc 7 5,4 9,1 1,5 16 Tiêu chuẩn sửa đổi dành cho GV (Bộ Giáo dục Anh 2012) [61] Anh 8 2,6 9,0 1,3 12,9 Tiêu chuẩn thực hành ĐG lớp học cho Giáo viên THPT (JCSEE 2015) [89] Mĩ 16 17,6 30,1 38,5 86,2 Chuẩn nghề nghiệp GV (Bộ Giáo dục Việt Nam 2018) [11] Việt Nam 1 2,2 2,2 0 4,4 Để có một cái nhìn toàn diện về NL thiết kế CCĐG năng lực được thể hiện trong các chuẩn, chúng tôi đã tổng hợp tất cả các tiêu chí liên quan đến NL này vào bảng 1.2. Mỗi tiêu chí xuất hiện trong 14 chuẩn GV kể trên đều được liệt kê trong bảng này. Với những tiêu chí của các chuẩn có sự trùng lặp, chúng tôi chọn tiêu chí có tính bao quát hơn để đưa vào bảng tổng hợp trên, sao cho các tiêu chí trong bảng tổng hợp không bị trùng lặp. Tần suất xuất hiện các tiêu chí liên quan đến NL thiết kế CCĐG năng lực trong mỗi chuẩn được tính theo tỉ lệ phần trăm của số các tiêu chí trên tổng số các tiêu chí của chuẩn đó. Dựa trên bảng 1.2, chúng tôi tiến hành phân tích NL thiết kế CCĐG năng lực trong các chuẩn theo thời gian và khu vực địa lí. Phân tích chủ đề với tất cả các chuẩn NLĐG theo thời gian từ năm 1990 đến nay cho thấy có những thay đổi đáng kể trong việc mô tả NL thiết kế CCĐG năng lực của GV. Chúng tôi trình bày tần suất xuất hiện các tiêu chí thuộc các chủ đề trong các giai đoạn thời gian: 1990-1999, 2000 -2009 và 2010-nay (xem bảng 1.3). Bảng 1. 3 Tần suất xuất hiện các tiêu chí thuộc các chủ đề theo thời gian 1990-1999 2000-2009 2010-nay Chủ đề 1 16,8 4,3 7,25 Chủ đề 2 16,54 18,05 14,7 Chủ đề 3 36,14 4,725 12,3 Tổng 69,48 27,075 34,25  1990-1999 Các chuẩn NLĐG từ 1990 đến 1999 tập trung nhiều vào ba chủ đề liên quan đến NL thiết kế CCĐG năng lực: 77% của AFT 1990; 55,3% của JAC 1993; 78% của ACACA 1995, 41,7% NCME 1995 và 94% AERA 1999. Các chuẩn xuất hiện trong giai đoạn này tập trung vào việc giúp GV lựa chọn và sử dụng các PPĐG, chủ yếu là ĐG tổng kết và tiêu chuẩn hóa, để đưa ra các quyết định GD công bằng về HS. Do đó, trong những năm 1990, các chuẩn NLĐG tập trung rất nhiều vào các hình thức đo lường tổng hợp, tập trung vào phát triển sự hiểu biết các thuộc tính tâm lý của ĐG. Điều này được giải thích rằng do có những phong trào về việc tăng trách nhiệm của GV trên nhiều vùng của Bắc Mỹ, nhiều kì thi tiêu chuẩn hóa được sử dụng để so sánh chất lượng học tập của HS và xem xét trách nhiệm của GV. Các chuẩn NLĐG nhấn mạnh ĐG trên diện rộng, ĐG dựa trên tiêu chí kết hợp với các thuộc tính tâm lý của ĐG theo lí thuyết đo lường (5% ACACA 1995; 2,4% NCME 1995; và 25% AERA 1999) và đạo đức ĐG (55% NCME 1995), bao gồm độ tin cậy, tính hợp lệ, định mức, công bố thông tin và bảo vệ quyền và quyền riêng tư của SV. 2000 - 2009 Trong thập kỷ tiếp theo, các chủ đề liên quan đến NL thiết kế CCĐG năng lực vẫn chiếm vị trí trung tâm trong các chuẩn nghề nghiệp của GV. Bên cạnh đó, trong cả bốn chuẩn nghề nghiệp ở giai đoạn này được chúng tôi xem xét (11,3 % NBPTS 2001; 75,6 % ARG 2008; 14,6% NCATE 2008 và 6,8% New Zealand 2008), các tiêu chí liên quan đến NL thiết kế CCĐG năng lực đã bắt đầu quan tâm đến loại hình ĐG quá trình, đặc biệt trong ARG 2008. Các tiêu chí liên quan đến ĐG quá trình đã: (a) nhấn mạnh tầm quan trọng của NL của GV đối với thực tiễn bao gồm ĐG chẩn đoán, tự ĐG và ĐG của HS, phản hồi của GV đối với HS và (b) mở rộng quan niệm về việc sử dụng ĐG tổng kết và ĐG dựa trên tiêu chí. Không chỉ các chuẩn nghề nghiệp GV, các tiêu chuẩn và hướng dẫn chứng nhận NLĐG của GV cũng nhấn mạnh tầm quan trọng của việc chuẩn bị, chứng nhận và hỗ trợ NL của GV đối với ĐG quá trình. Tuy nhiên có sự khác nhau giữa chuẩn nghề nghiệp GV và Tiêu chuẩn chứng nhận NLĐG của GV ở cùng một quốc gia. Cụ thể là, trong khi Mĩ dẫn đầu về các tiêu chuẩn chứng nhận NLĐG của GV nhấn mạnh ĐG quá trình (NBPTS 2001; NCATE 2008; InTASC 2011) thì chuẩn nghề nghiệp của Mĩ vẫn chưa có thay đổi gì so với thập kỉ trước. Mục đích ĐG, cách thực hiện của ĐG quá trình có nhiều điểm khác so với ĐG tổng kết. Do vậy, việc quan tâm đến ĐG quá trình khiến các chủ đề liên quan đến thực hiện ĐG trong lớp học, sử dụng kết quả ĐG tăng lên và kéo theo là các chủ đề của NL thiết kế CCĐG năng lực ở giai đoạn này chiếm tỉ lệ trong các chuẩn không cao bằng giai đoạn trước. Trong các chủ đề đó, chủ đề (2) áp dụng các PPĐG đã tăng lên nhiều so với các chủ đề khác của NLĐG nhưng chủ đề (3) phát triển các nhiệm vụ ĐG và tiêu chí ĐG lại giảm mạnh. Phân tích nội dung các tiêu chí thuộc chủ đề này cũng cho thấy, trong khi yêu cầu về ĐG quá trình đối với GV tăng lên thì những tiêu chí giúp GV tự ĐG trong việc thiết kế bài ĐG và tiêu chí ĐG trong ĐG quá trình chưa được quan tâm tương xứng. 2010-nay Trong những năm gần đây, các tiêu chuẩn ĐG chủ yếu nhấn mạnh vào ĐG quá trình. Các chủ đề (1) xác định mục đích và mục...a học lấy chứng chỉ về ĐG. Người sử dụng rubric xác định mức độ NLĐG của GV khi phân tích các giờ học do GV dạy được quay phim lại. Rubric tập trung vào các khía cạnh: quan điểm và cách sử dụng ĐG; chất lượng các PPĐG; mục tiêu ĐG; cơ hội tự ĐG; sửa đổi bài dạy dựa trên thông tin ĐG; phản hồi cho SV, trong đó tiêu chí về chất lượng các PPĐG mới chỉ quan tâm đến việc lựa chọn loại PPĐG, chưa có những mô tả cụ thể về chất lượng CCĐG. Koh (2011) đã dựa trên các tiêu chí chất lượng trí tuệ đích thực của Newmann để thiết kế rubric đo lường NLĐG xác thực của GV thông qua ĐG chất lượng bài kiểm tra do GV biên soạn. Rubric ĐG chất lượng bài kiểm tra có 4 mức độ tương ứng với các tiêu chí sau: độ sâu của kiến ​​thức, tư duy phê phán, vận dụng kiến thức, viết hiệu quả và tạo kết nối với thế giới thực ngoài lớp học. Nguyễn Thị Việt Nga (2015) tổng hợp một số NC về quy trình ĐG ở Việt Nam và dựa trên các thang phân loại Bloom, Dave, Simpson, Dreyfes, SOLO để thiết kế rubric ĐG các kĩ năng của SV trong ĐG PISA. Tuy nhiên, trong rubric còn sử dụng những mô tả chưa rõ ràng (Ví dụ: chưa biết, biết cách...) và việc ĐG độ tin cậy và độ giá trị của công cụ này cũng chưa được trình bày rõ [8]. Như vậy, các công cụ trước đây được thiết kế để đo lường NLĐG của GV ở các khía cạnh khác nhau và được hướng đến các mục đích khác nhau. Các khía cạnh được các công cụ này ĐG gồm: kiến thức về ĐG của GV (sử dụng các PPĐG, sử dụng các hoạt động ĐG để phân loại HS; giải thích kết quả kiểm tra tiêu chuẩn hóa và ĐG lớp học, truyền đạt kết quả ĐG và tuân thủ các nghĩa vụ pháp lý và đạo đức trong ĐG) và mức độ thành thạo trong thực hành ĐG của GV. Phần lớn các CCĐG được xây dựng dựa trên Tiêu chuẩn về NL của GV trong ĐG HS năm 1990 của Mĩ. Về mặt kiến thức về ĐG có thể thấy vẫn chưa có công cụ nào ĐG các kiến thức về việc xác định mục tiêu ĐG, biên soạn NVĐG, thử nghiệm CCĐG năng lực. Về các loại CCĐG được sử dụng gồm trắc nghiệm khách quan, thang đo Likert và rubric. Trắc nghiệm khách quan nhiều lựa chọn được sử dụng để đo lường kiến thức về ĐG của GV. Thang đo Likert được sử dụng để đo mức độ thành thạo trong thực hành ĐG của GV. Trong các công cụ này, người trả lời tự ĐG về mình nên kết quả ĐG bị ảnh hưởng nhiều bởi tính chủ quan. Kết quả này thường được dùng để thăm dò, không thể chỉ dựa vào đó để xác định NL người trả lời. Rubric là loại công cụ phù hợp để ĐGNL. Tuy nhiên, các rubric hiện có tập trung vào đo lường NL thiết kế các loại PPĐG riêng biệt (Morris, Koh) hoặc chỉ đưa ra tiêu chí ĐG chung về việc sử dụng PPĐG (Sato), chưa tập trung vào NL thiết kế CCĐG năng lực [147]. Do đó, cần phải thiết kế công cụ bao gồm các rubric và bài tập để ĐGNL thiết kế CCĐG năng lực. Một vấn đề đặt ra là: công cụ đo NL thiết kế CCĐG năng lực phải bao gồm các bài tập và rubric như thế nào để đo lường đầy đủ các CSHV trong mô hình NL thiết kế CCĐG năng lực của GV và SVSP? CHƯƠNG 2. CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN CỦA VIỆC PHÁT TRIỂN NĂNG LỰC THIẾT KẾ CÔNG CỤ ĐÁNH GIÁ NĂNG LỰC Trong chương này, để có cơ sở đề xuất giải pháp phát triển NL thiết kế CCĐG, trước hết chúng tôi phân tích các yêu cầu đối với công cụ ĐG nói chung và yêu cầu đối với CCĐG năng lực nói riêng. Trên cơ sở phân tích, tổng hợp những NC về quy trình thiết kế CCĐG trong đó chú ý đến sự phức tạp của việc biên soạn các nhiệm vụ ĐG trong ĐGNL, chúng tôi đưa ra quy trình thiết kế CCĐG năng lực nhằm giúp SVSP thiết kế được những CCĐG năng lực đảm bảo các yêu cầu phức tạp đối với CCĐG năng lực. Từ quy trình thiết kế CCĐG năng lực, sử dụng cách tiếp cận dựa trên quá trình, chúng tôi đề xuất mô hình của NL thiết kế CCĐG năng lực. Để xác định được giải pháp phát triển NL thiết kế CCĐG năng lực cho SVSP vật lí theo mô hình đó, chúng tôi phân tích kết quả quan sát, điều tra, phỏng vấn các SVSP và GV vật lí để thấy được thực trạng và những khó khăn của việc phát triển NL thiết kế CCĐG năng lực. Trên cơ sở đó, chúng tôi phân tích đặc điểm nhận thức, tâm lí của người học, phân tích tiến trình nhận thức khi thiết kế CCĐG năng lực để đề xuất bốn nguyên tắc phát triển NL thiết kế CCĐG năng lực. Công cụ đánh giá 2.1.1. Khái niệm công cụ đánh giá “Assessment tool” và “assessment instrument” trong tiếng anh thường được dịch sang tiếng Việt đều là “công cụ đánh giá”. Trên cơ sở tham khảo một số định nghĩa về hai khái niệm này, chúng tôi tạm dịch “assessment tool” là “bộ công cụ ĐG” và “assessment instrument” là “công cụ đánh giá”. Dưới đây là một số định nghĩa khác nhau về chúng. Theo Nguyễn Công Khanh: “...công cụ được hiểu là các phương pháp, phương tiện và kỹ thuật được sử dụng trong suốt quá trình ĐG nhằm đạt được các mục đích ĐG.... Nếu ĐG là một quá trình gồm nhiều giai đoạn trong đó thu thập và xử lý thông tin là 2 giai đoạn chính, thì các CCĐG chủ yếu được sử dụng cho giai đoạn thu thập thông tin” [2]. Theo nhóm NC Fuchs thuộc đại học Vanderbilt ở Mĩ: bộ CCĐG (tool) là các kĩ thuật được sử dụng để đo lường khả năng học tập, kỹ năng và/hoặc sự thành thạo của học sinh trong một môn học nhất định hoặc để đo lường sự tiến bộ của một học sinh đối với trình độ học vấn trong một lĩnh vực cụ thể. Hai định nghĩa trên còn khá tổng quát, do đó có thể khiến cho mọi người có những hình dung khác nhau về thành phần của CCĐG [163]. Trường đại học Southern Methodist của Mĩ đưa ra định nghĩa cụ thể hơn: Bộ công cụ ĐG (tool) là công cụ (instrument) (câu hỏi, bài kiểm tra, nhiệm vụ, v.v.) được sử dụng để thu thập dữ liệu cho từng kết quả. Những công cụ này giao cho SV với mục đích ĐG xem họ có đạt được kết quả học tập cụ thể hay không. Ở định nghĩa này, bộ công cụ ĐG (tool) và CCĐG (instrument) là trùng nhau và tập trung vào nhiệm vụ ĐG [155]. Vụ Đào tạo và Phát triển lực lượng lao động, Tây Úc và trung tâm kiểm định và chứng nhận lực lượng lao động, đại học cộng đồng Holyoke, Mĩ cùng sử dụng một định nghĩa về CCĐG: Các bộ CCĐG (Assessment tool), còn được gọi là công cụ thu thập bằng chứng, chứa cả công cụ (instrument) và hướng dẫn thu thập và giải thích bằng chứng trong một quy trình ĐG. Chúng là một phần của ngân hàng CCĐG được sử dụng cho thực hành ĐG an toàn và hiệu quả trong một lĩnh vực, nơi thực hiện ĐG trong khuôn khổ đảm bảo chất lượng. Một bộ CCĐG được tạo thành từ các thành phần sau: bối cảnh và điều kiện để ĐG; các nhiệm vụ được giao cho người học để qua đó người học bộc lộ bằng chứng cần thu thập; một bản mô tả về các sự kiện chính làm bằng chứng cần thu thập từ người học; các tiêu chí ĐG bằng chứng được sử dụng để ĐG chất lượng thực hiện nhiệm vụ được giao; yêu cầu quản trị, ghi chép và báo cáo. Các nhiệm vụ được giao cho người học, bản mô tả về các sự kiện chính làm bằng chứng cần thu thập từ người học và các tiêu chí bằng chứng được sử dụng để ĐG chất lượng hiệu suất thường được gọi là CCĐG [20]. Tài liệu hướng dẫn của Bộ Giáo dục và Đào tạo Úc năm 2012 và tài liệu của trung tâm đào tạo GV về dạy học và ĐG của Úc cũng đưa ra các định nghĩa phần lớn tương đồng với định nghĩa trên. Tài liệu của trung tâm đào tạo GV về dạy học và ĐG đưa ra yêu cầu nghiêm ngặt hơn đối với sự đa dạng của CCĐG: Mỗi bộ CCĐG phải bao gồm 2 đến 3 CCĐG, trong đó mỗi CCĐG sử dụng các PPĐG khác nhau. Tài liệu hướng dẫn của Bộ Giáo dục và Đào tạo Úc 2012 đưa thêm hai nội dung vào bộ CCĐG, đó là: các thành tố NL được ĐG và bằng chứng về độ giá trị và độ tin cậy đã được kiểm tra và xây dựng khi thiết kế và sử dụng công cụ [21, 71]. Có thể thấy, với những bộ CCĐG có đầy đủ các thành phần được nêu trong định nghĩa của Bộ Giáo dục và Đào tạo Úc, người lựa chọn và sử dụng CCĐG sẽ được cung cấp đầy đủ những thông tin cần thiết về bộ công cụ. Định nghĩa này cũng khá linh hoạt với sự đa dạng của CCĐG, không đòi hỏi số lượng các loại PPĐG cần sử dụng, mà chỉ cần nêu rõ các thành tố của NL được ĐG và đảm bảo độ giá trị, độ tin cậy khi ĐG NL đó. Do đó, trong NC này, chúng tôi sử dụng định nghĩa Bộ Giáo dục và Đào tạo Úc. Cụ thể các khái niệm này như sau: “Bộ công cụ đánh giá (assessment tool) là một bộ tài liệu đầy đủ cần thiết để đánh giá một hoặc nhiều thành tố NL. Nó bao gồm các nội dung: · các thành tố NL được đánh giá · các mục tiêu, bối cảnh và điều kiện đánh giá · các nhiệm vụ ĐG giao cho người được đánh giá (để làm bộc lộ bằng chứng cần thu thập) · bản liệt kê các bằng chứng cần thu thập từ người được đánh giá · các tiêu chí ĐG bằng chứng được sử dụng để đánh giá chất lượng việc thực hiện nhiệm vụ ĐG (nghĩa là các quy tắc ra quyết định đánh giá) · các yêu cầu về quản trị, ghi chép và báo cáo · bằng chứng về độ giá trị và độ tin cậy đã được kiểm tra và xây dựng khi thiết kế và sử dụng công cụ”. “CCĐG (assessment instrument) là một bộ tài liệu gồm các nhiệm vụ ĐG giao cho người được đánh giá, bản liệt kê các bằng chứng cần thu thập từ thí sinh và các tiêu chí ĐG bằng chứng được sử dụng để đánh giá chất lượng thực hiện nhiệm vụ”. 2.1.2. Yêu cầu đối với công cụ đánh giá Yêu cầu đảm bảo độ giá trị và độ tin cậy là yêu cầu đầu tiên đối với mọi loại CCĐG, trong đó khái niệm độ giá trị của Messick (1995) được sử dụng rộng rãi để đánh giá các bài kiểm tra truyền thống [117]. Tuy nhiên, ĐG trong giáo dục dựa trên năng lực đòi hỏi các tiêu chí mới. Các tiêu chí này cần tương thích hơn với các nguyên tắc và ý tưởng của dạy học phát triển năng lực. Do đó, đối với ĐGNL khái niệm này cần được bổ sung một số khía cạnh. Dưới đây, NC tổng hợp các công trình gần đây về yêu cầu đối với CCĐGNL để làm rõ các khía cạnh này. Các thuyết học tập khác nhau tập trung vào các khía cạnh khác nhau của hoạt động ĐGNL. Thuyết hành vi đã tập trung vào kết quả ĐGNL [135]; thuyết nhân văn tập trung vào ĐG và thúc đẩy sự tiến bộ trong học tập, điều kiện trước khi ĐG [73], và vai trò của động lực [111]; thuyết kiến tạo đòi hỏi các nhiệm vụ ĐG gắn với nhiệm vụ học tập [100], và các nhiệm vụ này tập trung vào việc hướng dẫn học sinh trở thành người học tự điều chỉnh và độc lập, tích cực để xây dựng kiến ​​thức [99]. Những điểm nhấn của thuyết hành vi và kiến ​​tạo chỉ giới hạn ở từng người học, bỏ qua vai trò của các quá trình văn hóa xã hội trong quá trình học tập. Theo thuyết văn hóa xã hội, GV nên xem ĐG là một công cụ có thể được sử dụng để tạo ra một cộng đồng học tập của học sinh và GV, từ đó GV định hình các hoạt động trong lớp và hành vi học tập của học sinh [104]. Các NC về ĐGNL [20, 92, 110, 122] cũng nhấn mạnh tầm quan trọng của tương tác xã hội, bối cảnh văn hóa và hệ thống niềm tin của cả HS và GV, cách các yếu tố này hình thành bản sắc của học sinh [54], và bản chất của quyền lực và sự kiểm soát trong lớp học trong quá trình ĐG [20]. Cùng với sự phát triển của các thuyết học tập, các yêu cầu đối với CCĐG ngày càng tăng. Có thể thấy, những khía cạnh khác nhau của CCĐG được các thuyết quan tâm đều là những khía cạnh quan trọng trong ĐGNL. Các khía cạnh này cũng được các NC về độ giá trị của CCĐG trong GD đề cập đến [117]. Tuy nhiên, các khía cạnh về độ giá trị của CCĐG còn khá trừu tượng dẫn đến việc vận dụng trong thiết kế CCĐG còn nhiều khó khăn. Đã có một số NC cụ thể hóa một số tiêu chí của CCĐG nhưng chưa chỉ rõ mối liên hệ của các tiêu chí với các khía cạnh của CCĐG. Dưới đây, chúng tôi hệ thống hóa các tiêu chí đó theo các khía cạnh về độ giá trị của CCĐG [39, 105, 106, 152, 24, 16, 81, 95, 154, 166, 171]. Đảm bảo tính toàn diện: Tiêu chí này đòi hỏi nội dung nhiệm vụ ĐG phải cho phép thể hiện các mức độ của các thành tố và chỉ số hành vi của NL được ĐG. Hơn nữa, khi thiết kế các nhiệm vụ ĐG phải xác định rõ ranh giới của của NL cần ĐG. Tiêu chí này liên quan đến độ giá trị nội dung, độ giá trị cấu trúc [117, 93]. Đảm bảo tính nhất quán: Tiêu chí này đòi hỏi tính nhất quán của việc thực hiện nhiệm vụ ĐG của người tham gia với các mô hình lí thuyết về quá trình thực hiện nhiệm vụ [67]. Để đảm bảo điều đó, trước hết các NVĐG phải hấp dẫn để người trả lời thực sự tham gia thực hiện nhiệm vụ và bằng chứng cần bao gồm cả quá trình và sản phẩm học tập [63]. Hơn nữa, người ĐG và người được ĐG đều phải hiểu như nhau về chuẩn, tiêu chí, các chỉ số hành vi được ĐG. Tiêu chí này liên quan đến độ giá trị cấu trúc và cũng là một điểm nhấn của thuyết kiến tạo. Đảm bảo sự phù hợp. Tiêu chí này đòi hỏi việc thiết kế nhiệm vụ ĐG và thiết kế tiêu chí ĐG phải phù hợp với nhau [108,119]. Nó cũng đòi hỏi các nhiệm vụ phải rõ ràng, dễ hiểu và có thể làm được đối với người được ĐG. Tiêu chí này tạo ra sự nhất quán trong chấm điểm giữa các giám khảo và sự nhất quán trong kết quả khi ĐG được lặp lại. Nhờ đó, kết quả ĐG được ổn định, chính xác, không bị phụ thuộc vào người ĐG và nhiệm vụ ĐG. Tiêu chí này nhằm đáp ứng độ tin cậy của CCĐG, một điểm nhấn quan trọng của thuyết hành vi [96, 119, 45, 64, 42]. Đảm bảo tính tổng quát: Tiêu chí này nhằm đảm bảo sự chính xác khi tổng quát kết quả ĐG của một số NVĐG cho những NVĐG khác. Nó đòi hỏi việc ĐG đảm bảo người học có thể chứng minh những NL này trong các hoàn cảnh tương tự hoặc trong các nhiệm vụ liên quan khác. Hơn nữa, mỗi loại hình ĐG nhằm những mục đích khác nhau, mỗi CCĐG có những mục tiêu cụ thể khác nhau, chỉ phù hợp trong những tình huống cụ thể nên GV phải xác định rõ mục đích ĐG và có khả năng chọn lựa CCĐG phù hợp với tình huống. Tiêu chí liên quan đến độ giá trị dự báo [106]. Đảm bảo mối quan hệ với các mô hình NL khác. Tiêu chí này đòi hỏi rằng điểm số của một HS khi sử dụng CCĐG đang xét và các điểm số của HS đó ở các NL khác phải phản ánh mối quan hệ trong lý thuyết về mô hình của NL được ĐG với các NL khác. Do đó, nên xem xét mối tương quan với các mô hình NL khác khi lựa chọn mô hình NL cần ĐG. Như vậy, lý thuyết về ĐG đã chỉ ra mối quan hệ giữa ba thành phần: điểm số, bằng chứng thu được và mô hình của NL cần ĐG. Các liên kết đó chứng minh tính hữu ích của điểm số đối với mục đích ĐG [24, 180]. Đảm bảo các tác động tích cực. Để đảm bảo ĐG đưa đến các hệ quả tích cực đối với sự phát triển NL của người học, cần phải xét đến nhiều vấn đề cụ thể: CCĐG phải được thiết kế sao cho ý nghĩa của điểm số làm cơ sở đưa ra các biện pháp điều chỉnh, cải tiến việc dạy học [118-119]. Việc thiết kế CCĐG cũng cần chú ý đến các tác động ngoài ý muốn của ĐG đối với việc học, ví dụ như hiệu ứng học chỉ để đạt kết quả cao khi thi cử [63]. Việc thiết kế CCĐG cần đảm bảo công bằng. Công cụ ĐG không có sự thiên vi cho giới, dân tộc, vùng miền, đối tượng... cách phân tích, xử lý kết quả không bị ảnh hưởng bởi các mối quan hệ cá nhân, phải sử dụng các điều kiện và tiêu chí tương tự cho tất cả những người được ĐG [118, 82, 169]. Cụ thể hơn, ngôn ngữ và cách trình bày của nhiệm vụ ĐG phải quen thuộc như nhau đối với các thí sinh, và các chi tiết trong nhiệm vụ ĐG không gây ảnh hưởng đến tâm lí của bất kì thí sinh nào. Điều này đảm bảo mỗi thí sinh nhận được cơ hội bình đẳng để chứng minh NL của bản thân. Do đó, cần quan tâm đến đặc điểm của thí sinh trước khi thiết kế CCĐG. Đây cũng chính là điểm nhấn của thuyết nhân văn [63]. Những nhiệm vụ ĐG và các hướng dẫn cho học sinh phải gần với các hoạt động học tập trên lớp, tránh gây áp lực như một bài kiểm tra truyền thống và giúp định hướng học sinh trở thành người học tự điều chỉnh và độc lập. Điều này cũng được thuyết kiến tạo tập trung nhấn mạnh [106]. Các nhiệm vụ ĐG phải tạo được hứng thú và kích thích khả năng nhận thức của học sinh. Yêu cầu này đề cập đến việc chú ý đến các hoạt động trí tuệ bậc cao trong việc thiết kế nhiệm vụ ĐG. Đây cũng là một điểm nhấn của thuyết kiến tạo [126,171]. Việc thiết kế NVĐG và tiêu chí ĐG phải tạo ra tương tác HS-HS, GV-HS. Nội dung nhiệm vụ cần tạo điều kiện cho việc thảo luận để tạo ra một cộng đồng học tập. Đây chính là điểm nhấn quan trọng của thuyết văn hóa xã hội [16, 38]. Đánh giá năng lực 2.2.1. Khái niệm năng lực NL là sự kết hợp một cách linh hoạt và có tổ chức kiến thức, kĩ năng cơ bản với thái độ, tình cảm, giá trị, động cơ cá nhân nhằm đáp ứng hiệu quả một yêu cầu phức hợp của hoạt động trong bối cảnh nhất định [2]. Hoskins và Crick (2008) đã định nghĩa NL là sự kết hợp phức tạp của kiến thức, kỹ năng, giá trị và thái độ cho phép một người thể hiện hành động hiệu quả của họ trong cuộc sống [165]. Hầu hết các định nghĩa trên về NL đều thống nhất ở điểm: coi NL là sự kết hợp của kiến thức, kĩ năng cơ bản với thái độ, tình cảm, giá trị, động cơ cá nhân... Tuy nhiên, các cách phát biểu trên chưa thể hiện rõ các mức độ của NL mà tập trung mô tả NL ở mức độ cao nhất. Định nghĩa NL của từ điển bách khoa Việt Nam đã khắc phục được điều này: “NL là đặc điểm của cá nhân thể hiện mức độ thông thạo, tức là có thể thực hiện được một cách thành thục và chắc chắn một hay một số dạng hoạt động nào đó. NL gắn liền với những phẩm chất về trí nhớ, tính nhạy cảm, trí tuệ, tính cách của cá nhân. NL có thể phát triển trên cơ sở năng khiếu, song không phải là bẩm sinh, mà là kết quả của phát triển xã hội và của con người” [11]. Tương tự như vậy, định nghĩa NL của Rychen và Salganik (2003) được tổ chức hợp tác và phát triển kinh tế OECD thông qua cũng bao gồm các mặt nhận thức, phi nhận thức và thể hiện mức độ của NL theo một cách khác: “NL liên quan đến khả năng đáp ứng nhu cầu phức tạp, bằng cách huy động nguồn lực tâm lý xã hội (bao gồm cả kỹ năng và thái độ) trong một bối cảnh cụ thể”. Định nghĩa này đã kết hợp các nhu cầu phức tạp, điều kiện tâm lý xã hội tiên quyết (bao gồm cả nhận thức, động lực, đạo đức, ý chí, và các thành phần xã hội) và bối cảnh vào một hệ thống. Nó chỉ ra mối liên quan với nhu cầu và được thể hiện bằng hành động (có lý do và mục tiêu) bởi các cá nhân trong một tình huống cụ thể [146]. Tuy nhiên các định nghĩa này vẫn chưa toàn diện. Phân tích sau đây sẽ cho thấy điều đó. Mặc dù NL của một người khi ở trong các bối cảnh đó là như nhau nhưng sự thể hiện của NL của người đó có thể thay đổi theo bối cảnh. Một cá nhân có năng lực có thể đáp ứng các yêu cầu của một bối cảnh nhưng không thể thể hiện cùng một mức độ NL trong bối cảnh khác. Điều này dẫn đến yêu cầu cần phải quan sát các cá nhân trong một loạt các bối cảnh. Sự thể hiện của NL sẽ bị ảnh hưởng không chỉ bởi bối cảnh mà NL được quan sát mà còn bởi các giá trị, thái độ và động lực của con người. Do đó, việc ĐGNL bản thân nó là một hoạt động phức tạp và định nghĩa về NL phải cho phép sự thay đổi sự thể hiện giữa các bối cảnh. Griffin (2015) đã chú ý đến điều này và đưa ra định nghĩa sau: “Năng lực là một đặc điểm tiềm ẩn xác định khả năng của một người để thực hiện các nhiệm vụ và thể hiện các kỹ năng. Năng lực là một thuộc tính cá nhân tiềm ẩn mà chỉ có thể được suy luận từ việc quan sát về số lượng và mức độ mà một người thể hiện một tập hợp các kỹ năng liên quan đến thuộc tính cá nhân của họ trong một loạt các bối cảnh”. Như vậy, NL của một người phải được thể hiện ra bằng các hành vi mà người ta có thể quan sát được, qua đó xác định được số lượng và mức độ của các kỹ năng liên quan đến khả năng thực hiện các nhiệm vụ của người đó. Do đó, theo định nghĩa này cấu trúc của năng lực được mô tả gồm các hành vi và các mức độ đạt được của từng hành vi đó. Mặt khác, nhiệm vụ ở đây là một mô tả rất rộng về một hoạt động mà các cá nhân cần thực hiện. Nhiệm vụ hoặc hoạt động càng phức tạp và càng có nhiều tương tác, chúng ta càng cần nhiều dữ liệu để để ghi lại các quan sát của chúng ta về sự thực hiện nhiệm vụ của người đó [79]. Năng lực có thể được tăng lên thông qua học tập hoặc đào tạo trong các bối cảnh liên quan. Phát triển NL có thể đạt được bằng cách hướng dẫn rõ ràng, trải nghiệm và định hướng bởi các đồng nghiệp có NL hoặc nhiều kinh nghiệm sống hơn. Chính sự tích lũy khả năng hoàn thành các nhiệm vụ cụ thể đã cho thấy bản chất của năng lực, thứ tự phát triển, độ phức tạp và mức độ tinh vi của nó [79]. Từ những phân tích trên, có thể thấy định nghĩa NL của Griffin khá toàn diện. Nó không những nêu lên sự gắn bó của hoạt động với bối cảnh mà còn làm nổi bật lên sự biểu hiện khác nhau của cùng một người trong những bối cảnh khác nhau, từ đó chỉ ra những điểm quan trọng cần lưu ý trong ĐGNL. Ngoài ra, cách thể hiện các mức độ của NL trong định nghĩa này còn chỉ ra khả năng phát triển NL thông qua học tập. Từ các định nghĩa NL nêu trên, chúng tôi rút ra một số điểm cần lưu ý khi ĐG và phát triển NL thiết kế CCĐG năng lực cho SVSP: - các nhiệm vụ ĐG phải gắn với bối cảnh cụ thể sao cho khi người học được đặt vào một bối cảnh đó, họ nảy sinh nhu cầu và có thể huy động nguồn lực tâm lý xã hội, quá trình đó bộc lộ ra ngoài bằng những hành động cụ thể. - không thể có sẵn các nhiệm vụ ĐG giúp quan sát các cá nhân trong một loạt các bối cảnh, do đó SVSP cần có NL thiết kế CCĐG trong đó các nhiệm vụ ĐG đáp ứng điều kiện trên. 2.2.2. Đặc trưng của đánh giá năng lực Để ĐGNL của một người, cần phải có đủ bằng chứng liên quan đến NL cần ĐG. Bằng chứng là những gì có thể quan sát trực tiếp khi làm, nói, viết hoặc tạo ra. Những gì mọi người nghĩ, cảm nhận, biết hoặc hiểu là những suy luận. Đặc điểm và số lượng của các biểu hiện, hành động có thể quan sát trực tiếp chính là các bằng chứng chỉ ra rằng một người biết, cảm nhận, nghĩ hoặc hiểu những gì, từ đó suy ra NL của người đó. Các bằng chứng được thu thập thông qua các nhiệm vụ đánh giá (các bài kiểm tra chuẩn hóa, bộ sưu tập các sản phẩm không chính thức và quan sát hành động...). Việc lựa chọn, thiết kế các nhiệm vụ ĐG có mục đích để thu thập bằng chứng là một bước quan trọng cho phép thu thập các bằng chứng thích hợp. Số lượng nhiệm vụ được thực hiện sẽ xác định số lượng bằng chứng thu thập được; các điều kiện thực hiện nhiệm vụ sẽ ảnh hưởng đến tính chính xác của bằng chứng và có thể giúp xác định tính xác thực của bằng chứng. Các nhiệm vụ có thể đòi hỏi số lượng NL khác nhau để thực hiện nhiệm vụ. Các nhiệm vụ cũng có mức độ khó, phức tạp, mới lạ khác nhau, v.v. Tuy nhiên, việc lựa chọn các nhiệm vụ nên dựa trên mức độ cung cấp bằng chứng phù hợp, chính xác và xác thực về NL của người thực hiện nhiệm vụ đó. Khi các mô tả các bằng chứng được sắp xếp theo thứ tự về mức độ phức tạp, khó khăn, tinh tế và được chia thành các cấp độ sẽ tạo thành đường phát triển (hoặc được gọi là thang mô tả trong khảo sát PISA). Theo Hội đồng Nghiên cứu Quốc gia Úc (NRC, 2007), đường phát triển năng lực như một trục phát triển học tập, nó mô tả nội dung kiến thức và các hoạt động thực hành trong một khoảng thời gian đủ dài, theo trình tự sự phức tạp tăng dần. Một cấp độ NL được mô tả bởi một tập hợp các kiến thức, kỹ năng, thái độ, giá trị, đạo đức (knowledge, skills, attitudes, values, ethics - KSAVE) của một người ở cấp độ đó trên đường phát triển. Ở mỗi cấp độ, bằng chứng thu được khi một người thực hiện loạt các nhiệm vụ riêng biệt đòi hỏi các kỹ năng, kiến ​​thức, hiểu biết về công nghệ, thái độ, giá trị và đạo đức tương ứng với mô tả nói trên. Mô tả ở các cấp độ trở thành căn cứ cho việc xác định các chiến lược can thiệp phù hợp nhằm phát triển NL của người học. Thông qua sắp xếp các cấp độ hướng tới kiến ​​thức rộng và sâu hơn, kỹ năng bậc cao hơn và hiểu biết sâu hơn,... đường phát triển cho phép xác định mức độ NL của một người và phát triển NL của người đó [79]. Như vậy, việc xây dựng đường phát triển NL phải dựa vào các bằng chứng thu được khi sử dụng hệ thống các nhiệm vụ ĐG, để xác định cấp độ của NL của một người trên đường phát triển phải dựa vào tập hợp các nhiệm vụ người đó hoàn thành, do đó các nhiệm vụ ĐG đóng vai trò chủ đạo trong ĐGNL. Cùng với các tiêu chí ĐG, các nhiệm vụ ĐG trở thành bộ phận quan trọng của công cụ ĐG. Từ các phân tích trên, có thể rút ra một số điểm cần lưu ý khi ĐG và phát triển NL thiết kế CCĐG năng lực cho SVSP: - nhiệm vụ ĐG phải đòi hỏi các kỹ năng, kiến ​​thức, hiểu biết về công nghệ, thái độ, giá trị và đạo đức tương ứng với NL cần ĐG - để có thể xây dựng đường phát triển NL và xác định NL của người học trên đường phát triển, phải thiết kế được các nhiệm vụ ĐG có mức độ phức tạp, khó khăn, tinh tế khác nhau. Để đảm bảo tất cả các yêu cầu trên, việc thiết kế CCĐG cần phải tuân theo một quy trình chặt chẽ, trong đó mỗi giai đoạn cần có những điểm nhất định cần chú ý. Để đảm bảo tính tổng quát, CCĐG cần được thực hiện gắn với tình huống thực nhằm phản ánh đúng NL của người học khi thực hiện nhiệm vụ trong môi trường thực tế [24, 63, 81]. 2.2.3. Quy trình thiết kế công cụ ĐGNL Quy trình thiết kế CCĐG được đề cập trong nhiều NC. Trong phần này chúng tôi phân tích các quy trình được sử dụng phổ biến trong NC của các tác giả Stiggins (1987) [157], Grant Wiggins (2005) [170], Brookhart (2011) [40] và một bản hướng dẫn khá chi tiết về việc thiết kế CCĐG năng lực, tài liệu “Thiết kế và phát triển các CCĐG”, của Bộ Giáo dục Úc (2012) [9]. Chu trình thiết kế CCĐG năng lực của Tillema (2011) [164] đã bao hàm các quy trình của các tác giả khác [46, 72,116, 120], vì vậy chu trình này cũng được chúng tôi chọn để phân tích. Các NC gần đây như Popham (2013) và Simon (2013) cũng sử dụng các quy trình này [142, 153]. Bảng 2.1. So sánh các bước trong các quy trình thiết kế CCĐG Stiggins (1987) Wiggins & McTighe(2005) Brookhart (2010) (Tillema, 2011) Australia (2012) I. Xác định mục đích và mục tiêu của hoạtđộng ĐG Làm rõ lí do ĐG Cụ thể hóa những quyết định sẽ dựa trên ĐG Cụ thể hóa người đưa ra quyết định Cụ thể hóa việc sử dụng kết quả ĐG Mô tả những HS được ĐG Xác định kết quả mong muốn • những ý tưởng lớn • những hiểu biết cụ thể • những hiểu lầm HS có thể gặp Cụ thể hóa loại suy nghĩ, về những nội dung mà bạn muốn xem bằng chứng. Mục đich hoặc mục tiêu ĐG. 1.1 Xác định các mục tiêu của người được ĐG, mục đích của CCĐG và bối cảnh 1.2 Xem xét các chuẩn liên quan tới ĐG và giải thích chúng 1.3 Xác định, xem xét và giải thích các yêu cầu về tổ chức, pháp lý và đạo đức đối với ĐG 1.4 Xác định các tài liệu liên quan khác II. Lập kế hoạch thiết kế CCĐG. Làm rõ hành động được ĐG Cụ thể hóa nội dung hoặc kĩ năng trọng tâm cần ĐG Chọn loại hành động sẽ ĐG Liệt kê các tiêu chí ĐG hành động Xác định bằng chứng về việc HS chứng minh thành tích về kết quả mong muốn cách HS sẽ suy ngẫm và tự ĐG việc học của mình Quyết định những gì bạn sẽ lấy làm bằng chứng cho thấy học sinh thực tế đã thể hiện cách suy nghĩ này về nội dung tương ứng 2.1 Chọn PPĐG hỗ trợ thu thập loại bằng chứng cần tìm. 2.2 Cho phép ứng viên thể hiện hoặc hỗ trợ yêu cầu của mình thông qua các PPĐG được chọn 2.3 Xem xét các CCĐG khác nhau cho các PPĐG được lựa chọn 2.4 Xem xét cách các CCĐG sẽ được quản lý III. Phát triển CCĐG Thiết kế bài tập Chọn loại bài tập Xác định mức độ khó của ĐG Xác định số lượng bằng chứng cần thiết Thiết kế kế hoạch ĐG hành động Xác định loại điểm sẽ sử dụng Xác định ai là người ĐG hành động Làm rõ phương pháp chấm điểm Xác định nhiệm vụ ĐG mà qua đó HS sẽ thể hiện kết quả mong muốn Xác định tiêu chí của các hành động sẽ được ĐG Thiết kế nhiệm vụ ĐG. Lập kế hoạch ĐG cân bằng giữa nội dung và tư duy của học sinh qua một ma trận mục tiêu ĐG Thiết kế hoặc lựa chọn câu hỏi/bài tập. Xác định các tiêu chí ĐG cho câu hỏi/bài tập. 3.1 Phát triển các CCĐG 3.2 Xác định và ghi lại các thủ tục rõ ràng và hướng dẫn cụ thể cho người ĐG 3.3 Xem xét các yêu cầu về mặt chính sách và quy trình của ĐG và nhu cầu lưu trữ, truy xuất và kiểm tra CCĐG 4.1 Kiểm tra bản thảo của CCĐG 4.2 Thử nghiệm CCĐG để xác nhận nội dung và khả năng áp dụng 4.3 Thu thập các phản hồi 4.4 Sửa đổi công cụ lần cuối dựa trên phân tích phản hồi 4.5 Định dạng CCĐG hoàn thiện phù hợp với chính sách và thủ tục hệ thống ĐG và các yêu cầu về tổ chức, pháp lý và đạo đức Các thành tố liên quan đến thực hiện ĐG và sử dụng kết quả ĐG Quản lý ĐG.. Chấm điểm/xếp hạng câu hỏi/bài tập. giải thích điểm số và đưa ra một quyết định. Phản hồi và thúc đẩy học tập. Để xác định các hành động cần thực hiện trong quy trình, chúng tôi so sánh các hành động trong từng bước của mỗi quy trình với các quy trình khác. Thông qua bảng 2.1, chúng tôi tìm ra các điểm chung và hợp lý của các quy trình, sau đó phân tích và thêm một số điểm như sau: - Mỗi hoạt động ĐG cần được bối cảnh hóa và đa dạng hóa cho các mục đích ĐG. Do đó, cần phải xác định các mục đích và các mục tiêu cụ thể để việc thiết kế CCĐG được định hướng tốt hơn. Trong số các quy trình được phân tích, chỉ có quy trình Tillema (2011) chú ý đến việc xác định các mục tiêu, nhưng không chỉ ra các khía cạnh cần xem xét khi xác định mục tiêu. Do đó, ở giai đoạn này, sau khi xác định mục đích của ĐG, chúng tôi bổ sung hai bước: (1) Xác định các đặc điểm của các tình huống; (2) Xác định mục tiêu của các nhiệm vụ ĐG. - Khi ĐG riêng biệt kiến thức, kĩ năng, người thiết kế CCĐG có thể soạn thảo trực tiếp NVĐG dựa trên kiến thức cần ĐG. Khi ĐGNL, người thiết kế cần lựa chọn hoặc tạo ra các bối cảnh cụ thể sao cho khi người học được đặt vào một bối cảnh đó, họ nảy sinh nhu cầu và có thể huy động nguồn lực tâm lý xã hội, quá trình đó bộc lộ ra ngoài bằng những hành động cụ thể (theo yêu cầu của ĐGNL đã nêu trong mục 2.2.1). Do vậy, dựa trên cấu trúc của NL cần ĐG, người thiết kế CCĐG sẽ cần phải xác định đặc điểm thông tin thực tế cần tìm để tạo ra các bối cảnh này. Sau khi tìm được các thông tin đó, người thiết kế CCĐG sẽ biến đổi nó để tạo ra bối cảnh cần thiết sử dụng trong việc thiết kế NVĐG năng lực. Như vậy, khác với việc thiết kế CCĐG kiến thức, việc lựa chọn các tình huống trong các CCĐG năng lực để đáp ứng các yêu cầu đã liệt kê ở mục 2.2.2 là khá phức tạp và khó khăn. Các quy trình trên đã không chú ý đến sự phức tạp này. Căn cứ vào việc phân tích quá trình tư duy trong thiết kế nhiệm vụ ĐG nêu trên, chúng tôi đã thêm vào hai bước sau đây để hỗ trợ cho việc thiết kế nhiệm vụ ĐG: (1) Xác định loại thông tin sẽ được sử dụng; (2) Tìm kiếm loại thông tin sẽ được sử dụng. Năng lực thiết kế công cụ ĐGNL Để có cơ sở bồi dưỡng và ĐGNL thiết kế CCĐG năng lực, theo Wilson (2009), trước hết cần đưa ra giả thuyết về đường phát triển NL của mô hình cần đo [173]. Cụ thể là: Mô tả mô hình cần đo. Xác định các NL thành phần, các CSHV và xây dựng một giả thuyết về đường phát triển NL. Mô tả ít nhất ba mức thể hiện sự khác biệt ở từng CSHV Mô tả các hoạt động và nhiệm vụ để các hành vi được mô tả có thể bộc lộ. Đó chính là dự thảo các ý tưởng về c..., Nguyễn Huyền Trang và Dương Thị Yến (2020). Một số hạn chế trong bài tập đánh giá năng lực thực nghiệm của SV sư phạm vật lí và cách khắc phục. Tạp chí Khoa học trường Đại học Sư phạm Hà Nội 1(2020), p 163-172. TÀI LIỆU THAM KHẢO Tiếng Việt Bùi Văn Nghị, (2010), Rèn luyện phương pháp sáng tạo bài toán cho SVSP Toán ở trường Đại học Sư phạm, Tạp chí Khoa học Trường Đại học Sư phạm Hà Nội, Số 4, trang 3-8. Nguyễn Công Khanh (Chủ biên), Giáo trình kiểm tra đánh giá trong giáo dục. Đào Thị Oanh. NXB ĐHSP. 2015. Nghị quyết Hội nghị Trung ương 8 khóa XI. https://dangbo.lhu.edu.vn/193/23573/Noi-dung-nghi-quyet-hoi-nghi-Trung-Uong-Dang-lan-8-khoa-XI.html Nguyễn Thị Diệu Linh, Đỗ Hương Trà (2018), Cấu trúc năng lực thiết kế công cụ đánh giá năng lực và việc bồi dưỡng năng lực thiết kế công cụ đánh giá năng lực cho SV sư phạm, Tạp chí Khoa học Đại học Sư phạm - Đại học Đà Nẵng, Số 29b(3), trang 47-54. Nguyễn Thị Diệu Linh, Đỗ Hương Trà, Từ khảo sát thực tiễn đến đề xuất giải pháp phát triển năng lực thiết kế công cụ đánh giá năng lực trong bồi dưỡng và đào tạo giáo viên vật lí, Tạp chí Khoa học Đại học Sư phạm Hà Nội, Vol. 61, số 8B/2016, tr 213-225. Nguyễn Thị Thu Huyền, Nguyễn Văn Hiến, Phương Diễm Hương (2014), Thực trạng kĩ năng tự học ngoài lớp học của SV chính quy sư phạm trường đại học Sư phạm thành phố Hồ Chí Minh, Tạp chí Khoa học đại học Sư phạm thành phố Hồ Chí Minh. Nguyễn Thị Thúy Anh (2016), Đánh giá kết quả học tập môn giáo dục học của SV đại học sư phạm theo tiếp cận năng lực. Luận văn thạc sĩ khoa học giáo dục. Viện Khoa học Giáo dục Việt Nam. Nguyễn Thị Việt Nga (2016), Hình thành cho SVSP kĩ năng ĐG năng lực khoa học của HS theo quan điểm PISA trong dạy HS học ở trường phổ thông, LATS giáo dục học, ĐHSPHN. Phạm Xuân Chung (2012), Chuẩn bị cho SVSP ngành sư phạm toán học ở trường Đại học tiến hành hoạt động ĐG kết quả học tập môn Toán của HS Trung học phổ thông, LATS giáo dục học, ĐH Vinh, Nghệ An Phan Thị Thanh Hội, (2014), Rèn luyện cho SVSP kĩ năng thiết kế bài tập tình huống trong dạy học học phần phương pháp dạy học sinh học I, Tạp chí Khoa học Trường Đại học Sư phạm Hà Nội, Số 2, trang 91-99. Thông tư 20/2018/TT-BGDĐT ngày 22/8/2018 Quy định chuẩn nghề nghiệp giáo viên cơ sở giáo dục phổ thông. Xaypaseuth Vylaychit (2019), Xây dựng và sử dụng thiết bị thí nghiệm trong dạy học phần “Nhiệt học” – Vật lí lớp 8 nhằm phát triển năng lực thực nghiệm của học sinh. LATS LATS giáo dục học, ĐHSPHN. Tiếng Anh Alonzo D. A. (2016), Development and Application of a Teacher Assessment for Learning Literacy Tool, A thesis in fulfilment of the requirements for the degree of Doctor of Philosophy School of Education Arts and Social Sciences. America Educational Research Association, American Psychological Association, & National Council on Measurement in Education, (1999), Standards for Educational and Psychological Testing, Retrieved from American Federation of Teachers, National Council on Measurement in Education, & National Education Association, (1990), Standards for teacher competence in educational assessment of students, Washington: National Council on Measurement in Education. Andrade, Heidi and Valtcheva, Anna (2009), "Promoting Learning and Achievement Through Self-Assessment" (2009), Educational Theory and Practice Faculty Scholarship. Assessment Reform Group (2008), Changing assessment practices: Process, principles and standards, Retrieved from Association for Educational Assessment-Europe, (2012), European framework of standards for educational assessment 1.0, Rome: Edizioni Nuova Cultura. Australian Curriculum, Assessment and Certification Authorities, (1995), Guidelines for assessment quality and equity, Retrieved from Australian Skills Quality Authority, What is the difference between an assessment tool and an assessment instrument?, Retrieved from https://www.asqa.gov.au/faqs/what-difference-between-assessment-tool-and-assessment-instrument-clause-18. Austrlia Goverment Department of Education, Employment and workplace Relations, (2012), TAEASS502B Design and develop assessment tool, Retrieved from https://training.gov.au/TrainingComponentFiles/TAE10/TAEASS502B_R1.pdf Avis, J., Fisher, R., & Thompson, R. (2010), Teaching in Lifelong Learning: A guide to theory and practice. Maidenhead: McGraw Hill Education. Ayres, P., & Sweller, J. (1990), Locus of difficulty in multistage mathematics problems. The American Journal of Psychology, 103, 167–193. Baartman, L. K. J. (2008), Assessing the assessment, Development and use of quality criteria for Competence Assessment Programmes. Utrecht University. Retrieved from Beaumont, C., O‘Doherty, M., & Shannon, L. (2011), Reconceptualising assessment feedback: A key to improving student learning?, Studies in Higher Education, 36(6), 671-687. Beittel, K. R., Mattil, E. L., Burgart, H. J., Burkhart, R. C., Kincaid, C., & Stewart, R. (1961), The effect of a "depth" versus a "breadth" method of art instruction at the ninth grade level. Studies in Art Education, 3(1), 75-87. Biggs J. B. and Collis K. F. (1982), Evaluating the quality of learning: The SOLO taxonomy, New York: Academic Press. Birenbaum, M. (2007), Evaluating the assessment: Sources of evidence for quality assurance. Studies in Educational Evaluation, 33(1), 29–49. Birenbaum, M. (1996), Alternatives in assessment of achievements, learning processes and prior knowledge (pp. 3–29), Boston: Kluwer Academic Publishers. Black P. and Wiliam D. (1998), Assessment and classroom learning, Assessment in Education: Principles, Policy, and Practice, 5, p 7–74. Black P. and Wiliam D. (1998), Inside the black box: raising standards through classroom assessment, Granada Learning. Black, P., McCormick, R., James, M., & Pedder, D. (2006), Learning how to learn and assessment for learning: a theoretical inquiry, Research Papers in Education, 21(2), 119 – 132, doi 10.1080/02671520600615612 Black, Paul, Wiliam, Dylan (1998), Assessment and classroom learning, Assessment in Education: Principles, Policy & Practice,Vol. 5, Issue 1. Bol L. et al (1998), Influence of experience, grade level, and subject area on teachers’ assessment practices, The Journal of Educational Research, 91, p323–330. Bonett D.G. (2002), Sample size requirements for estimating intraclass correlations with desired precision, Statistics in Medicine, Vol. 21, pp, 1331-5. Borko H., Mayfield V., Marion S., Flexer R., & Cumbo K. (1997), Teachers’ developing ideas and practices about mathematics performance assessment: Successes, stumbling blocks, and implications for professional development, Teaching & Teacher Education, 13(3), 259–278 Borkowski, J. G., Carr, M., Rellinger, E., & Pressley, M. (1990), Selfregulated cognition: Interdependence of metacognition, attributions, and self-esteem. In B. F. Jones & L. Idol (Eds.), Dimensions of thinking and cognitive instruction (pp. 53– 92), Hillsdale, NJ: Lawrence Erlbaum Associates. Boud, D., Cohen, R., & Sampson, J. (1999). Peer learning and assessment. Assessment and Evaluation in Higher Education, 24(4), 413-426. Brennan, R. L. (2006), Educational measurement. New York: ACE Praeger. Brookhart S. M. (2011), Educational assessment knowledge and skills for teachers, Educatioal Measurement: Issues and Practices, 30(1), 3-12. Brookhart S. M. (2013), How to create and use rubrics for formative assessment and grading, ASCD. Brookhart, S. M. (1994), Teachers’ grading: Practice and theory. Applied Measurement in Education, 7(4), 279–301. Brophy, J. (1999), Teaching. Educational Practices Series 1. International Academy of Education and International Bureau of Education. Retrieved from org/images/0012/001254/125450e.pdf. Brown G. L. (2002), Teachers’ Conceptions of Assessment, PhD thesis in the University of Auckland, US. Brown, G. T. L. (2004), Teachers’ conceptions of assessment. Assessment in Education, 11(3), 310–318. Brualdi A. (1998), Implementing performance assessment in the classroom, Practical Assessment, Research & Evaluation 6(2), Retrieved from n.asp?v=6&n=2. Bryony Hoskins and Ulf Fredriksson (2008), Learning to Learn: What is it and can it be measured?, Centre for Research on Lifelong Learning (CRELL), © European Communities. Butterfield, E. C., & Ferretti, R. P. (1987), Toward a theoretical integration of cognitive hypotheses about intellectual differences among children. In J. G. Borkowski & J. O. Day (Eds.), Cognition in special children (pp. 195–233), Norwood, NJ: Ablex. Campbell C. et al (2002), Psychometric analysis of an assessment literacy instrument: applicability to pre-service teachers, Paper presented at the annual meeting of the Mid-Western Educational Research Association, Columbus. Carol S. Dweck (2007), Mindset: The New Psychology of Success. Penguin Random House LLC Cavanaugh, J. C., & Borkowski, J. G. (1979), The metamemory-memory “connection”: Effects of strategy training and maintenance. The Journal of General Psychology, 101, 161–174. Chickerking, Arthur W., and Zelda F. Gamson. 1987. “Seven Principles for Good Practice in Undergraduate Education.” AAHE Bulletin 39(7): 3–7. Christopher DeLuca et al (2016), Approaches to Classroom Assessment Inventory: A New Instrument to Support Teacher Assessment Literacy, Educational Assessment, 21(4), p248-266, DOI: 10.1080/10627197.2016.1236677 Clark, R., Howard, K., & Early, S. (2006), Motivational challenges experienced in highly complex learning environments. In J. Elen & R. Clark (Eds.), Handling complexity in learning environments: Theory and research (pp. 27–42), Amsterdam: Elsevier. Cowie, B. (2005), Pupil commentary on assessment for learning. The Curriculum Journal, 16(2), 137-151. Daniel L.G. & King D.A., (1998), Knowledge and use of testing and measurement literacy of elementary and secondary teachers, The Journal of Educational Research, 91(6), 331–344. Delclos, V. R., & Harrington, C. (1991), Effects of strategy monitoring and proactive instruction on children’s problem- solving performance. Journal of Educational Psychology, 83, 35–42. DeLuca C. & Klinger D. A. (2010), Assessment literacy development: Identifying gaps in teacher candidates’ learning, Assessment in Education: Principles, Policy & Practice, 17, 419–438, doi:10. 1080/0969594X.2010.516643 DeLuca C. et al (2016), Approaches to Classroom Assessment Inventory: A New Instrument to Support Teacher Assessment Literacy, Educational Assessment, 21(4), 248-266, doi: 10.1080/10627197.2016.1236677 DeLuca C., Chavez T., Bellara A., CaO C. (2014), Pedagogies for preservice assessment education: Supporting teacher candidates’ assessment litaracy developement, The Teacher Educator, 48:128–142, Dennis Murphy Odo (2016), An Investigation of the Development of Pre-service Teacher Assessment Literacy through Individualized Tutoring and Peer Debriefing, Journal of Inquiry & Action in Education, 7(2), Department for Education-United Kingdom (2012), Teachers’ standards, Retrieved from Department of Education-Australia (2012), Australian professional standards for teachers, Retrieved from Dierick, S., & Dochy, F. (2001), New lines in edumetrics: New forms of assessment lead to new assessment criteria. Studies in Educational Evaluation, 27, 307–329. Dochy, F., & McDowell, L. (1997), Assessment as a tool for learning. Studies in Educational Evaluation, 23(4), 279–298. Douglas J. Hacker, John Dunlosky, Arthur C. Graesser (1998), Metacognition in Educational Theory and Practice. Routledge. Embretson, S. (1983), Construct validity: Construct representation versus nomothetic span. Psychological Bulletin, 93, 179-197. Eylon, B. S., & Linn, M. C. (1988), Learning and instruction: An examination of four research perspectives in science education. Review of Educational Research, 58(3), 251-301. F. E. Weinert & R. H. Kluwe (1987, Metacognition, motivation, and understanding. Hillsdale, NJ: Lawrence Erlbaum Associates. Flavell, J. (1979), Metacognition and Cognitive Monitoring: A New Area of Cognitive Developmental Inquiry. American Psychologist, 34(10), 906 911, Retrieved from https://doi.org/10.1037/0003 066X.34.10.906 Fortress Learning. Reviewing and Trialling Assessment Tools. Retrieved from https://fortresslearning.com.au/cert-iv-content/assess/reviewing-and-trialling-assessment-tools/ on July 24, 2016. Freeman R. and Lewis R. (1998), Planning and implementing assessment. London: Kogan Page. Friedman, H., & MacDonald, D. (2006), Humanistic testing and assessment. Journal of Humanistic Psychology, 46(4), 510-529. Fulcher G. (2012), Assessment literacy for the language classroom, Language Assessment Quarterly, 9(2), 113-132, doi: 10.1080/15434303.2011.642041 Gallaudet University. Assessment tools and methods. Retrieved from https://www.gallaudet.edu/accreditation-certification-and-licensure/assessment/assessment-of-student-learning/instructions-and-examples/assessment-tools-and-methods#:~:text=Assessment%20Tool%3A%20the%20instrument%20(form,particular%20learning%20outcome(s), on July 27, 2017. Galvan J. L. (2006), Writing literature reviews: A guide for students of social and behavioural sciences, Los Angeles: Pyrczak publishing. Gerjets, P., Scheiter, K., Opfermann, M., Hesse, F. W., & Eysink, T. H. S. (2009), Learning with hypermedia: The influence of representational formats and different levels of learner control on performance and learning behavior. Computers in Human Behavior, 25, 360–370. Graham P. (2005), Classroom-based assessment: Changing knowledge and practice through preservice teacher education, Teaching and Teacher Education, 21, 607–621. Griffin P. (2015), Writings assessment rubrics, In Griffin, P. (2014) Assessment for Teaching (pp. 125–156), Cambridge University Press. Griffin P., Care E., & Harding S. (2015), Task characteristics and calibration, In P.Griffin & E.Care (Eds.) Assessment and teaching of 21st century skills: Methods and approach (pp. 113–178), Dordrecht: Springer. Gulikers, J., Bastiaens, T., & Kirschner, P. (2004), A five-dimensional framework for authentic assessment. Educational Technology Research and Development, 52(3), 67–86. Hafner, J. C., & Hafner, P. M. (2003), Quantitative analysis of the rubric as an assessment tool: An empirical study of student peer‑group rating. International Journal of Science Education, 25(12), 1509–1528 Hattie, J., & Timperley, H. (2007), The power of feedback. Review of Educational Research, 77, 81-112. Huitt, W. (2003), The information processing approach to cognition. Educational Psychology Interactive.Valdosta,GA:Valdosta State University. Retrieved from Interstate Teacher Assessment and Support Consortium InTASC (2011), InTASC model core teaching standards: a resource for state dialogue, Washington: Council of Chief State School Officers, Retrieved from ].html. Jarr K.A. (2012), Education practitioners’ interpretation and use of assessment results, University of Iowa, Retrieved from Jennifer McGee & Susan Colby (2014), Impact of an Assessment Course on Teacher Candidates’ Assessment Literacy, Action in Teacher Education Joint Advisory Committee (1993), Principles for fair student assessment practices for education in Canada, Retrieved from Joint Committee for Standards on Educational Evaluation (2015), Classroom assessment standards: practices for PK-12 teachers, Retrieved from Kalyuga, S., Chandler, P., Tuovinen, J., & Sweller, J. (2001), When problem solving is superior to studying worked examples. Journal of Educational Psychology, 93, 579–588. Kaplan, C. A., & Davidson, J. E. (1988), Hatching a theory of incubation effects (Tech. Rep. No. C.I.P. 472), Pittsburgh: Carnegie Mellon University, Department of Psychology. Keppel, M., & Carless, D. (2006), Learning-oriented assessment: a technology-based case study, Assessment in Education, 13(2), 179-191. Kerka, S. (1995), Techniques for authentic assessment: Practice application brief, ERIC Clearinghouse on Adult, Career, and Vocational Education, No. ED381688, Retrieved from Kershaw IV I. (1993), Ohio vocational education teachers’ perceived use of student assessment information in educational decision-making, Ohio State University. Kirschner, F., Paas, F., & Kirschner, P. (in press), Task complexity as a driver for collaborative learning efficiency: The collective working memory effect. Applied Cognitive Psychology. Klinger D.A., Volante L., DeLUCA C. (2012), Building Teacher Capacity within the Evolving, Assessment Culture in Canadian Education, Policy Futures in Education, Volume 10 Number 4. Kluwe, R. H. (1982), Cognitive knowledge and executive control: Metacognition. In D. R. Griffin (Ed.), Animal mind— human mind (pp. 201–224), New York: Springer Verlag. Koenig, J. A. (Ed.), (2011), Assessing 21st Century Skills: Summary of a Workshop. National Academies Press. Koh K. & Tan T. (2016), Promoting reflection in pre-service teachers through problem-based learning: An example from Canada. Reflective Practice, doi: 10.1080/14623943.2016.1164683. Koh K., Luke A., Burke L., Gong W., Tan C. (2017), Developing the assessment literacy of teachers in Chinese language classrooms: A focus on assessment task design, Language Teaching Research 1–25. Koh K.H. (2011), Improving teachers’ assessment literacy through professional development, Teaching Education, 22, 255–276. Koh. K (2015), Buiding teachers’ capacity in authentic assessment and assessment for learning, Retrieved from on 5/12/2016. Korthagen F., John Loughran, Tom Russell (2006), Developing fundamental principles for teacher education programs and practices. Teaching and Teacher Education 22 (2006) 1020–1041 Lave, J., & Wenger, E. (1991), Situated learning: Legitimate peripheral participation, Cambridge: Cambridge University Press. Linn, M.C. (1992), Gender differences in educational achievement, sex equity in educational opportunity, achievement and testing. Princeton, NJ: Educational Testing Service. Linn, R. L., Baker, E. L., & Dunbar, S. B. (1991), Complex, performance-based assessment: Expectations and validation criteria, Educational Researcher, 20(8), 15. Lodico, M. G., Ghatala, E. S., Levin, J. R., Pressley, M., & Bell, J. A. (1983), The effects of strategy monitoring training on children’s selection of effective memory strategies. Journal of Expeimental Child Psychology, 35, 273–277. Loevinger, J. (1957), Objective tests as instruments of psychological theory. Psychological Reports, Monograph Supplement, 3, 635-694. MacLelland, E. (2004), How convincing is alternative assessment for use in higher education?, Assessment and Evaluation in Higher Education, 29, 311–321. Marshall, B., & Drummond, M. J. (2006), How teachers engage with assessment for learning: lessons from the classroom, Research Papers in Education, 21(2), 133- 149. Martin, A., & Dowson, M. (2009), Interpersonal relationships, motivation, engagement, and achievement: Yields for theory, current issues, and educational practice, Review of Educational Research, 79(1), 327-365. McMillan J. H. (2001), Secondary teachers‘ classroom assessment and grading practices, Educational Measurement, Issues and Practice, 20(1), 20–32. McMorris R. F., Boothroyd R. A. (1993), Tests That Teachers Build: An Analysis of Classroom Tests in Science and Mathematics, Applied Measurement in Education, DOI: 10.1207/s15324818ame0604_5 Mertler C.A. (2003), Pre-service versus in-service teachers’ assessment literacy: does classroom experience make a difference?, Annual meeting of the Mid-Western Educational Research Association, Columbus. Mertler C.A., & Campbell C. (2005), Measuring teachers’ knowledge & application of classroom assessment concepts: development of the assessment literacy inventory, In Annual meeting of the American Educational Research Association, Montreal. Messick S. (1994), The interplay of evidence and consequences in the validation of performance assessments, Educational Researcher, 23, p13–23. Messick S. (1995), Validity of psychological assessment: Validation of inferences from persons' responses and performances as scientific inquiry into score meaning, American Psychologist, 50(9), 741-749, Retrieved from Messick, S. (1980), Test validity and the ethics of assessment. American Psychologist, 35, 1012–1027. Messick, S. (1989), Validity. In R.L. Linn (Ed.), Educational measurement (3rd Ed.) (pp. 13-103), New York: American Council on Education/Macmillan. Moskal B. M. (2003), Recommendations for developing classroom performance assessments and scoring rubrics, Practical Assessment, Research & Evaluation, 8(14), Retrieved from Moskal B.M. and Leydens J.A. (2000), Scoring rubric development: validity and reliability, Practical Assessment, Research & Evaluation, Vol. 7, tr. 71-81. Munns, G., & Woodward, H. (2006), Student engagement and student self‐assessment: the REAL framework, Assessment in Education: Principles, Policy & Practice, 13(2), 193-213. doi: 10.1080/09695940600703969 National Board for Professional Teaching Standards (2001), What teachers should know and be able to do, Retrieved from National Council for the Accreditation of Teacher Education (2008), Professional standards for the accreditation of teacher preparation institutions, Retrieved from: National Council on Measurement in Education (1995), Code of professional responsibilities in educational measurement, Retrieved from: Natriello, G. (1987), The impact of evaluation processes on students. Educational Psychologist, 22(2), 1–5 New Zealand Teachers Council (2008), Graduating teacher standards, Retrieved from Newell, A., & Simon, H. A. (1972), Human problem solving. Englewood Cliffs, NJ: Prentice Hall. Newfields T. (2006), Teacher development and assessment literacy, Paper presented at the 5th Annual JALT Pan-SIG Conference, Shizuoka, Japan. NGSS Lead States. (2013), Next Generation Science Standards For States, By States. Washington, DC The National Academies Press. Nguyễn Văn Biên, Xaypaseuth Vylaychit, Nguyễn Anh Thuấn (2019), Developing of Experimental Competence of Laos pupils in Secondary School Science Classroom. Journal for the Education of Gifted Young Scientists 7(3):641-654. DOI: 10.17478/jegys.573969 Nickerson, R. S., Perkins, D. N., & Smith, E. E. (1985), The teaching of thinking. Hillsdale, NJ: Lawrence Erlbaum Associates. North Central Regional Educational Laboratory (n.d.), Indicator: Assessment. Retrieved, from on July 24, 2016. Northfield, J., and R. Gunstone. 1997. Teacher education as a process of developing teacher knowledge. In Teaching about teaching: Purpose, passion, and pedagogy in teacher education, eds. J. Loughran and T. Russell, 48-56. London: Falmer Press. Nuthal, G. (1999), The way students learn: Acquiring knowledge from an integrated science and social studies unit, Elementary School Journal, 99(4), 303-342. Paas, F. G. W. C., & van Merriënboer, J. J. G. (1993), The efficiency of instructional conditions: An approach to combine mental effort and performance measures. Human Factors, 35, 737–743. Paas, F., Tuovinen, J., van Merrie¨ nboer, J., & Darabi, A. (2005), A motivational perspective on the relation between mental effort and performance: Optimizing learner involvement in instruction. Educational Technology Research and Development, 53(3), 25–34. Paris, S. G., & Winograd, P. (1990), How metacognition can promote academic learning and instruction. In B. F. Jones & L. Idol (Eds.), Dimensions of thinking and cognitive instruction (pp. 15–51), Hillsdale, NJ: Lawrence Erlbaum Associates. Patricia A. Alexander, Philip H. Winne, Winne, Eric Anderman, Lyn Corno. Handbook of Educational Psychology. Psychology Press, 2006 Pernilla Nilsson (2013) What do we know and where do we go? Formative assessment in developing student teachers’ professional learning of teaching science, Teachers and Teaching: theory and practice, 19:2, 188-201, DOI: 10.1080/13540602.2013.741838 Plake B. et al (1993), Assessment competencies of teachers: a national survey, Educational Measurement: Issues and Practice, 12(4),10–39, doi:10.1111/j.1745-3992.1993.tb00548.x. Popham W. J. (2013), Classroom assessment: What teachers need to know (7th ed.), Boston: Pearson Reddy M.Y. (2011), Design and development of rubrics to improve assessment outcomes, Quality Assurance in Education, Vol. 19, No. 1, tr 84-104 Reisslein, J. (2005), Learner achievement and attitudes under varying paces of transitioning to independent problem solving. Dissertation presented in partial fulfillment of the requirements for the degree Doctor of Philosophy, Arizona State University, Tempe, Arizona. Ross, J. (2006), The reliability, validity, and utility of self-assessment. Practical Assessment, Research, and Evaluation, 11(10), Retrieved from nD10, on January 11, 2007. Rychen, D. S. & Salganik, L. H. (1997), Definition and Selection of Competences (DeSeCo): Theoretical and Conceptual Foundations: Strategy Paper. Paris: OECD. Sato M., Wei R.C., & Darling-Hammond, L. (2008), Improving teachers’ assessment practices through professional development: The case of National Board Certification, American Educational Research Journal, 45(3), 669–700. Schneider, W. (1985), Developmental trends in the metamemory memory behavior relationship: An integrative review. In D. L. Forrest Pressley, G. E. MacKinnon, & T. G. Waller (Eds.), Metacognition, cognition, and human performance (Vol.1, pp. 57–109), New York: Academic. Schoenfeld, A. H. (1987), What’s all the fuss about metacognition? In A. H. Schoenfeld (Ed.), Cognitive science and mathematics education (pp. 189–215), Hillsdale, N.J: Lawrence Erlbaum Associates. Schwartz, M. S., Sadler, P. M., Sonnert, G., & Tai, R. H. (2009), Depth versus breadth: How content coverage in high school science courses relates to later success in college science coursework, Science education, 93(5), 798-826. Shepard L., Hammerness K., Darling-Hammond L., & Rust F. (2005), Assessment, In L. Darling- Hammond & J. Bransford (Eds.), Preparing teachers for a changing world: What teachers should learn and be able to do (pp. 275–326), San Francisco, CA: Jossey-Bass. Shepard, L. (2006), Classroom assessment. In R. L. Brennan (Ed.), Educational measurement (4th ed., pp. 623-646), Westport, CT: American Cuncil on Education/ Praeger. Simon M., Ercikan K., Rousseau M. (2013), Improving large-scale assessment in education: theory,issues and practice, Springer New York. Sluijsmans, D. M. A. (2002, June), Student involvement in assessment: The training of peer assessment skills. Doctoral dissertation. Open University, Heerlen, TheNetherlands. Southern Methodist. Assessment Instruments. Retrieved from https://www.smu.edu/Provost/assessment/UniversityCurriculum/AssessmentInstrument, on July 24, 2016. Standards for Teacher Competence in Educational Assessment of Students (1990), Retrieved from https://buros.org/standards-teacher-competence-educational-assessment-students, on July 24, 2016, Stiggins R. (1987), Design and development of performance asessment, Educational Measurement: Issues and Practice p33-8 Stiggins R. (1999), Evaluating classroom assessment training in teacher education programs, Educational Measurement: Issues and Practice, 18(1), (pp.23–27), Stiggins R. (2002), Assessment crisis: The absence of assessment for learning, Phi Delta Kappan 83, no. 10: (pp.758–65), Stiggins R.J. and Conklin N. F. (1992) , In teachers’ hands: Investigating the practices of classroom assessment, Albany: State University of New York Press. Sweller, J. (2010) Cognitive Load Theory. Springer New York Sweller, J., van Merrie¨nboer, J. J. G., & Paas, F. G. (1998), Cognitive architecture and instructional design. Educational Psychology Review, 10, 251–296. The Fuchs research Group. What is an Assessment Tool? Retrieved from https://frg.vkcsites.org/what-are-assessment-tools/ on July 24, 2016. Tillema H. et al (2011), Assessing assessment quality: Criteria for quality assurance in design of (peer) assessment for learning – A review of research studies, Studies in Educational Evaluation, 37, p 25–34 Trinh Ba Tran (2016), Development of a course on integrating ICT into inquiry-based science education, Doctoral Dissertation, Vrije Universiteit Amsterdam. Van Gennip, N. A. E., Segers, M. S. R., & Tillema, H. H. (2009), Peer assessment for learning from a social perspective: The influence of interpersonal variables and structural features. Educational Research Review, 4(1), 41–54. Volante L., & Fazio X (2007), Exploring teacher candidates’ assessment literacy: Implications for teacher education reform and professional development, Canadian Journal of Education, 30(3), 749–770. Walter SD., Eliasziw M. and Donner A. (1998), Sample size and optimal designs for reliability studies, Statistics in Medicine, Vol. 17 No. 1, pp. 101-10. Wiggins G. (1989), A true test: Toward more authentic and equitable assessment, Phi Delta Kappan 70 p703–713. Wiggins G. and MC Tighe J. (2005), Understanding by design, Association for Supervision and Curriculum Development. Wiggins, G. (1993), Assessment: Authenticity, context, and validity. Phi Delta Kappan, 11(November), 200–214. Wiliam D., Lee C., Harrison C., & Black P. (2004), Teachers developing assessment for learning: Impact on student achievement, Assessment in Education, 11(1), 49–65. Wilson M. (2009), Measuring progressions: Assessment structures underlying a learning progression, Retrieved from https://doi.org/10.1002/tea.20318 Wyatt-Smith C.M., & Gunn S. (2009), Towards theorising assessment as critical inquiry, In C. Wyatt-Smith, & J.J. Cumming (Eds.), Educational Assessment in the 21st Century: Connecting theory and practice, pp. 83-102, Dordrecht, The Netherlands: Springer International. Zhang Z. & Burry-stock J.A. (1997), Assessment practices inventory: a multivariate analysis of teachers’ perceived assessment competency, Annual meeting of the American Educational Research Association, Chicago.

Các file đính kèm theo tài liệu này:

  • docxluan_an_boi_duong_cho_sinh_vien_su_pham_nang_luc_thiet_ke_co.docx
  • docxEng_Tom tat NTDLinh.docx
  • pdfEng_Tom tat NTDLinh.pdf
  • docEng_Vie_NTDLinh_TT nhung diem moi cua LA.doc
  • pdfEng_Vie_NTDLinh_TT nhung diem moi cua LA.pdf
  • pdfNTDLinh_HNUE.pdf
  • docxVietnamesse_Tom tat NTDLinh.docx
  • pdfVietnamesse_Tom tat NTDLinh.pdf