2016年7月14日下午🚣🏼♀️,美國波士頓EON4(Boston College)研究生賈靜同學為我院師生介紹了她在美國研究生項目——“教育研究、測量與評估(Educational Research, Measurement, and Evaluation)”,對所學的專業課程進行了介紹並分享了自己的學習體會。我院岑逾豪老師、博士生和碩士生參與此次報告會。
賈靜同學在研一期間主要修學的課程包括項目評估、統計學、測試建構和大規模監測。她梳理了課程中的核心知識點👍🏻,並與高教院的師生進行了學術交流👩👧。關於項目評估課程🥓,她展示了價值論、本體論🦹🏿♂️、知識論和方法論的理念演進🦹♂️,及在這些哲學理論的指導下衍生出的四種研究範式👨🏻🦼➡️,即後實證主義、實用主義、建構主義和變革主義。賈靜認為🫶🏽,評估者在評估過程中都會持有自己的價值觀,從而選擇相應的評估方法開展評估,沒有唯一或絕對正確合理的評估方式◼️。賈靜還重點介紹了一種在美國常見的評估方法——基於理論的評估(Theory-Based Evaluation),這種評估方法是探尋項目過程中的邏輯鏈,從項目投入💏、項目產出和長遠影響方面來評估該項目的實施情況。
關於統計課程🏄🏼♂️,賈靜回顧了統計學知識主幹🧑🏼🏫,講述了假設檢驗🪙、方差分析和回歸模型等基本統計方法。關於測試建構課程🧖♀️,賈靜認為試卷的有效性不僅在於試卷本身,而是在於試卷投入使用的實際過程中。她強調建構一個有效試卷需要考慮多元因素✧,除了題項本身難易程度🧚🏼,還需要註意測試環境🥠、被測者信仰以及文化差異等。
接下來,賈靜介紹了波士頓EON4兩項著名的大規模監測研究,包括國際數學和科學評測趨勢(The Trends in International Mathematics and Science Study, 簡稱TIMSS)和國際閱讀素養進步研究(Progress in International Reading Literacy Study, 簡稱PIRLS)。TIMSS主要測試四年級和八年級學生的數學與科學學業成績。目前,中國大陸尚未參加項目測試。PIRLS是對四年級學生的閱讀素養進行評價的比較研究。該大規模監測研究為賈靜同學及其研究生項目的同學們深入了解測試數據提供了良好的平臺,學生們能夠親身體驗測試數據的嚴密性和趣味性。
最後,賈靜介紹了如何運用項目反應理論(IRT)構建學生內在特質能力與學生對題項的反應之間的關系🈚️。與經典測驗理論(CTT)不同,CTT是簡單構建一個學生的觀測分數和真分數之間的線性關系🔻,而IRT從心理學角度考慮了更復雜的學習行為👰🏻♂️,更加接近現實。
會後,我院師生與賈靜進行了深入學術探討👶🏻。博士生余天佐就“assessment”和“evaluation”二詞的意義差異進行提問。賈靜和岑老師分別闡述了各自觀點,岑老師認為assessment強調測試評估的工具性與完整性🕴🏼,而evaluation具有更加寬泛的含義↩️🛵。賈靜認為evaluator在評估中擔任的角色比較多元豐富👶🏻⚓️,而assessor扮演的角色更具專業性與技術性。