國際高校素質教育“打分”機制錄取模式追求多元且公平
发布时间:2020-11-14 | 发布者: 东东工作室 | 浏览次数: 次【世界教育之窗】
對學生進行全面的評價並在此基礎上進行人才選拔,是國際上諸多高校招生錄取的共同趨勢。綜合評價是一個經常被提及的概念,實際上就是對學生能否滿足大學學習來進行全面考查。既然要對學生進行綜合評價,就必然涉及不同的測評方式、測評主體和測評結果之間的差異。
近年來大量研究表明,這些綜合性的測評結果比單一的考試成績更能夠預測學生的未來成就。因而,很多世界知名高校在進行人才選拔中,都非常注重這些多元化的測評結果,包括學生特長、標准化考試成績、平時表現、興趣愛好、情感、價值觀、課外活動等。
但是,如何讓這些不同維度的特質在科學、公平的基礎上可用、可比,則是一個極其復雜的難題。一些國家的高校結合辦學定位和人才培養模式進行了一些探索,形成了各有特色並具有重要借鑒意義的經驗。
1.測評是個技術活
目前,國際上考試測評行業發展的一個重要趨勢就是為測評者提供各種人性化的服務,以滿足學習者學習和終身發展的需要。例如,在全球化時代,受教育者和各類人才的國際流動更加頻繁。他們在不同時間、不同地區參加測評,然后帶著這些測評結果在不同國家或地區、不同時間點來替代使用成為一種當下的迫切需要。國際上的一些大規模教育測評項目,如經濟合作與發展組織推出的國際學生評估項目(PISA),每三年就要針對全球近80個國家和地區的15歲學生進行閱讀、數學、科學等方面的測試。PISA所用的試題有很多套而且並不完全相同,但是其公布的測評結果可以直接進行比較,這對測評技術而言無疑是一個巨大的挑戰。
在高校人才選拔所依據的大規模標准化考試中,同樣也存在類似情況,如美國的學術能力測試(簡稱SAT)和大學入學考試(簡稱ACT),兩者都是美國很多大學人才選拔所要求的重要測試。SAT由美國大學理事會委托教育考試服務中心舉辦,SAT主要考查學生在大學學習所需的閱讀、寫作、數理等方面的技能,尤其是批判性思維能力。該考試每年提供7次考試機會,學生可以依據自己的情況,報名參加其中任何一次或者幾次考試,並且自行決定用哪次考試的成績去申請大學。ACT由專業化的考試公司主辦,每年舉行6次,與SAT一樣,主要作為大學新生選拔和獎學金發放的依據。ACT考試包括五個部分:英語、數學、閱讀、科學以及作文(選考)。與SAT不同的是,ACT關注學生對中學課程知識的掌握情況,更加突出對學科能力的考查,這些基於學科的能力和大學學習所需的能力緊密地結合在一起,受到了公立大學的歡迎。
SAT、ACT均實施一年多次考試,這給學生提供了多次考試機會,在一定程度上緩解了復習備考的壓力,但卻對考試質量提出了非常高的要求。其中最關鍵的是,各次考試的難度需要盡可能保持一致。否則,試卷難度時高時低,就會帶來考試的科學性、公平性方面的一系列問題。然而,在考試之前就命制出難度完全一樣的多套試卷是幾乎不可能的。對此,SAT和ACT的開發者設計了一整套測量與評價技術來對考試成績進行一定的處理,以消除不同次考試試題難度的影響,從而使得各次考試難度能夠保持一致性和基本穩定。在這個過程中,等值就是一項常用的考試技術,廣泛應用於一些國際性的大型教育考試與評價項目中。
在SAT和ACT之間還面臨一個至關重要的問題,那就是兩者成績之間如何建立聯系。原因很簡單,美國很多高校在招生時會要求學生提交這兩個考試的任何一個成績。從選拔的結果來看,同一所大學所錄取的新生中,提交SAT和ACT考試成績的考生各佔一定比例。而如前文所述,SAT和ACT在知識與能力考查目標上存在較大差異,可以說,它們作為兩個不同的測評工具,天然就不具備考試技術上的可比性。那又如何保証這兩個性質不同的考試可以相互比較甚至替代呢?這同樣涉及科學性和公平性的問題。對此,這兩個考試的主辦方美國大學理事會和ACT公司通力合作,通過對同時參加這兩個考試學生的追蹤和對比研究,從成績使用的角度來公布出一份SAT與ACT的分數轉換表,以明確這兩個考試結果之間的對應關系。例如,在滿分1600的SAT中得1490-1520分,就相當於在滿分36的ACT中得34分。這樣一份轉換表,實現了不同測評在結果使用上的等效,為高校的人才選拔和測試者都提供了極大的便利。
2.及時修正的統計模型
很多歐美國家的高校在進行人才選拔時,一般會要求學生提供綜合性的申請材料,包含一系列能夠証明自己學習能力的測評結果。其中一些是過程性評價的結果,比如學生在學習過程中的班級排名、階段測驗成績、GPA、校本評價結果等。在澳大利亞、新西蘭等國家,則還包括日常教學過程中任課教師對學生的學業表現進行的綜合判斷,涉及專題學習、實驗技能、日常課程學習狀況。這些方面的測評結果是學生在校期間學習狀況最直接的表現,不但反映了學生在校期間各學科的學習狀況,更可以反映出學生在不同學習階段間的成長變化情況。
教育領域的研究表明:在整個學習過程中,相比較而言,最了解學生的是任課教師,最能體現學生水平的是能夠反映長期表現的學校評價結果,相比之下,任何一次性的終結性考試都必然存在測量誤差。因此,在學習過程中的各種評價,理應在高校的人才選拔中佔有一席之地。但是,不同學校的學校評價結果之間缺少可比性,因為校本評價在對象、測評工具、群體上均存在極大差異,倘若盲目使用,則會造成不公平的現象。
為了解決上述難題,英聯邦的一些國家和地區引入了一種新的機制來對校本評價結果進行校正。這種機制的核心是一種“統計模型”——基於學生的平時成績、老師對學生各方面的評價,以統一考試的結果為基准,建立相應的統計模型來調整校本評價的結果,並把它統一到同一把量尺上,最后再納入學生的綜合評價中。這樣做則能在根本上確保不同教師、學校、地區所做出的評價結果之間具有可比性。
這種統計方法調整的基本思路是:測評的組織機構通過建立相應的統計模型,用終結性評價結果來校驗過程性的評價。參照各學生在統一測評中的成績來對校內評價進行修正,以達到消除校際之間評分差異的目的。在這個過程中,如果某學校的校內表現低於與其在終結性評價中水平相當學校的表現,該校的評價結果就會被適當調高,相反則會被調低。需要強調的是,盡管調整后學生的評價結果會發生變化,但其在學校中的排位不會變。這種統計分析方法的優點是多方面的:維持了評價結果在學校之間的可比性,以確保評價的公平﹔促使評價結果在年與年之間的穩定性,提升了測評的信度、效度和精度﹔搜集數據回饋學校,進一步優化校本評價的開展,提升學校和老師的評價素養。
3.多元錄取的新趨勢
转载请标注:我爱技术网——國際高校素質教育“打分”機制錄取模式追求多元且公平