一、教學(xué)評估的基本含義
標(biāo)準(zhǔn)化測驗(yàn):測驗(yàn)項(xiàng)目是給定的,通常在一致的環(huán)境下施測,評分過程有統(tǒng)一的程序。
課堂評估:由教師選擇和創(chuàng)造的評價方式,有許多不同的形式——單元測驗(yàn)、小論文、檔案袋、完成項(xiàng)目、動手操作、口頭報告等。
1、測量與評估
測量:用數(shù)量(數(shù)字)表示評價的過程。
評估:用來獲取學(xué)生表現(xiàn)的程序。
(1)形成性評估和終結(jié)性評估(按照功能或用途劃分,評估的兩種形式)
形成性評估:為了制訂計(jì)劃或?qū)嵤┰\斷而在教學(xué)之前或教學(xué)過程中進(jìn)行的一種不給出等級的測驗(yàn)。
終結(jié)性評估:教學(xué)之后評價成績的測驗(yàn)。
形成性評估和終結(jié)性評估的主要區(qū)別在于運(yùn)用評估結(jié)果的方式不同。任何一種評估類型——傳統(tǒng)方式、行為方式、項(xiàng)目完成、口語表達(dá)、檔案袋等,都可以用作形成性或終結(jié)性的目的。如果評估的目的是為了提高教學(xué)水平,幫助學(xué)生指導(dǎo)自己的學(xué)習(xí),評估就是形成性的;如果目的是為了評價最后的成就(同時決定課程學(xué)分),評估就是終結(jié)性的。
(2)常模參照測驗(yàn):個體分?jǐn)?shù)與其他人的平均分進(jìn)行比較的測驗(yàn)。
三種不同類型的常模團(tuán)體(用團(tuán)體的平均分作為評價其他學(xué)生在某測驗(yàn)上表現(xiàn)的標(biāo)準(zhǔn)):班級(或?qū)W校)內(nèi)部、學(xué)區(qū)和全國樣本。
常模參照測驗(yàn)特別適合只有少數(shù)頂尖選手才能進(jìn)入的項(xiàng)目,不太適合測量情感目標(biāo)或動作技能目標(biāo)。
(3)標(biāo)準(zhǔn)參照測驗(yàn):個體分?jǐn)?shù)與某個設(shè)定的標(biāo)準(zhǔn)進(jìn)行比較的測驗(yàn)。
標(biāo)準(zhǔn)參照測驗(yàn)測量的是對某些特定目標(biāo)的掌握程度,并非對所有情境都適用。
2、信度和效度
在形成測驗(yàn)和解釋結(jié)果時,信度、效度和無偏性是必須考慮的三個重要因素。
信度:測試結(jié)果的一致性。
效度:測驗(yàn)測到想測事物的程度。
一個測驗(yàn)要有效,首先必須是可信的。這個測驗(yàn)是可信的,但不是有效的。信度和效度是所有評估過程都需要考慮的問題,而不僅僅限于標(biāo)準(zhǔn)化測驗(yàn)。課堂測驗(yàn)也有信度和效度。
無偏性:評估偏見:評估工具因?qū)W生的性別、社會經(jīng)濟(jì)地位、種族、宗教和一些其他的群體特征而造成冒犯學(xué)生或不公平對待學(xué)生的性質(zhì)。包含兩種形式:不公平性和冒犯性。
教師應(yīng)該關(guān)心測量中的文化偏見,將文化因素和認(rèn)知因素區(qū)分開來,讓同事核查測驗(yàn)的偏見問題。
二、課堂測驗(yàn)評估
1、使用課本上的測驗(yàn):如果課本測驗(yàn)的質(zhì)量很高,與你的測驗(yàn)計(jì)劃相符合,同時與你的教學(xué)目標(biāo)相一致,那么運(yùn)用這些測驗(yàn)就是一個不錯的選擇。檢查每個題目的閱讀水平,對不適當(dāng)?shù)念}目進(jìn)行修改。
2、客觀題:多選題、連線題、判斷題、簡答題、填空題,得分的答案不需要解釋。多選題含題干、選項(xiàng)、干擾項(xiàng)三部分,編寫題干和選項(xiàng)需要巧妙的構(gòu)思。
3、論述題:主要用來測量重要的、復(fù)雜的學(xué)習(xí)結(jié)果。題目為學(xué)生提供了清晰精確的任務(wù),同時指明了答案中應(yīng)該包含的要素。
三、真實(shí)課堂評估
1、真實(shí)性與表現(xiàn)性評估
真實(shí)性評估:考查學(xué)生在真實(shí)情境中的技能和能力的評估方法。就是讓學(xué)生去表現(xiàn),這種表現(xiàn)可能是思維表現(xiàn)、身體表現(xiàn)、創(chuàng)造性的表現(xiàn)或其他形式。
表現(xiàn)性評估:為了展示學(xué)習(xí)效果,要求學(xué)生開展一項(xiàng)活動或制作一個物品的評估形式。
2、檔案袋和成果展示
檔案袋:對學(xué)生某個領(lǐng)域作品的收集,展現(xiàn)了學(xué)生的成長、自我反思和成就。過程性檔案袋記錄了學(xué)生學(xué)習(xí)進(jìn)步的過程,最佳工作檔案袋展示了學(xué)生最后的成果。
成果展示:一種表現(xiàn)性評估或?qū)W習(xí)展示,具有公開性,常常需要花額外的時間進(jìn)行準(zhǔn)備。
3、評價檔案袋和行為表現(xiàn):
1、評分準(zhǔn)則:用于確定學(xué)生行為質(zhì)量的規(guī)范。教師可以選取一個教學(xué)領(lǐng)域及下屬分支,然后就此設(shè)計(jì)一個準(zhǔn)則。
2、信度、效度和公平性:真實(shí)性評估并不能保證信度、效度和公平性(無偏性)。使用準(zhǔn)則是讓評估更可信、更有效的一種方式??墒牵跍?zhǔn)則的評估結(jié)果并不一定能預(yù)測與任務(wù)相關(guān)的行為表現(xiàn)。同樣,評分者可能基于個體的外貌、談吐進(jìn)行打分,也可能對少數(shù)族群學(xué)生的行為表現(xiàn)或資源匱乏的群體抱有偏見,這些偏見會讓少數(shù)族群學(xué)生在形成性評估中處于不利的地位。
3、非正式評估:是不需要評分的評估方式,主要用來收集多種信息以幫助教師進(jìn)行決策。包括學(xué)生觀察和核查表、提問、學(xué)生自我評估等。在非正式評估中,日記是被非常靈活和廣泛使用的方式。學(xué)生常常需要按照一定頻率完成個人或小組日記。
四、評分
1、常模參照評分與標(biāo)準(zhǔn)參照評分
常模參照評分:通過與他人比較來評估學(xué)生的學(xué)習(xí)成就。
標(biāo)準(zhǔn)參照評分:根據(jù)學(xué)生對課程目標(biāo)的掌握程度進(jìn)行評估。
2、分?jǐn)?shù)對學(xué)生的影響
(1)失敗的價值:應(yīng)該盡量避免在學(xué)校發(fā)生低分?jǐn)?shù)和失敗。當(dāng)教師幫助學(xué)生發(fā)現(xiàn)了努力學(xué)習(xí)和成績改善之間的聯(lián)系的時候,某種水平的失敗對于大多數(shù)學(xué)生而言反而是有益的。
(2)留級:讓一個學(xué)習(xí)有困難的學(xué)生簡單地留級或升級,都不能保證這個學(xué)生學(xué)習(xí)的進(jìn)步。除非與班里其他學(xué)生相比歲數(shù)更小或情感上不成熟而不得不留級外,一般而言最好的方法是讓學(xué)生繼續(xù)升級,并在暑假為他提供額外的教學(xué)支持。差異化教學(xué)能夠阻止問題的發(fā)生。
3、分?jǐn)?shù)與學(xué)習(xí)動機(jī):教師可以運(yùn)用分?jǐn)?shù)來激勵學(xué)生的學(xué)習(xí),但是,評價應(yīng)該支持學(xué)生的學(xué)習(xí)動機(jī)——而不是為了得到好的分?jǐn)?shù)而學(xué)習(xí)。如果分?jǐn)?shù)反映了有意義的學(xué)習(xí),那么為分?jǐn)?shù)而學(xué)習(xí)和為學(xué)習(xí)而學(xué)習(xí)就是同一件事情了。
4、與家長進(jìn)行溝通:教師與家長的交流絕不是簡單地告訴家長孩子的分?jǐn)?shù),交流的方式多種多樣:對成績單進(jìn)行說明;學(xué)生作品的檔案袋或成果展示;打電話,尤其是要報告好消息;學(xué)校提供開放時間;讓學(xué)生主持會議;成立家庭作業(yè)熱線;學(xué)?;虬嗉壘W(wǎng)頁;家訪。
五、標(biāo)準(zhǔn)化測驗(yàn)
1、平均數(shù)、中數(shù)、眾數(shù)和標(biāo)準(zhǔn)差:平均數(shù)(算術(shù)平均數(shù))、中數(shù)(中間的分?jǐn)?shù))和眾數(shù)(出現(xiàn)次數(shù)最多的分?jǐn)?shù))都是對集中趨勢的測量。標(biāo)準(zhǔn)差反映了分?jǐn)?shù)與平均數(shù)的離散程度。正態(tài)分布是一種鐘形曲線的頻數(shù)分布。很多分?jǐn)?shù)都聚集在中間,越往兩邊,分布的分?jǐn)?shù)就越少
2、分?jǐn)?shù)的不同類型:百分等級表明有百分之多少的人的分?jǐn)?shù)等于或低于某個體分?jǐn)?shù);年級當(dāng)量表明學(xué)生得分跟某個年級平均分的匹配程度;標(biāo)準(zhǔn)分是基于標(biāo)準(zhǔn)差得到的。T分?jǐn)?shù)和z分?jǐn)?shù)都是常見的標(biāo)準(zhǔn)分。標(biāo)準(zhǔn)九也是一種標(biāo)準(zhǔn)分,整合了百分等級等元素。
3、當(dāng)前測驗(yàn)存在的問題
關(guān)于標(biāo)準(zhǔn)化測驗(yàn)的矛盾主要聚焦于以下幾個方面:測驗(yàn)的作用及其解釋、過多通過測驗(yàn)來評估學(xué)校、對測驗(yàn)分?jǐn)?shù)的不當(dāng)解釋以及對教師的測驗(yàn)。如果測驗(yàn)符合重要的課程目標(biāo),接受測驗(yàn)的學(xué)生在某個合適的階段確實(shí)學(xué)習(xí)了這些課程,測驗(yàn)本身沒有偏差,學(xué)生能夠理解測驗(yàn)文字,施測方法正確,那么測驗(yàn)結(jié)果就能夠提供一些反映學(xué)校質(zhì)量的信息??墒菍?shí)際測驗(yàn)的行動研究發(fā)現(xiàn)了一些令人擔(dān)憂的結(jié)果,它可能會限制課程內(nèi)容的擴(kuò)展或逼迫學(xué)生盡早退學(xué)。教師應(yīng)該運(yùn)用測驗(yàn)的結(jié)果去改善教學(xué),而不是對學(xué)生形成刻板印象或僅僅證明自己對學(xué)生的低期望。
4、量化評估對教師的啟示
教學(xué)和測驗(yàn)的好壞主要取決于教師能否(1)意識到并對學(xué)生的差異作出反應(yīng)(2)制定明確的學(xué)習(xí)結(jié)果(3)使用前測和形成性評價監(jiān)控學(xué)生的進(jìn)步(4)采用多樣化的教學(xué)方式確保每一個學(xué)生都能取得進(jìn)步(5)確保學(xué)生知道終結(jié)性測驗(yàn)成功的標(biāo)準(zhǔn),并且這些測驗(yàn)是與既定的學(xué)習(xí)目標(biāo)相聯(lián)系的(6)提供不同的評估形式,確保學(xué)生能夠有機(jī)會、無障礙地展現(xiàn)自己學(xué)到的內(nèi)容。