>>2013教師資格考試中學(xué)教育心理學(xué)考點(diǎn)命題章節(jié)匯總
第二節(jié) 教學(xué)測量與評價(jià)的方法和技術(shù)
與教學(xué)目標(biāo)相一致,教學(xué)評價(jià)也應(yīng)包括認(rèn)知、情感和技能三個(gè)方面。對于認(rèn)知和技能領(lǐng)域的學(xué)業(yè)成就,最常用的教學(xué)評價(jià)手段是標(biāo)準(zhǔn)化成就測驗(yàn)和教師自編測驗(yàn)。而對于情感以及道德行為表現(xiàn)則常常采用非測驗(yàn)性的評價(jià)手段,如案卷分析、觀察、問卷量表以及談話等。當(dāng)然,這些非測驗(yàn)性的評價(jià)手段也可作為學(xué)業(yè)成就評價(jià)的補(bǔ)充。
一、標(biāo)準(zhǔn)化成就測驗(yàn)
(一)標(biāo)準(zhǔn)化成就測驗(yàn)的含義及特點(diǎn)
標(biāo)準(zhǔn)化成就測驗(yàn)是指由專家或?qū)W者們所編制的適用于大規(guī)模范圍內(nèi)評定個(gè)體學(xué)業(yè)成就水平的測驗(yàn)。這種測驗(yàn)的命題、施測、評分和解釋,都有一定的標(biāo)準(zhǔn)或規(guī)定。由于測驗(yàn)條件的標(biāo)準(zhǔn)化,測驗(yàn)的結(jié)果比較客觀一致,適用的范圍和時(shí)限也較寬廣。其特點(diǎn)大致為:測驗(yàn)是由專門機(jī)構(gòu)或?qū)<覍W(xué)者按一定測驗(yàn)理論和技術(shù),根據(jù)全國或某一地區(qū)所有學(xué)校的共同教育目標(biāo)來編制的。所有受試人所做的試題、時(shí)限等施測條件相同,計(jì)分手段和分?jǐn)?shù)的解釋也完全相同。
(二)標(biāo)準(zhǔn)化成就測驗(yàn)的優(yōu)越性
第一,客觀性。在大多數(shù)情境下,標(biāo)準(zhǔn)化測驗(yàn)是一種比教師發(fā)展出的測驗(yàn)更加客觀的測量工具。第二,計(jì)劃性。專家在編制標(biāo)準(zhǔn)化測驗(yàn)時(shí),已經(jīng)考慮到所需的時(shí)間和經(jīng)費(fèi),因此標(biāo)準(zhǔn)化測驗(yàn)比大部分的課堂測驗(yàn)更有計(jì)劃性。第三,可比性。標(biāo)準(zhǔn)化測驗(yàn)由于具有統(tǒng)一的參照標(biāo)準(zhǔn),使得不同考試者的分?jǐn)?shù)具有可比性。
(三)標(biāo)準(zhǔn)化測驗(yàn)的局限性
第一,與學(xué)校課程之間的關(guān)系很不協(xié)調(diào)。在我國,每個(gè)地區(qū)的教學(xué)狀況還存在著一定的差距,一個(gè)年級或地區(qū)的教學(xué)內(nèi)容可能不同于另一個(gè)地區(qū)。因此,可能不少地區(qū)學(xué)生所學(xué)到的內(nèi)容與標(biāo)準(zhǔn)化樣本所學(xué)的東西有差異。這就要求教師在選用標(biāo)準(zhǔn)化測驗(yàn)前,仔細(xì)查閱內(nèi)容效度,使得測驗(yàn)的目標(biāo)與評價(jià)的目的相匹配。第二,測驗(yàn)結(jié)果的不當(dāng)使用,我們通常利用標(biāo)準(zhǔn)化成就和能力測驗(yàn)對學(xué)生分類和貼標(biāo)簽,對個(gè)體造成了不良影響。它們的使用對得低分的學(xué)生傷害尤大。
二、教師自編測驗(yàn)
(一)自編測驗(yàn)的含義與特點(diǎn)
教師自編測驗(yàn)是由教師根據(jù)具體的教學(xué)目標(biāo)、教材內(nèi)容和測驗(yàn)?zāi)康,自己編制的測驗(yàn),是為特定的教學(xué)服務(wù)的。教師自編測驗(yàn)通常用于測量學(xué)生的學(xué)習(xí)狀況,而標(biāo)準(zhǔn)化成就測驗(yàn)則用來判斷學(xué)生與常模相比時(shí)所處的水平。
(二)測驗(yàn)前的計(jì)劃
第一,確定測驗(yàn)的目的。
第二,確定測驗(yàn)要考查的學(xué)習(xí)結(jié)果。
第三,列出測驗(yàn)要包括的課程內(nèi)容。
第四,寫下考試計(jì)劃或細(xì)目表。細(xì)目表是將考試具體化的最重要的工具,使得測驗(yàn)?zāi)軌蚺c教學(xué)的目標(biāo)和內(nèi)容保持一致。細(xì)目表的形式是兩維表,一般縱欄表示學(xué)習(xí)結(jié)果,橫欄表示課程的內(nèi)容或范圍。中間的欄目,就是教師根據(jù)自己的情況填上在測驗(yàn)中計(jì)劃測量多大比例的學(xué)習(xí)結(jié)果和課程內(nèi)容。
第五,針對計(jì)劃測量的學(xué)習(xí)結(jié)果,選擇適合的題型。自編測驗(yàn)包括客觀題和主觀題兩種類型。教師使用哪一種類型的題目是由測驗(yàn)的目的、內(nèi)容和時(shí)間決定的。一般來說,由于這兩種題型各有優(yōu)點(diǎn)和不足,最好加以綜合使用。
(三)自編測驗(yàn)的類型
1.客觀題
客觀題具有良好的結(jié)構(gòu),對學(xué)生的反應(yīng)限制較多。學(xué)生的回答只有對、錯之分,因此教師評分也就只可能是得分或失分。這類題目包括選擇題、是非題、匹配題和填空題等。
(1)選擇題。選擇題是由題干和兩個(gè)或更多的選項(xiàng)組成的。題干可以是直接提問或者以不完整的名字形式出現(xiàn),目的是為了設(shè)置問題情境。而選項(xiàng)則提供可供選擇的答案,包括一個(gè)正確答案和若干具有干擾性的錯誤項(xiàng)或迷惑項(xiàng)。學(xué)生的任務(wù)就是閱讀題目,再從一系列選項(xiàng)中挑選出正確的項(xiàng)目。
教師在出題時(shí),要綜合考慮題干和選項(xiàng),使整個(gè)題目清楚明了。選項(xiàng)的數(shù)量一般沒有統(tǒng)一的規(guī)定,教師可以隨意確定選項(xiàng)的個(gè)數(shù),大多是4~5個(gè),這樣可避免學(xué)生猜測答案。所有的題目也可以安排各自不同數(shù)量的選項(xiàng)。良好的選擇題,題干應(yīng)該明確簡單,而選項(xiàng)又深具迷惑性。
經(jīng)過精心設(shè)計(jì)的題干和選項(xiàng),可以測查目標(biāo)系列中的高于知識水平的任何等級。此外,選擇題還有一種常用變式,選項(xiàng)中有一至多個(gè)正確答案,即通常被稱為多選題。這種題型的難度大大高于常規(guī)的選擇題(單選題),可以有效地檢查高一級的學(xué)習(xí)成果,在測驗(yàn)中使用較廣。
(2)是非題。是非題與選擇題有一點(diǎn)相似之處,就是學(xué)生需要識別、選擇出正確答案。常用的形式是,陳述一句話要求學(xué)生判斷對錯或是非。是非題可用于測量不同水平的教學(xué)目標(biāo)。
是非題形式簡單,能夠在一份試卷內(nèi)覆蓋大量的內(nèi)容。教師在評判時(shí)也較客觀,計(jì)分簡便省時(shí)。但是,一個(gè)重要的問題是:學(xué)生只有兩種選擇——對或錯,所以即使在完全猜測的情況下,他們也有50%的機(jī)會選擇到正確答案。一種可行的辦法是,增加題目的數(shù)量。由于題量大,對題目總體的取樣較全面,學(xué)生很難只憑猜測獲得高分。
(3)匹配題。匹配題是另一種可提供多種選擇的考試形式。通常,題目包括兩列詞句,一列是問題選項(xiàng),一列是反應(yīng)選項(xiàng)。學(xué)生根據(jù)題意按照某種關(guān)系將左右的項(xiàng)目連接起來。匹配題形式簡單,能夠有效地測量學(xué)生對知識聯(lián)系的掌握情況,且易于計(jì)分。但是,它只能用于測查彼此存在著簡單關(guān)系的知識。
(4)填空題。填空題是呈現(xiàn)給學(xué)生一句或一段不完整的話或者直接提問,要求學(xué)生簡要做答。當(dāng)教師的目的是考查學(xué)生對知識的回憶時(shí),填空題十分有用,它可將學(xué)生猜測的可能性降到最小。如果經(jīng)過精心設(shè)計(jì),也可以通過填空題來考查學(xué)生對知識的記憶和理解,以及推理和判斷能力。填空題的問題在于,學(xué)生的答案各不相同甚至還會出現(xiàn)出人意料的答案,學(xué)生的答案還會受筆跡、用詞等無關(guān)因素的影響。
2.主觀題
主觀題則要求學(xué)生自己組織材料,并采用合適的方式表達(dá)陳述出來。這類題型包括論文題及問題解決題。教師在評分時(shí),對學(xué)生的回答需要給出不同量的分值,而不僅僅是滿分或零分。
(1)論文題。論文題是指要求學(xué)生用文字論述方式闡述相關(guān)觀點(diǎn)的題目,回答字?jǐn)?shù)可以從幾段到幾大頁不等。一般較常使用的有兩種類型,有限制的問答題和開放式論文。有限制的問答題,是指教師對回答的內(nèi)容和長度都有規(guī)定,如平時(shí)測驗(yàn)中的簡答題等。例如,說明戊戌政變中的重要人物、事情經(jīng)過以及結(jié)果。開放式論文,則允許學(xué)生在內(nèi)容上可以自由選材、自由發(fā)揮,而且篇幅較長。論文題可以測驗(yàn)知識、理解或運(yùn)用水平,也可考查學(xué)生的分析、綜合、類比和評估知識的能力,還可考查學(xué)生組織信息或表達(dá)陳述某項(xiàng)意見的能力。
使用論文題也有不妥之處。首先,學(xué)生回答論文題需要花費(fèi)很多時(shí)間。因此,在一份試卷里只能出現(xiàn)少量的題目,對課程內(nèi)容的取樣也就非常有限。通過增加小的論文題(即簡答題或問答題),可以避免這個(gè)問題。其次,對于熟悉自己學(xué)生的教師,在判卷時(shí)很難做到客觀,導(dǎo)致信度較低。在評分時(shí),經(jīng)常出現(xiàn)一種現(xiàn)象一一暈輪效應(yīng),即教師對學(xué)生的總體印象影響到對論文題目的評價(jià)。因?yàn)槠綍r(shí)的接觸或者前面幾道題解答的情況,使得教師對學(xué)生形成了某種印象,從而影響到對之后題目的評判。
(2)問題解決題。問題解決題是向?qū)W生提供一定的問題情境和目標(biāo)情境,要求學(xué)生通過對知識進(jìn)行組織、選擇和運(yùn)用等復(fù)雜的程序來解決問題。通常有兩種形式,一種是間接測驗(yàn),與前面提到的幾種測驗(yàn)形式一樣,是采用紙筆測驗(yàn)來評價(jià)學(xué)生的學(xué)業(yè)成就或能力。學(xué)生在完成時(shí),通常必須寫出若干步驟或過程,以展現(xiàn)他的思路。評分時(shí),按照步驟計(jì)分,如果缺少某些步驟就不能得分。平時(shí)的理科考試多出這種類型的問題解決題。
問題解決題的另一種方式則是直接測驗(yàn)。例如,為了考查學(xué)生學(xué)習(xí)本節(jié)內(nèi)容的情況,讓學(xué)生編制一份測驗(yàn)小學(xué)兩步應(yīng)用題的測題。由于它考查了學(xué)生處理實(shí)際問題的能力,所以有時(shí)我們又把這種形式叫做操作評價(jià)。教師可以要求學(xué)生設(shè)想一個(gè)可以解決學(xué)校垃圾處理問題的方案(要求只寫可行性措施,不超過500字),或者要求學(xué)生測量學(xué)校操場的面積。操作評價(jià)對于考查高級思維技能十分有效,但是往往費(fèi)時(shí)費(fèi)錢,而且主觀性較大,并且效度也經(jīng)常受到質(zhì)疑。
(四)有效自編測驗(yàn)的特征
1.信度
信度是指測驗(yàn)的可靠性,即多次測驗(yàn)分?jǐn)?shù)的穩(wěn)定、一致的程度。它既包括在時(shí)間上的一致性,也包括內(nèi)容和不同評分者之間的一致性。例如,采用性格量表測量學(xué)生,他們在這一個(gè)月的結(jié)果,如果大致等于六個(gè)月前和三個(gè)月前的得分,那么我們就認(rèn)為測驗(yàn)
的信度較高。
2.效度
效度是指測量的準(zhǔn)確性,即一個(gè)測驗(yàn)?zāi)軌驕y量出其所要測量的東西的程度。效度是一個(gè)相對概念,任何一種測量工具只是對一定的目的來說才是有效的。效度考慮的問題是:測驗(yàn)測量什么?測驗(yàn)對測量目標(biāo)的測量精確性和真實(shí)性有多大?效度的重要性大于信度,因?yàn)橐粋(gè)低效度的測驗(yàn),即使具有很好的信度,也不能獲得有用的資料。例如,用磅秤稱量體重,連續(xù)多次都會得到相同的值,而且準(zhǔn)確地反映了個(gè)體的重量,那么信度和效度都很高;但是如果使用它來測量身高,雖然測量值之問總是保持一致的,即信度很好,但是并沒有說明個(gè)體的高度,因而不是適宜的測量身高的工具。
3.區(qū)分度
區(qū)分度是指測驗(yàn)項(xiàng)目對所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學(xué)生對測驗(yàn)項(xiàng)目的反應(yīng)與某種參照標(biāo)準(zhǔn)之間的關(guān)系來估計(jì)的。例如,可用年級或教師評定的等級作標(biāo)準(zhǔn),看測驗(yàn)的項(xiàng)目能否把不同年級或不同水平的學(xué)生區(qū)分開來。
(五)自編測驗(yàn)的常見錯誤
第一,教師過于相信自己的主觀判斷而忽視測驗(yàn)的信度和效度指標(biāo)。
第二,許多教師對測驗(yàn)準(zhǔn)備的重要性缺乏足夠的認(rèn)識,對測驗(yàn)準(zhǔn)備不夠充分,甚至沒有準(zhǔn)備。
第三,許多教師編制的測驗(yàn)太簡單,題量太小。
總之,測驗(yàn)準(zhǔn)備不充分、題量小、相信主觀判斷,都會導(dǎo)致過分強(qiáng)調(diào)無關(guān)細(xì)節(jié),從而忽略本章提到的那些重要的原則或注意事項(xiàng)。
三、非測驗(yàn)的評價(jià)技術(shù)
在實(shí)際教育中,前述紙筆測驗(yàn)并不是收集資料的唯一途徑。教師還使用了許多非測驗(yàn)的評價(jià)技術(shù),尤其是情感領(lǐng)域的教學(xué)評價(jià)更需要采用非紙筆測驗(yàn)。情感教學(xué)不屬于任何一個(gè)學(xué)科,其效果可能產(chǎn)生在任何一種認(rèn)知學(xué)科的教學(xué)過程中。
(一)案卷分析
案卷分析是一種常用的評價(jià)策略,其內(nèi)容主要是按照一定標(biāo)準(zhǔn)收集起來的學(xué)生認(rèn)知活動的成果。例如,學(xué)生的家庭作業(yè)或課堂練習(xí)、論文、日記、手工制作的模型、繪畫等各種作品。對學(xué)生的作品進(jìn)行考察分析,并形成某種判斷和決策的過程就是案卷分析。
(二)觀察
通過教學(xué)過程中的非正式觀察,教師也能夠搜集到大量的關(guān)于學(xué)生學(xué)業(yè)成就的信息。這種觀察不只限于智能的發(fā)展,還包括學(xué)生生理、社會和情緒的發(fā)展。為了確保觀察的有效性,教師應(yīng)注意自然地對學(xué)生進(jìn)行全面系統(tǒng)的觀察,然后客觀、詳細(xì)地記錄下觀察信息。
1.行為檢查單
教師可以使用檢查單來記錄其在教學(xué)中的觀察結(jié)果。檢查單一般包括一系列教師認(rèn)為重要的目標(biāo)行為,通常采用有/無的方式記錄,但有時(shí)也記錄下次數(shù)。行為檢查單使用簡便易行,對于教師非常有用。尤其在課堂上,教師可以利用檢查單及時(shí)記下所觀察到的行為,便于指導(dǎo)和幫助學(xué)生。如果行為是屬于某一個(gè)好一壞連續(xù)體上的某一點(diǎn),那么更適宜的方式是等級評價(jià)量表。當(dāng)觀察目標(biāo)是具體、特定的經(jīng)過了明確界定的行為時(shí),檢查單非常有效。
2.軼事記錄
軼事記錄是描述所觀察的事件。與檢查單相比,軼事記錄可提供比較詳細(xì)的信息,這些記錄一般是按照發(fā)生時(shí)間排列的。教師可以在事先有明確的觀察目標(biāo),就某一方面的行為進(jìn)行記錄;也可以沒有明確目的,事后再專門分析或考查某一件事,這時(shí)教師就需要記下很多資料,甚至包括一些無關(guān)信息。軼事記錄要求教師純粹記載下所觀察到的內(nèi)容,而不要摻雜進(jìn)個(gè)人的意見或觀點(diǎn)。許多教師在他們的教案或工作日記上,都有軼事記錄。但是,軼事記錄比較費(fèi)時(shí),而且也很難排除主觀偏見。
3.等級評價(jià)量表
等級評價(jià)量表對于連續(xù)性的行為,可能更為有效。它可用于判斷某種行為的發(fā)生頻率,以及某種操作或活動的質(zhì)量,使得觀察信息被量化。評價(jià)量表是一種間接的觀察技術(shù),通過量化所觀察的信息,可以迅速簡便地獲得概括化的信息。評價(jià)量表和行為檢查單有一定關(guān)系。二者都要求教師對學(xué)生的行為進(jìn)行判斷,可以在觀察過程中或結(jié)束后使用。但是它們的評價(jià)標(biāo)準(zhǔn)不同,檢查單只需要做定性的判斷,而等級評價(jià)量表是做定量的判斷。
(三)情感評價(jià)
許多時(shí)候,教師有必要針對學(xué)生的情緒、學(xué)習(xí)動機(jī)、個(gè)人觀點(diǎn)等進(jìn)行評價(jià)。固然,我們可以借助已有的量表,但是學(xué)校也鼓勵教師自己編制評價(jià)量表。為了獲得這類信息,教師可以自行編寫開放式問題、問卷等。而在對結(jié)果的評價(jià)時(shí),教師也需要寫一份詳細(xì)的報(bào)告,形式類似于上文的觀察報(bào)告。
四、教學(xué)評價(jià)結(jié)果的處理與報(bào)告
(一)評分
評分時(shí)必須以一定的比較標(biāo)準(zhǔn)為依據(jù),評分的標(biāo)準(zhǔn)可分為絕對標(biāo)準(zhǔn)和相對標(biāo)準(zhǔn)兩種。絕對標(biāo)準(zhǔn)是以學(xué)生所學(xué)的課程內(nèi)容為依據(jù),學(xué)生的分?jǐn)?shù)和其他同學(xué)的回答情況沒有關(guān)系。而且絕對標(biāo)準(zhǔn)強(qiáng)調(diào),由于不同學(xué)生的學(xué)習(xí)起點(diǎn)和背景情況的差異,所以他們的學(xué)習(xí)結(jié)果也是不可比較的。它對應(yīng)的評價(jià)方式,是標(biāo)準(zhǔn)參照評價(jià)。相對標(biāo)準(zhǔn)是以其他學(xué)生的成績?yōu)橐罁?jù),對應(yīng)于常模參照評價(jià)。相對標(biāo)準(zhǔn)的評價(jià)不僅與學(xué)生自己的成績有關(guān),還與其他同學(xué)的成績有關(guān)。
在評分過程中,常常存在計(jì)分主觀性問題,教師往往會受一些無關(guān)因素的影響,使得評分的信度較低。因此,評分標(biāo)準(zhǔn)一定要與測驗(yàn)的編制計(jì)劃和實(shí)際的編制工作保持連續(xù)性,確保整個(gè)評價(jià)活動是根據(jù)統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行的。這樣,評價(jià)結(jié)果才可能是教師所預(yù)期的信息,具有較高的信度,能夠?qū)虒W(xué)活動發(fā)揮積極作用。
合理的評分過程應(yīng)包括如下步驟:第一,搜集有關(guān)學(xué)生的信息,信息可以來源于不同類型、性質(zhì)的測驗(yàn),甚至觀察的評價(jià)方式。例如,教師對學(xué)生期末學(xué)習(xí)成績的評價(jià),通常是期末考試成績占70%,平時(shí)作業(yè)和考試成績占20%,課堂表現(xiàn)占10%。第二,系統(tǒng)地記錄下評價(jià)的結(jié)果,并隨時(shí)保持最新的結(jié)果。第三,盡量將搜集的資料量化,用數(shù)據(jù)來表示學(xué)生的學(xué)習(xí)情況。第四,為了把評價(jià)的重點(diǎn)放在最終的學(xué)習(xí)成就,教師需要加大最后測驗(yàn)得分的權(quán)重。第五,評價(jià)應(yīng)該以成就為依據(jù),而其他特征的評價(jià),不要和成就的評價(jià)混雜起來。
(二)合格與不合格
有些課程采用合格與不合格來評價(jià)學(xué)生的成就。教師可以根據(jù)學(xué)生是否完成了每次作業(yè)來評價(jià),也有可能根據(jù)學(xué)生的幾次作業(yè)情況評分,甚至評分的標(biāo)準(zhǔn)可以是學(xué)生的出勤情況。
(三)其他報(bào)告方式
除了常用的評分方法,教師還可以使用其他方式來報(bào)告評價(jià)結(jié)果。教師寫學(xué)生的個(gè)人鑒定或定期的綜合評價(jià),提供給家長和學(xué)生。觀察報(bào)告也是一種報(bào)告評價(jià)結(jié)果的形式。此外,通過與家長面談,也可以交流關(guān)于學(xué)生的學(xué)習(xí)、行為和態(tài)度等方面的資料。
相關(guān)推薦:
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |