小學(xué)教育學(xué)(中等師范)全冊復(fù)習(xí)材料(十九)
來源:育路計算機(jī)考試頻道發(fā)布時間:2008-09-23
第十二章 教育測驗(yàn)與評價——第一節(jié) 教育測驗(yàn)
一、教育測驗(yàn)的概念
(一)概念界說
測量是給事物的某種屬性給定數(shù)值的過程,回答了“有多少”的問題。教育測量包括了從身體身體素質(zhì)到興趣態(tài)度等多個方面。
測驗(yàn)是對于知識水平、情意狀態(tài)、運(yùn)動技能等的數(shù)量化測定,有廣義和狹義之分。狹義的測驗(yàn)僅指一份測驗(yàn)卷子,而廣義的測驗(yàn)指編制試題、施測、評分到報告成績的全過程。在教育領(lǐng)域,測驗(yàn)只是測量的一種形式,主要用來測量學(xué)生的學(xué)業(yè)成績和心理特點(diǎn)。如果說測量回答了“有多少”的問題,只考察量的大小,測驗(yàn)則回答了“某個人做的怎么樣”的問題,包含了對測驗(yàn)結(jié)果的解釋和評判。
規(guī)范的考試是教師在教學(xué)過程中編制試題、評定學(xué)生學(xué)業(yè)成績的過程,如期中、期末考試。它與測驗(yàn)的區(qū)別有兩種看法。第一種是從教育測量學(xué)中引出,認(rèn)為測驗(yàn)更為規(guī)范,從試題編制、實(shí)施測驗(yàn)測驗(yàn)到評分過程都有嚴(yán)格的程序,而考試則是教師可自行安排,相對靈活,技術(shù)要求不高的測驗(yàn)形式。另一種觀點(diǎn)與第一種正好相反,認(rèn)為測驗(yàn)比較隨意,而考試則較為正式。本書主要采用第一種觀點(diǎn)。
評價是對某種教育活動的價值判斷。評價包含定性描述或價值判斷,更多的時候是兩者兼而有之。
(二)測驗(yàn)的功能
測驗(yàn)具有以下功能:(1)激勵功能;(2)診斷功能。診斷性測驗(yàn)主要考察兩個方面,一個是看基礎(chǔ)打得好不好,可否滿足學(xué)習(xí)某種新知識的需要,另一個是看理解和掌握上有什么錯誤及其原因所在,它為教學(xué)提供了豐富的反饋信息,使教師能及時調(diào)整教學(xué);(3)區(qū)分和選拔功能。升學(xué)考試就體現(xiàn)了測驗(yàn)的選拔功能,如高考;(4)評定功能。
二、測驗(yàn)的類型
從測驗(yàn)?zāi)康纳峡紤],可以分成安置性測驗(yàn)、形成性測驗(yàn)、診斷性測驗(yàn)和總結(jié)性測驗(yàn)。從測驗(yàn)內(nèi)容上考慮,可以分成成就測驗(yàn)和學(xué)能測驗(yàn)。從規(guī)范程度上區(qū)分,可以分成標(biāo)準(zhǔn)化測驗(yàn)和教師自編測驗(yàn)。從結(jié)果解釋所參照的標(biāo)準(zhǔn)區(qū)分,又可以分成常模參照性測驗(yàn)和標(biāo)準(zhǔn)參照性測驗(yàn)。
(一)安置性測驗(yàn)、形成性測驗(yàn)、診斷性測驗(yàn)和總結(jié)性測驗(yàn)
安置性測驗(yàn)的根本目的是分班、分組。安置性測驗(yàn)涉及的范圍比較窄,難度也比較低。
形成性測驗(yàn)針對某一教學(xué)單元而設(shè)計,在教學(xué)過程中進(jìn)行,其目的不在于評定學(xué)生,而是為了調(diào)控教學(xué)。
診斷性測驗(yàn)?zāi)軌蚍从硨W(xué)習(xí)中常見的錯誤,診斷學(xué)習(xí)困難,特別是找到困難的成因。診斷性測驗(yàn)的目的是發(fā)現(xiàn)問題,評分不作為正式成績。
總結(jié)性測驗(yàn)用于對學(xué)生學(xué)習(xí)情況的階段性總結(jié)分析。在一個段落或一門課結(jié)束后,教師會編制一套試題,全面考察學(xué)生的掌握情況。現(xiàn)行小學(xué)學(xué)科測驗(yàn)多采用閉卷形式,有時候也要求學(xué)生完成實(shí)踐性課題。
(二)標(biāo)準(zhǔn)化測驗(yàn)和教師自編測驗(yàn)
標(biāo)準(zhǔn)化測驗(yàn)在試題編制、施測和評分過程中有著嚴(yán)格的規(guī)范。標(biāo)準(zhǔn)化測驗(yàn)是由測驗(yàn)專家和教師共同編制的,試題質(zhì)量較有保障。最典型的標(biāo)準(zhǔn)化測驗(yàn)是智力測驗(yàn),如“比奈智力量表”。
教師自編測驗(yàn)是教師自己編制的測驗(yàn),是在教學(xué)過程中針對教學(xué)實(shí)際引用現(xiàn)代測驗(yàn)原理編制的。教師自編測驗(yàn)針對性、靈活性強(qiáng),能反映實(shí)際教學(xué)中遇到的特殊問題。
(三)成就測驗(yàn)和學(xué)能測驗(yàn)
成就測驗(yàn)是對學(xué)生學(xué)業(yè)成績的檢查,常結(jié)合具體學(xué)科而設(shè)。學(xué)校平時的課堂測驗(yàn),期中、期末考試等,都是成就測驗(yàn)。
學(xué)能測驗(yàn),又稱學(xué)能傾向測驗(yàn),它考察學(xué)生在課程學(xué)習(xí)中所獲得的能力,與學(xué)業(yè)成就有較大關(guān)系。學(xué)能測驗(yàn)不局限于某門課程,關(guān)心各門課程都需要具有一般能力,主要包括文字推理測驗(yàn)和數(shù)字推理能力測驗(yàn)。學(xué)能測驗(yàn)一般在小學(xué)畢業(yè)前進(jìn)行,能在一定程度上預(yù)測學(xué)生的發(fā)展?jié)摿Α?nbsp;
學(xué)能測驗(yàn)與成就測驗(yàn)的區(qū)別在于,成就測驗(yàn)針對具體的教學(xué)內(nèi)容而定,著重考察知識的掌握情況;而學(xué)能測驗(yàn)的測驗(yàn)內(nèi)容比較寬泛,側(cè)重于能力考察。
(四)常模參照性測驗(yàn)和標(biāo)準(zhǔn)參照性測驗(yàn)
常模參照性測驗(yàn)是按照在特定群體中的相對位置決定成績的好壞。選拔性考試一般是典型的常模參照性測驗(yàn),如高考。常模參照性測驗(yàn)要在所定教學(xué)內(nèi)容中,選出一些能區(qū)分出學(xué)生水平的題目,它不一定要面面俱到,但應(yīng)該能拉開分?jǐn)?shù)距離。題目難度以中等為宜,特別難和特別簡單的題目要少一些。
標(biāo)準(zhǔn)參照性測驗(yàn)是考察是否達(dá)到了預(yù)先規(guī)定的標(biāo)準(zhǔn),類似于各種執(zhí)照考試,如駕駛執(zhí)照考試。這種測驗(yàn)只關(guān)注考生是否達(dá)到了應(yīng)該達(dá)到了應(yīng)該達(dá)到的水平,而不去管別的考生怎么樣。確定“合格”或“掌握”的標(biāo)準(zhǔn)是標(biāo)準(zhǔn)參照性測驗(yàn)?zāi)芊袢〉贸晒Φ年P(guān)鍵。標(biāo)準(zhǔn)參照測驗(yàn)往往是針對某幾個特殊的知識點(diǎn)而設(shè)計,題目覆蓋面廣,并盡可能把所學(xué)的重要知識都反映出來。標(biāo)準(zhǔn)參照性測驗(yàn)不去刻意拉開學(xué)生間的距離,題目該難就難,該易就易,完全隨知識點(diǎn)的要求而定。
常模參照性測驗(yàn)和標(biāo)準(zhǔn)參照性測驗(yàn)的區(qū)別是:前者著重同學(xué)間的比較,后者關(guān)心有沒有達(dá)到預(yù)定的學(xué)習(xí)目標(biāo)。常模參照性測驗(yàn)適用于選拔性考試和總結(jié)性評定;而標(biāo)準(zhǔn)參照性測驗(yàn)適用于診斷和發(fā)現(xiàn)學(xué)生的不足,從而為改進(jìn)教學(xué)提供反饋信息。 三、良好測驗(yàn)的標(biāo)準(zhǔn)
好的測驗(yàn)都應(yīng)當(dāng)符合一定的要求,通常用實(shí)用性、信度、效度、難度和區(qū)分度等指標(biāo)衡量測驗(yàn)質(zhì)量。
1.實(shí)用性
實(shí)用性反映了試題的基本質(zhì)量,其基本要求是便于組織,便于實(shí)施,節(jié)時省力。(便于組織。(2)測驗(yàn)便于實(shí)施。(3)容易評分。(4)結(jié)果要容易解釋。
2.可信度
可信度又稱信度,指測驗(yàn)結(jié)果的前后一致程度,表示了分?jǐn)?shù)的穩(wěn)定性和可靠性。具體要求是,先后兩次用同樣的試卷測查同一批學(xué)生,則兩次測驗(yàn)的分?jǐn)?shù)應(yīng)該比較相近;對同樣的答卷組織兩次評分,評分結(jié)果相近。如果上述評分結(jié)果相差懸殊,就表示可信度很低。評分的客觀性常用評分者信度來說明。
3.有效性
有效性在測量學(xué)上也稱為測驗(yàn)的效度,指一個測驗(yàn)?zāi)軠y到預(yù)先想測的知識和能力的程度。估計測驗(yàn)效度的方法主要有兩種:(1)內(nèi)容效度,反映了題目對所考察內(nèi)容的代表性問題。(2)效標(biāo)關(guān)聯(lián)效度,反映了測驗(yàn)分?jǐn)?shù)和所選擇的效標(biāo)分?jǐn)?shù)之間的一致程度。和信度相比,測驗(yàn)的效度更為重要。因?yàn)樾Ф雀叩臏y驗(yàn)信度一定高。
4.難度
難度即測驗(yàn)的程度,提供了試題平均通過率的信息。一份試卷的難度取決于每一道題的難度。難度用全體被試在某題的得分率(P)表示。如果全部通過,難度為1;如果誰都沒有通過,難度為0。難度值在0到1之間,難度值越大,表示題目越容易。高分段人數(shù)少,低分段的人數(shù)多,表示難度較高。高分段的人數(shù)多,低分段的人數(shù)少,表示難度較低。難度中等時,最容易拉開考生間的檔次。不同的測驗(yàn)對難度有不同的要求,如選拔性考試難度以中等為宜,否則很難篩選。一般來說,某一道試題答對的學(xué)生少于20%時便是過深,答對的多于80%時則是偏淺。
5.區(qū)分度
區(qū)分度是測驗(yàn)?zāi)芊窭_分?jǐn)?shù)距離的指標(biāo)。試題的區(qū)分度也稱為鑒別力,表示某道題目能夠?qū)⒉煌潭鹊膶W(xué)生鑒別開來的能力。試題難度直接影響區(qū)分度,特別難的題目大家都不會做,特別容易的題目大家都會做,這兩種題目區(qū)分度都很低。反之,中等難度的試題的區(qū)分度比較高,難度為0.5的題目,區(qū)分度最大。
四、測驗(yàn)的編制和實(shí)施
(一)確定試題內(nèi)容
在選擇試題內(nèi)容時,應(yīng)設(shè)計測驗(yàn)藍(lán)圖。測驗(yàn)藍(lán)圖包括確定測驗(yàn)?zāi)康、測驗(yàn)內(nèi)容以及編制雙向細(xì)目表等內(nèi)容。(1)確定知識點(diǎn)。(2)確定認(rèn)知水平。(3)設(shè)計雙向細(xì)目表。雙向細(xì)目表是由教學(xué)內(nèi)容和教學(xué)目標(biāo)構(gòu)成的的。
(二)選擇試題類型
課堂測驗(yàn)的題型有客觀題和論文題兩種?陀^題包括填空、判斷正誤和多項選擇等題型。論文題包括簡答題和論述題。因?yàn)榭陀^題和論文題各具優(yōu)缺點(diǎn),所以搭配使用效果最佳。
(三)評分
計分方法可分為等級分和百分制兩類。等級分在中國隋唐一代就廣為使用,百分制則是20世紀(jì)初教育測量學(xué)的發(fā)展產(chǎn)物。等級制的計分方法除五分制和A、B、C、D、E外,還有許多變形。使用等級分的好處是避免了在同一分?jǐn)?shù)等級上同學(xué)間的攀比,會減輕過分的分?jǐn)?shù)競爭。但缺點(diǎn)在于,等級分比較粗略,不容易反映個體間細(xì)微的差別,評分尺度也較難把握。在評分時,教師要注意到自己對學(xué)生的看法可能會影響到評分過程。和百分制相比,等級制能避免“分分計較”的學(xué)習(xí)心理,減輕學(xué)生的考試負(fù)擔(dān)。
(四)測驗(yàn)分?jǐn)?shù)的解釋
分?jǐn)?shù)只有經(jīng)過解釋具有實(shí)際意義。解釋分?jǐn)?shù)時,既可以和其他同學(xué)的學(xué)習(xí)表現(xiàn)相比較,也可以和考核標(biāo)準(zhǔn)相對照。分?jǐn)?shù)的意義是在比較中獲得的。如同樣考85分的兩個同學(xué),其分?jǐn)?shù)值雖然相同,但反映出的水平和存在的問題并不完全相同。




