<擬卷要素> 陳鴻昌

傳統評估理論, 多談及測考試卷的信度(reliability)和效度(validity)。然而,本文總結優質學校改進計劃(QSIP)團隊與前線教師合作的經驗,並以筆者在過往近百場有關評估素養的教師發展工作坊及公開研討會中,曾談及擬訂測考卷的幾點要素作為基礎,以較貼近前線工作實況的語言,表達擬卷要素,包括「教考相配」、「深淺適宜」及「縱向規劃」。

教考相配
考試要與教學配合,相信是教育界的共識,為何還要討論?原因是教考相配本身存有多重意義:

一、內容相配
一般而言,中文科教師不會在中文科試卷上擬定物理科內容,地理科教師又不會教第一課而故意考第八課的內容,這種教學內容上的配合,是必然合理的。這種「相配」的淺層意義,無須多談。

二、技術相配
為了說明這種相配,可參考以下例子:一名初中中國歷史教師,在課堂內多講史實,並經常抽問學生史實,鼓勵學生搶答。久而久之,學生的注意力便會集中在「快速回答史實」方面。若教師在考試時擬定一些像香港中學文憑考試形式的資料題,並要求學生分析、評論及表達個人意見,而學生平日上課並沒有相關技巧的訓練,便難於回答這類高階思維的問題。即使教師教授唐朝的史實,而考試時亦只用唐朝的材料,這只是內容相配,而技術不配。

三、教學目標相配
再用上述例子反過來說,若一名中國歷史教師在中四課堂著重史實,也要求學生背誦史實,到考試時又只考核背誦史實的問題,表面上是內容相配、技術相配了。然而,高中課程著重能力轉移,目標在訓練學生高階思維能力,那麼,即使考試題目與教學內容及技術皆相配,但卻與教學目標不配。這種情況較為複雜,不單是擬卷上的問題,更是平日教學的問題。

一份好的試卷,在於內容、技術及目標皆能配合日常教學。

深淺適宜及縱向規劃
一份試卷的深淺程度,一般宜以「易合格、難高分」的原則擬題,給根基較弱的學生有一個追上進度的機會,同時給優異生有適當的挑戰,以保持不同能力學生的溫習動機。然而,科組必須對深、淺的定義有共識,否則空談深淺題目的百分比,仍無法控制試卷的深淺度。

而縱向規劃,是指科組要有一個跨級的宏觀藍圖,在考試時間、題型、深淺比例等作循序漸進的規劃。更重要的是在這方面的討論,有助全科組對題目的深淺度與各級的教學目標達到共識。例如同樣是涉及描寫文,對中一的要求與對中三的要求應有不同。在縱向規劃下,可防止擬卷時同類型的題目會出現中一比中三深的情況。

有關深淺適宜及縱向規劃的更詳細討論,可見筆者另文「再談照顧學習差異(下)」1。

科主任的角色
以上三項擬卷要素,正是科主任在擬卷把關時的注意點。在教考相配上,科主任除在訂定各級教學目標上扮演積極的角色外,更需要把觀課的所見所聞,與考卷的題目作一定的聯繫,才能判別擬題在內容、技術及教學相標上,是否教考相配。在深淺程度上,科主任需要帶領科組一同探討,可借用過去的試卷作為入手點,尋找科組共識。在縱向規劃上,除了帶領科組取得有關共識外,在擬卷把關時,只有科主任才有縱觀全局的權力與責任,作跨級的監察及協調。

此外,科主任的工作,還有「善用數據」,即利用測考結果的量化、質化數據,發掘探究點。例如某科某級不合格人數較多,首先應檢視試卷題目的深淺度是否合適,以及是否在內容、技術及目標皆配合教學,從而改善將來擬卷質素。若試卷沒有問題,便應進一步探討教學策略的改變。有關這部分,詳見下期QSIP團隊的文章。


註[1]: 再談照顧學習差異(下) http://qsip.fed.cuhk.edu.hk/en/article_pdf/20150730b.pdf