明晰了测评构念、选择了测评途径之后,就进入测评工具开发或选择阶段。阶段三开发测评工具时,需注意测评的是“潜在的”[17]构念,因此测量与评价要解决的一个关键问题是如何用外显的工具引发学生隐性的思维过程、认知反应,并据此判断其构念发展水平。此处勾勒的测评工具开发小模型突出了测评工具开发中需要特别重视的一个方面,即需要考虑工具引发的学生反应。......
2023-08-17
2019年全国Ⅱ卷和北京卷设置了选做题,并且旗帜鲜明地打上了“任选”两字。“任选”表征一种相当高的开放度和自由度。
(一)任选形式差异
两个选做题,命题思路还是有差别的。北京卷“从下面两个题目中任选一题,按要求作答”,提供了两个完全独立、不相关的题目,两个题目界限分明。
全国Ⅱ卷,虽然也是“从下列任务中任选一个”完成,但五个供选的子任务前有一段引导材料,让这些任务处于一个整体架构中,有了共同的隐含话题和价值取向。“通过‘百年时空、三条线索、五个节点’的结构布局组织材料,展现出百余年来中国青年满怀对祖国和人民的赤子之心,积极投身中国革命、建设、改革伟大事业,把最美好的青春献给祖国和人民,让考生在‘青春与祖国’的话题中,感悟新时代青年应当具备的勇于奋斗、乐于担当的精神风貌,继续谱写青春之歌。”[24]
任选题形式差异背后应该有本质的考查意图和评价焦点上的差异。
(二)任务差异背后考查点的差异
在2019年试题基础上适当回顾,可以发现选做试题中的选择点有一个发展的过程。
一是侧重内容选择。20世纪50年代的高考作文题,如1953年的“写一个你熟悉的革命干部/记我最熟悉的一个人”,主要是写人记事类作文题,选择的点在写什么人、记哪件事。二是侧重文体选择。20世纪60年代的高考作文题主要以这类选做题为主,如1962年的“说不怕鬼/雨后”,1965年的“给越南人民的一封信/谈学习和革命”,虽然选项间兼有内容差异和文体差异,不过更主要的命题意图应该还是让学生在文体之间做选择。三是内容与文体综合选择。以2019年北京卷为例,两个题目的题干中先分别有一段引导语,然后给出任务:请以“文明的韧性”为题,写一篇议论文;请以“2019的色彩”为题,写一篇记叙文。虽然文体选择的意图很清晰,但材料和作文标题引导的写作内容,是另一个重要的选择点,丰富了学生选择的依据。四是写作情境差异基础上的综合选择。全国Ⅱ卷提供的五个供选题目也有文体差异,涉及演讲稿、信(家信、给同学的信、慰问信)、读后感。不过,因为这个题目整体设定作者是“青年学生当事人的身份”,任务中又有时间、地点、对象的设定,如“1919年5月4日,在学生集会上的演讲稿”“1949年10月1日,参加开国大典庆祝游行后写给家人的信”,学生在选择的时候就需要考虑,自己究竟能胜任哪个场合的哪个表达和交流任务。
通过简单的回顾可以看出,选做题的发展变化一定程度上反映了对写作的理解在不断丰富和发展,写作试题命制中考虑的要素在逐步丰富。
(三)选做试题设计中的注意点
怀特在20世纪80年代主张:“特别是重要的考试,应该让所有的学生对同一问题作出反应,这样所有的人站在相同的起点,需要走相同的距离。最有意义的自由就是公平,在测试中,就归结为效度和信度。”[25]不过,任选题的出现不是偶然,并且其一直活跃至今。现在着重要考虑的是如何用好选做题。
一方面,命题者要有自觉的选择意识。即能明确采用选做题的原因,知道选做题有哪几种形式,想让学生选择的点是什么。这与特定考试的测评目标有关,与特定时期、背景下对写作的理解有关。
另一方面,要明了并尽量规避任选试题的风险。章熊指出了一种较为普遍的担忧:仓促之际,如果犹豫不定,甚至中途返工,对学生是十分不利的。[26]为了尽量避免出现这类问题,命题者需要尽量全面、深刻地了解参与考试的学生的特征。在实际命题时,尽量让选项差异显著,以此减少学生可能的犹豫时间;让差异点既符合写作的基本规律,也符合学生个性化表现的需要,符合测评的目的。同时,也要防止长期固化一种任选类型可能给教学和学生发展带来的负面影响。
怀特从“选择”可能带来的实际的负面效果角度,做了更加细致的分析:“让学生从三个问题中选一个,通常会导致测试无效。假如有ABC三个题目,A最难,C最简单,当然真实的题目从来没有这么明确的难度顺序。通常,最难的题目是最有趣和最有挑战性的,因此最容易吸引最好的学生,所以很多最好的学生就选择了A,但本来如果他们做C的话,会做得更好,也就是说他们最后的表现不是他们本来可以有的最佳表现。能力较弱的学生,选择了C,表现得比他们实际的水平要高。还有些学生,可能没有意识到A、B难,选了它们,结果做得比他们本来应当有的表现要差……假设的好处不是真实的好处,没有证据显示,学生会选择那个他们能做得最好的题目。”[27]为了尽量减少这类情况,需要尽量保证不同选项的难度比较接近。这首要靠命题者对学生的了解而自觉把握,另外最好能通过试测数据来检验和调整预设。
有关读写测评:理论与工具的文章
明晰了测评构念、选择了测评途径之后,就进入测评工具开发或选择阶段。阶段三开发测评工具时,需注意测评的是“潜在的”[17]构念,因此测量与评价要解决的一个关键问题是如何用外显的工具引发学生隐性的思维过程、认知反应,并据此判断其构念发展水平。此处勾勒的测评工具开发小模型突出了测评工具开发中需要特别重视的一个方面,即需要考虑工具引发的学生反应。......
2023-08-17
在差异背后,可以找到国际读写测评中的一些基本趋势、规律。(三)测试任务层面,形式丰富,内容有学术性以上测评案例中的“任务”与我们熟悉的题目,有一些较为明显的差异。案例4德国课程标准中呈现的测试样例则是一个大任务中包含一系列连贯性的子任务,子任务是完成大任务的一个环节,完成一组子任务就完成了一个大任务,按要求建构了一个档案袋。其实,尊重读写规律、需求的任务,就是“真实”的语文实践活动。......
2023-08-17
考试大纲曾经发挥了积极的作用。不过,不可回避的是,细究考试大纲,还有一些可以进一步讨论的问题。(一)测评领域的界定有待进一步研究考试大纲给“表达”领域分出了两个考查内容板块:语言文字应用和写作。2015年,有11个省市的考试说明将其作为一个专门的板块设定测评目标。[5]当然,实际的考试命题终究还是要操作性框架的,考试大纲文件的取消,并不代表着考试大纲中的概念框架、思维方式会同时消失。......
2023-08-17
为了让测评本身和学生的注意力都指向这样的定位和评估重点,NAEP写作测评框架明确勾勒、说明了写作评估的内容要素:写作的目的、读者、思路及形式。为了让学生在考试情境中能充分考虑读者,有的放矢地展开写作,NAEP写作评估的写作任务要么明确指定读者,要么会暗示读者。在评估学生的写作成果时,NAEP会评估学生根据目......
2023-08-17
譬如《PIRLS 2016测评框架》,对其认知目标做了两个层次的阐释。其一,回归真实的阅读过程,在阅读情境中描述抽象的认知目标所对应的、可能的阅读行为、过程、技巧等。直接推论是非常基础的。另外,有些直接推论也许要求读者将文本局部意思和文本总体意思关联起来。其二,举例说明各个认知目标可能涉及的阅读任务。在每一个国际阅读测评项目中,关于认知目标的详细阐述都勾勒出一个相对完整、立体的“阅读理解过程”。......
2023-08-17
测量与评价,两者各有专门的话语系统但又密切相关。形成性评价关注学习过程,有利于及时揭示问题、及时反馈、及时改进教与学活动。要坚持定性评价和定量评价相结合,全面反映学生语文学习的状态及水平。将语文测评途径和语文测评构念联合起来思考,可以作出如下假设。......
2023-08-17
国际阅读“测评框架或说明”文件蕴含的一些基本追求也是我国考试研究者、命题人员和测评文件编写者等相关人员需要重视的。如何保证上述三个层面的良性互动,是我们在剖析国际“测评框架或说明”文本之余需要反思和探究的问题。我们可以从学习国际“测评框架或说明”文本的技术规范开始,同时也许还需要适当调整我们的思维模式。......
2023-08-17
超越任务选做型作文题,对于文体的不同规定值得专门探讨。其一,“文体不限”是文体开放的基本形式。文体不限是提高作文试题开放度的基本手段之一,学生有着广阔的文体选择空间。加了限制条件的“文体不限”,引导的是更加自觉的选择,以及对文体特征和功能更加到位的理解。其三,“规定文体”也能成为一种具有深远意义的开放。......
2023-08-17
相关推荐