高考改革综合素质评价冷思考
作者:栾 泽
发布时间:2018/6/15 8:31:16 已经阅读2117次

【摘 要】随着新阶段高考改革的开展,综合素质评价的重要性被反复提及,在理念上取得丰硕成果,如评价主体多元化、评价理念先进化、评价过程目标清晰化等等。但由于各地综合素质评价体系尚未完善,缺乏及时、深刻的经验总结,综合素质评价的过程遇到了评价主体过于多元、评价指标分解合成困难、评价内容设置落后、评价过程缺乏监督、评价结果认定困难的情况。要让综合素质评价顺利推进,必须加强对评价理念应用措施的研究并吸取经验。

【关键词】综合素质评价;高考改革;评价体系

将高中学生综合素质评价作为高校招生录取的参考依据,是我国深化考试招生制度改革的一大亮点,但综合素质评价如何具体操作,又是一大难点。综合素质评价其实并不是一个新概念,早在1999年我国政府就已经提出若进行素质教育必须要改善评价制度。《国家基础教育改革实验区2004年初中毕业生考试与普通高中招生制度改革的指导意见》首次提出了综合素质评价这一概念。此意见确定了综合素质评价具体包含的内容即:道德品质、公民素养、学习能力、交流与合作、运动与健康、审美与表现六个方面。而2006年综合素质评价手册的出现则代替了以往的传统评价方法,通过详细记录学生在校的素质发展情况对学生进行测评。综合素质评价手册的出现使得素质评价通过书面化的形式更加完善。2010年发布的《国家中长期教育改革和发展规划纲要(2010 - 2020年)》将“全面提高普通高中学生综合素质”作为下一段的工作重点目标。2014年12月,《关于加强和改进普通高中学生综合素质评价的意见》重新确定了评价的具体内容即思想品德、学业水平、身心健康、艺术素养、社会实践,同时提出促进评价方式改革,转变以考试成绩为唯一标准评价学生的做法,为高校招生录取提供重要参考。2017年2月颁布的《教育部关于做好2017年普通高校招生工作的通知》强调,进一步完善面向普通高中毕业生的职业适应性测试和面向中职毕业生的职业技能测试办法,积极探索在高职分类招考中使用学生综合素质评价结果。

虽然,我国一直推进综合素质评价在实践中的应用,但直至新一轮高考改革,综合素质评价的重要性才被提高到了前所未有的高度。综合素质评价的境遇可谓喜忧参半,一方面随着高考改革的推进,综合素质对于学生的重要性逐步提升,不论是社会还是学校都开始重视学生个人素质的全面发展。另一方面则是在推进的过程中遭遇一系列的现实问题,各地对综合素质评价体系的构建尚不科学。若这些困难未能妥善处理,将会直接影响高考改革的进程,综合素质评价也不能真正发挥促进学生全面发展的作用。刘海峰教授认为在高考改革新阶段中难度最大的改革即普通高校逐步推行基于统一高考和高中学业水平考试成绩的综合评价、多元录取机制。

一、评价主体多元化的困境

在传统的评价模式中,教师评价一直占据主导地位,但因为常常受到时间与地点的限制,教师和学生的交流会被影响,因此教师评价的客观性一直受到质疑。这种易受影响的片面评价一直是主导学生评价的权威。对于评价的主体来说,评价的过程只是单纯衡量学生的行为是否与最初设定的教学标准保持一致,而没有真正关注学生在学习的过程中是否有所收获。而对于学生来说,完成评价只是功利性的结束任务而不是把提升自身整体素质当做评价的目的。将综合素质评价纳入高考则是为了体现多元主体间的交互对话,家长、教师和学生个体都成为评价主体,改变了以往只是作为各类外部评价的准备者、复制者和依附者的角色。这种评价机制提升了学生的主体地位,同时逐渐将评价过程转换成学生自主参与和反思发展的过程,在自评与互评中加深了同学间的了解与联系。家长也改变了过去只关注学生成绩的角色限定,而是对学生整个发展过程进行全程的监控与指导,从而形成完整性的评价。这种多元化的评价模式改善了传统教师高高在上的权威评价者形象,学生有权对教师所做的评价进行质疑,从而促进师生关系民主化的发展。

综合素质评价在具体实施过程中常常遇到不同评价主体的能力差异问题和如何确定各种评价所占权重问题,这就会导致评价结果失真与矛盾的问题,从而影响到评价结果的公正性。

首先,评价结果由于主体多元易失真。学生同时作为评价的主体与客体难以做到真实客观地评价。由于自身年龄与经历的限制,学生易受到利益的驱动,很难做到真实客观地评价自己与同伴,尤其是在档案中的自述常常出现夸大事实的情况。同时受亲疏关系及学业竞争的影响,学生常常会带有感情色彩的去评价同伴,不能反映出学生学习与生活的真实性。当家长也进入评价体系中容易从功利角度出发,出现千篇一律的赞扬,很少能发现或客观叙述孩子在素质培养中出现的一些问题。在综合素质评价主体格局中,教师依然是信任程度最高且最为重要的主体。但在实际教学中,由于教学任务繁重,教师很难做到对每个学生都能真实了解,因此往往也只是根据最后的期末考试成绩与平日相处的基本印象来进行评价。

其次,评价主体多元容易导致评价结果之间出现相互矛盾的情况。不同的评价主体有不同的是非观念和价值取向,因此评价主体越多元,就越容易出现评价结果不一致的现象。在此情况下,缺乏判断力的学生往往显得难以适应,非但不能形成准确客观的评价,反而导致学生对自身现有水平的不确定。同时评价结果的矛盾会给高考录取工作增加很多难度,如何选取其中的结果作为评价标准一直是个难题。依据《浙江省教育厅关于完善浙江省普通高中学生成长记录与综合素质评价的意见》(以下简称《浙江意见》),“评议采用学生互评和教师评议相结合的办法,其中学生互评权重不低于70%”。现有的综合素质评价主要采用等级评价的方式,那么如果在评价过程中学生互评的结果为“A”而老师所做出的评价结果是“B”,按照意见中所制定的学生互评的权重不低于70%,我们该如何计算学生的最终素质评价结果呢?针对当下我国高考的形势,由于考生人数众多无论是在高校招考还是高中收取信息上,都比较偏向希望得到确切的评价结果。但是由于主体过多,综合素质评价的结果非常模糊化,同时各地也有不同的评价标准。比如江西省规定在计算最终评价结果时,学生自评占20%、学生互评占30%、教师评价占50%;而安徽省的规定则是学生自评权重为10%、学生互评为40%、教师评价为50%。不同地区设定了不同主体所占的权重比例,这实际上又进一步加深了高考录取工作的复杂化。

二、评价指标分解与合成困难

虽然内在素质与外在指标并不是一一对应的关系,但是若要对内在素质进行评测就需要借助外在指标去完成,这要求我们在具体实践中将一级指标分解成多个二级指标。分解的过程既需要确保指标与总体设计的联系性又需要保证指标的相对独立性。首先从分解指标与总体设计的联系性来看,分解的指标应具有完整性,可以通过指标全面体现出学生的综合素质。《浙江意见》中将品德表现的指标定位为家国情怀、尊老爱幼、社会责任、集体荣誉、诚实守信、交流合作、遵守纪律。这些依据一级指标所分解出的二级指标是否能完全体现出一名高中生的综合素质呢?品德表现的高低是仅仅依靠以上二级指标就能表现出来的吗?事实上,学生所具有的内在素质很难通过现有的指标一一对应表现出来。综合素质并不是简单的将各种素质累加,而是将其彼此联系在一起融合成一个整体,发挥整体大于部分之和的效果。像在“爱党爱国”这项素养中许多学校设定的基本指标是在升旗仪式中态度严肃,尊敬国旗会唱国歌等,我们不能因为某位同学因为特殊情况没能参加升旗仪式就判断其不爱党不爱国,也不能单单依靠会唱国歌就判定学生爱国。可见,并不是所有的内在素质都可以外显成具体操作性行为。例如现有评价体系将“尊老爱幼”等作为判断学生“思想品德”行为水平高低的外在指标,如果两个同学都去敬老院关爱老人,一个帮老人剪指甲,一个帮老人洗头发,那么究竟是帮助剪指甲的同学思想品德高,还是帮助洗头发的同学思想境界高呢?显然这两种行为是没有可比性的。再看指标的相对独立性,在《浙江意见》中,创新实践主要考查学生参加研究性学习、实践活动及科技创新活动的情况,包括军训等活动。但是在《上海意见》中则将军事训练放在了品德修养中,显然,同样是“军训”,在不同地区的评价指标分解有所不同。各地区的综合素质评价体系尚未构建完善就推广应用,导致评价指标的分解差异性较大,若指标分解不科学将会大大影响我们对综合素质的评价。 另外,评价体系中二级指标合成一级指标较为困难。当对二级指标考察赋值后,我们需要将不同的观察结果进行整合,最终形成一个一级指标的结果。李雁冰认为“综合素质评价的对象是每一个学生的个性整体。综合素质不是各类素质的组合组装,不是整体等于部分之和”。但是在合成最终结果时有以下问题:在进行综合素质评价时,原则上要求学校每学期都要对学生进行一次评判。但是每个学期的评价结果都会不同,同时每个学期评价所占的重要程度也难以衡量,这种多样性的结果如何整合在一起?我们也很难设定一个科学的标准去衡量所设定的二级指标及其观测点所占的比重。仍以《浙江意见》为例,“创新实践”被细化为:“实验及技术操作能力”“研究性学习成果”“社会实践”三个具体指标。那么这些观测点如何合成“社会实践”,“社会实践”又如何与“实验及技术操作能力”和“研究型学习成果”合成最终的“创新实践”?如果学生在研究性学习成果与社会实践上的成绩都为A,而实验及技术操作能力为B,那么最后合成的“创新实践”的等级评价究竟是A还是B?我们该如何确定这三个分类指标的权重并合成其最终结果呢?

三、评价内容设定难以保证信度和效度

综合素质评价内容如何设置一直都是社会各界关注的重要问题。然而若只是评价内容简单地由评价学科知识技能转向到评价道德品质和公民素养等,而不是真正改变评价理念,那么综合素质评价很可能无法解决传统教育的弊端。传统教学受“应试教育”与“唯分数论”所影响,主要通过简单的纸笔测验结果考查学生对知识的掌握与应用程度,从而判断与教育目标是否相符,强化的是对学生智力的培养与应试能力的提高。在这种传统靠分数评价的导向下,学生失去了个性发展的机会。“对学生进行综合素质评价,真实记录他们成长的足迹,增强对自我的认识,发现自己的不足,进一步找出努力的方向,有利于学生的全面发展和综合素质的提高。”这种理念一直贯穿在整个综合素质推进的过程中。

当前我国综合素质评价虽然理念先进但是内容的设定存在以下问题:首先,评价的内容和等级界定不清。综合素质的内隐性很强,而当评价内容的设立并不能给评价对象清晰明确的引领时,评价很容易流于形式起不到真正的作用。当同一种行为可以划人这个等级,也可以划人另外一个等级时,评价结果势必丢掉了信度。其次,评价内容的设置混乱,较多重复。比较多省的综合素质评价方案,很多评价内容都有一定程度的交叉重复。比如“公民素养”中的“具有社会责任感”明显与“道德品质”中的“遵纪守法,维护公德”内容相重叠。这种内容的重复给评价工作带来了许多不必要的困扰。另外,现有的评价内容很难针对城乡学生进行公正比较,在评价内容的设置上并没有考虑城乡阶层差异。城乡差距大仍然是我国目前面临的主要问题,是招生工作中不得不考虑的一大问题。城乡学生的不同阶层背景导致综合素质评价很难在公平的准则下进行。在学生“背景因素”不平等的前提下,学生所获得的教育投资也是不同的,像“学业水平”“艺术素养”这几项指标很明显对城镇学生更有优势,农村学生很难在日常的学习中注重艺术素养的培养。因此,这样不加区分的将评价内容同时适用在城乡学生两个不同的群体身上必然会影响综合素质评价的效度。

此外,综合素质评价作为一种过程性评价,旨在完整记录还原学生成长过程的方方面面,这是综合素质评价得天独厚的优势。但是由于高考录取的特殊性,它需要一个明确的评价结果,若将其纳入高考体系中则会迫使其变为结果性评价,这样实际上就忽略了综合素质评价的内涵。结果性评价主要用来帮助评价者对学生区分优劣、等级评定或合格鉴定,而较少关注评价过程能为学生本人的成长和提高提供多少有价值的信息。为了学生能够更好的查缺补漏,评价的立足点多放在发现学生的缺点与不足上,是一种查缺补漏的评价思路。评价者是学生问题的发现者与解决者,认为学生只有率先改正自身的缺点才能获得更好的发展。尽管在一定时期这种评价思路发挥了作用,但是长远来看对学生的发展并没有很大的促进。结果性评价将会导致学生带有偏向性发展,而学生综合素质的培养是要在认识与实践的循环过程中不断累积的。可见,综合素质评价若想纳入高考体系中,内容设置上就存在着先天不足的问题。

四、评价过程缺乏社会监督和保障

综合素质评价的目的是既要注重学生全方位素质的发展又要尊重学生个性化发展的特点。学生全方位的发展就是要在德智体美方面均衡发展,而个性化发展则由于学生成长环境、个性特征等先天因素的差异性而有不同的表现。虽然我们都清楚综合素质评价的真正目的,但是目前我国还没有形成一套完整的社会监督机制来全方位把控综合素质评价的整个进程。正如有学者所言:“尽管从学理上来说,实施综合素质评价的必要性和意义非常清楚,但在实践中,公众对于综合素质评价却是疑虑重重,评价对综合素质能够是否做到客观、公平、公正非常不确定”。显然,高中生综合素质评价的公正性是其纳入高考体系的重要前提。如果我们忽略综合素质评价的公正性,不采取积极行动加以重视,那么综合素质评价恐很难实现高考改革的初衷。《国家中长期教育改革和发展规划纲要(2010 - 2020年)》明确指出,“加强信息公开和社会监督,完善考试招生信息发布制度,实现信息公开透明,保障考试权益,加强政府和社会监督。”尽管我国高层教育管理者已经意识到了学生综合素质评价公正性对于高考改革的重要程度,但是现实测评中还缺乏一套系统化可行性程度高的社会监督机制用于监测综合素质评价工作的进展。因此社会各界都对综合素质评价的结果持怀疑态度,综合素质评价的推进工作遇到了挑战。

综合素质评价作为一种主观性评价,极易受到人情因素的影响干扰,从而导致招考制度诚信缺失与道德滑坡的困境,最终影响评价的公正性。如果没有健全的社会监督机制进行考察,尤其是涉及道德修养、社会服务这些随意化程度较高的评价内容时,很容易让人疑虑有暗箱操作的行为。各地的实践反馈也证实,现阶段很难确保评价的客观真实性。当评价结果转换成为某种高利害决策的评判因素时,个体为了避免与群体利益的冲突往往会做出有利于己的评价。社会诚信机制的缺失一方面使得综合素质评价易受“寻租”行为的干扰,综合素质评价材料的真实性、证书类材料的合法性及评价信息的客观性都是我们需要重点关注的问题。另一方面由于缺少社会诚信制度的有效监督,如何证明综合素质评价的真实性一直是一个难题。基于高考招生公平性的要求,当下综合素质评价很难得到社会大众的信任,高校对其真实性也持怀疑态度。

一项完善制度的确立都会经历一个曲折的过程,从不成熟到健全,但是教育发展的脚步不会因为制度的未完善而停下。综合素质评价的实施需要完备的社会诚信机制,但教育应该引领社会,而不是坐等社会诚信机制健全后再来推进教育改革,教育改革推进的过程本身就是一个社会建立诚信机制的过程。综合素质评价给社会诚信制度的监督与管理提出了更高的要求。遗憾的是,当前针对综合素质评价并没有一套完整的管理机制,各个责任主体的责任与义务都没有严格划分。导致各主体未能清晰明确自身的权责范围,综合素质评价究竟该归哪个部门管理?由谁来进行监督与管理?这些问题都没有一个清楚的答案。同时,在综合素质评价的具体操作中,执行部门常常为了工作方便而出现过度简单化的管理措施,这显然是与综合素质评价的根本理念背道而驰的。如浙江省规定综合素质为A等的学生人数应该控制在25%以内,C等的应该控制在5%以内。这些硬性规定也许出于管理方面便捷的考虑,但从本质上说这些管理措施并不符合综合素质评价所倡导的发展性理念。 五、评价结果的运用受困 综合素质评价结果如何更好地使用,是当前教育界面临的重要问题。《关于加强和改进普通高中学生综合素质评价的意见》强调高中学校要将学生综合素质档案提供给高校招生使用作为招生录取的参考依据。那么所谓的“参考”具体指的是什么呢?“参考”的程度如何设立?“参考”所依据的评价结果又该如何制定呢?当前我国综合素质评价只是一种高度概括化的定量化的等级评价模式,绝大多数的评语也只是为了完成上级任务,真实性较低。这显然既不利于利用综合素质评价的模式为高校挑选出全方位发展的人才,也阻碍了学生综合素质评价在高中阶段的应用和推进。

当下,综合素质评价与高考录取实行“软挂钩”,为高校选拔人才提供参考依据。随着高考制度的不断改革,人们对综合素质有了新的认识。就综合素质评价的本身来看其是学生个性发展化评价,即发现和认识学生是综合素质评价的根本目的。通过综合素质评价翔实的记录,我们可以清晰了解到学生在高中阶段完整的发展情况,有助于高校在招生录取工作中更好地了解学生的特性。从各省颁布的实施方法或意见来看,普遍都采用了“只记录不评价”的原则,这虽然在一定程度上保证了材料的客观公正性,但从另一角度讲,却也回避了等级比较的问题。这样的折中“软挂钩”并没有解决真正的问题,而是将难题转移到了高考录取的环节中,在操作性上有很大的阻碍。首先由于等级评价的原因,大多数人的综合素质评价结果相似,综合素质评价材料的科学性有待考量。其次,因为招生录取的时间十分有限,高校很难在如此紧张的条件下去科学审核数量庞大的综合素质评价材料。同时高校缺乏这样的专业队伍在复杂的材料中抓住重点,鉴别虚实,这是一项任务量相当大的工作。于是综合素质评价陷入了两难的境地,高中学校抱怨:高校录取不看也不用“综合素质评价”,我又何必大费周章提供给你,浪费人力物力。而高校则指责高中的综合素质评价都是应景之作,没有多少参考价值。

但无论如何,将综合素质评价逐步纳入高考改革体系中,将会慢慢影响人们的传统教育价值观,改变以分数定终身的局面。在新高考的指挥引导下,无论是家长还是学生都将改变以往只认分数的境况。2009年山东省一所高校以综合素质不佳为理由,在高考录取中退回12名学生的档案,首开全国将高中生综合素质与高考挂钩的先河。但是这一举动也引起了社会的巨大争议讨论,各界纷纷质疑这种“硬挂钩”是不是来势太汹?的确,通过综合素质评价与高考进行的直接关联可以真正落实《国家中长期教育改革和发展规划纲要( 2010 - 2020年)》所提出的高中阶段教育三大任务之一即“全面提高学生的综合素质”,可以改善综合素质评价只是流于形式的局面。但是硬挂钩的弊端也是显而易见的,首先,将综合素质与高校招生录取硬挂钩将会大大增加高校公平录取的风险性。当评价体制和高考分数成为同等性质的高利害评价,在评价监督机制不健全的背景下就容易滋生腐败作假的行为。许多学生的实践材料都是在家长的帮助下弄虚作假,真实性极低。其次是评价材料如何评定的问题,学生的综合素质材料来自于全国各地,各地经济社会发展水平差异极大,因为不了解各地高中学校的基本情况所以很难通过简单的横向比较来对学生的综合素质进行客观评价。例如,两个学生都提供了去养老院为老人服务的相关视频和文字材料,这两个学生同样都帮老人洗衣服,一个洗得干净,一个洗得不太干净,我们该如何判断这是属于学生个人能力还是综合素质高低的问题?又如何得知他们参加这一活动是出于真实目的,还是为了获得有益的综合素质评价材料刻意为之呢?最后,也是最重要的一个影响因素是当前我国高考录取招生实行平行志愿投档录取方式。平行志愿是指考生在以“分数优先、遵循志愿”的投档基本原则下,在考生填报高考志愿时在指定批次内同时填报若干个平行院校的志愿。在投档过程中,将学生成绩由高到低排序,再按顺序从第一个院校志愿到最后一个院校志愿检索。当一旦出现符合投档条件的院校时,既向该院投档且只有保证上一位考生志愿检索完成后才能检索下一考生的志愿信息。但由于平行志愿投档时要优先满足分数要求,因此高校在招生时根本没有办法参考学生综合素质评价的材料。并且,如果高校想在两个总分相同的考生中,通过评估其综合素质评价材料来确定录取人选,在“平行志愿”的录取投档模式中也是不可能的。2016年浙江普通高校录取招生细则中明确规定,依据平行志愿录取的基本原则当文理科考生总分相同时,应按文化总分的高低水平进行录取。而如果文化总分依旧相同时,则再依据单科顺序和分数水平进行投档。单科顺序排列如下:一类考试科目文科为语文、文科综合、数学、外语、自选模块;理科则为数学、理科综合、语文、外语、自选模块。由于基本不会有两个考生同时在高考总分及各科小科目都完全一样的情况,当A学生刚好满足高校最后一个录取计划时,考生B自然就不会再被投到该高校。因此,学生综合素质评价在高校招生中完全成为了摆设,即使提供给高校,高校也没有时间与机会参考。

六、综合素质评价的理想与现实

反思综合素质评价取得的成绩,可以发现随着综合素质评价的推动无论是学生还是家长都更重视学生素质的全面发展,综合素质的普及和推广都对继续深化高考改革、促进教育发展具有重大意义。但是综合素质评价并不是一个可以单纯停留在理念层面的定义,而必须要在实践中积累经验进行改造,在不断完善其自身的真实性可靠性之后才能推广。这种推广的过程,并不是随着一时热潮,单一的将理念推广大刀阔斧的全面改革,而是需要一步步真切解决现有问题。任何先进的理念要转化为可以在实践中具体操作的模式,都要经历一个相当长的探索过程。在这个过程中,我们需要改善综合素质评价所出现的一些问题,并进行总结、交流与改进,从而使其真正发挥作用,为高考挑选出真正全方位发展的人才。

综合素质评价推进的过程中之所以出现很多问题,一个主要的原因就是在高考改革的背景下综合素质评价很大程度上只处于一种单一的“理念推广”模式中。很多学者的研究成果只是反复提到综合素质评价的重要性,强调实现评价方法的多元化,但却很少解决关于如何结合高考改革、如何实现公平等关键问题。因此现在无论是学校还是家长,虽然都逐步明确了综合素质评价的重要性,但实际可供他们借鉴的模式少之又少。尤其学校对于这些新理念的运用还处在自我摸索探寻的阶段。新一轮高考改革下的综合素质评价如果想真正发挥指导基础教育的重要作用,关键就在于进一步完善综合素质评价体系而不是急于推广,只有将评价体系科学化才能发挥出其核心力量。另外,受长期“分数优先”的影响,综合素质评价虽然已经提出许久,但在实践中常常出现敷衍评价的行为,使得它更多的是一种政府推进行为,而不是学校对新型评价方式的主动接受,这就容易导致评价主体因为对综合素质评价不是十分理解而造成一些本来可以避免的不必要的损失。虽然综合素质评价是个难题,高考改革也是一个难题,但是我们关于综合素质评价模式的探索已经走出了一大步。只有在积累经验的基础上不断增强评价模式的优越性,总结教训才能使综合素质评价为高考选拔人才出力。

(来源:《中小学教育》2017.08)