欣赏性评价:综合素质评价的方法论选择
作者:罗祖兵
发布时间:2019/4/16 8:10:39 已经阅读25次

摘要:欣赏性评价是发现并欣赏学生特质与优势的评价。它不以先在指标体系来评价学生,而是以学生实际具备的素质为基础来建构评价指标与标准,是属于真实性评价、个性化评价和优势评价的范畴。作为评价方法论,它与综合素质评价在评价内容、方式等方面的要求上具有内在的一致性。依据欣赏性评价的思想,综合素质应该采取“评语评价”的方式。具体而言,可采取如下评价思路:注重学生的’自我评价,以找准学生的优势素质;实行多元评价,提供结构性确证;采取表现性评价,提供参照性适切。

关键词:欣赏性评价;综合素质评价;评价方法论

深入推进普通高中学生综合素质评价,是落实《国务院关于深化考试招生制度改革的实施意见》所提出的“形成分类考试、综合评价、多元录取的考试招生模式”的重要内容。但到目前为止,人们还没有找到可行的综合素质评价办法,而这又主要与人们对综合素质的本质与评价方法的不当认识有关。本文主要讨论“欣赏性评价”作为综合素质评价的方法论问题。

一、欣赏性评价的含义与理念

与鉴定性评价以现成的、统一的评价指标体系来评价不同的学生不同,欣赏性评价则依据每个学生实际素质的发展状况来建构适合每个学生的评价体系,是一种评价的思想与理念,更确切地说,是一种教育评价方法论。

(一)“欣赏性评价”的含义

传统教育评价的根本目的是对教育活动及其效果进行鉴定,是“鉴定性评价”。就学生发展而言,鉴定性评价主要表现为对学生的发展状况进行鉴定,以判断其发展是否达到了既定的要求以及达到何种水平。在鉴定性评价中,评价的指标体系与标准在评价之前就已经存在,评价的过程就是将既定的指标体系与标准同学生的实际发展状况进行对照的过程。这种评价通过预先确定的标准、常模或目标,将被评对象的特质强行纳入一定的框架之中,凡是不符合预定框架的,都被排除在评价范围之外.概言之,鉴定性评价是查找并发现学生发展缺陷的评价。它采纳的是“欠缺假设”“假定人本质上是有欠缺的”。通常所说的标准参照评价、常模参照评价等都是鉴定性评价。

欣赏性评价是发现并欣赏学生特质与优势的评价。艾斯纳(Elliot W. Eisner)在《教育想象》-书中提出了两个有紧密联系的概念:“教育批评”与“教育鉴赏”。教育批评“并不意味着否定性的估价,而是阐明某些事物的特质,以便对该事物的价值做出估价”。教育鉴赏是“有见识的感知行为”。通俗地说,“教育鉴赏”就是对评价对象的特质进行感知,而“教育批评”则是用恰当的语言将教育鉴赏中所发现的特质恰当地表达出来。教育批评与教育鉴赏是同一件事的两个不同方面。为了表述的方便与简洁,本文将“教育批评”与“教育鉴赏”统称为“欣赏性评价”。欣赏性评价的主要任务是发现学生特质、潜能与优势。由于每个学生的特质与优势不同,因此欣赏性评价的框架与标准只能依据每个学生的实际情况和特点来即时建构。与鉴定性评价重点关注学生的发展缺陷相反,欣赏性评价重在关注学生的发展优势。

在阅读艾斯纳的著作时,时常被他所提倡的“欣赏性评价”所吸引。笔者经过比较与思考后,觉得将其定位为“教育评价方法论”比较合适。方法论是“从整体上对方法进行的哲学反思,它侧重于理解方法的理论基础、特点、性质、作用及其限度,研究不同方法之间的关系及其所服从的基本逻辑,研究正确运用方法所应遵守的基本原则”。欣赏性评价的提出确实重新界定了评价方法的理论基础、特点、性质、作用及其限度。而且,国内已有学者对其做过同样的定位,认为“综合素质评价的方法论是‘欣赏性评价’”。

(二)欣赏性评价的理念

欣赏性评价的基本理念是指渗透在欣赏性评价中的核心思想。欣赏性评价的基本思想可以概括为以下几个方面。

第一,欣赏性评价是真实性评价。它更加关注的是学生的实际发展状况,而不是课程目标限定下的发展状况。虽说鉴定性评价也关注学生的发展,但如果学生的发展超越了指标体系的范围,就不会受关注,还会被认为没有价值。从其对学生发展的作用而言,鉴定性评价将学生的发展限定在评价指标体系之内。欣赏性评价则不同,它关注的是学生的真实发展状况,即不论学生在哪个方面有突出的发展,也不论这种发展是否在预定范围之内,都是评价的对象。欣赏性评价属于“真实评价”的范畴,用于评定学生所知与所能的任务,要反映学生在校外的世界中将会遇到的任务,而不仅仅局限于学校自身。

第二,欣赏性评价是个性化评价。鉴定性评价往往根据教育计划与课程标准的要求来设计指标体系,然后据此进行评价。在鉴定性评价中,评价内容对每个学生而言都是同一的。欣赏性评价不一样,它重在发现学生的那些特殊的、与众不同的素质。学生具备的某些特殊素质,如擅长魔术表演,或者领导能力特别强,或者数学能力已经达到大学水平等,虽然不在高中教育以及高考评价之内,却是欣赏性评价的重要内容。欣赏性评价的内容及标准都是因学生而异的,因此它是一种个性化评价。用一句形象的话来讲,鉴定性评价是用同一把尺子去衡量不同的学生,而欣赏性评价则是用不同的量器(不仅仅是尺子)来度量不同的学生。在此意义上,欣赏性评价是真正的“以生为本”的评价。

第三,欣赏性评价是一种优势评价。由于要照顾绝大多数学生的发展水平,鉴定性评价的指标不能超越课程标准的要求。因此,鉴定性评价的标准通常都是基础性的,绝大多数学生通过努力都可以达到。但是,它最终会导致学生的平均发展、平庸发展。欣赏性评价虽然不是从所有方面去全面评价学生,但是从每个可能的方面去评价任何一个学生。学生任何一个方面的突出发展或者优势素质,不论其是否在课程标准和教育计划之内,都是欣赏性评价的重要内容。从这个意义上看,欣赏性评价比鉴定性评价更全面,它不会遗漏学生任何一个方面的优势素质,或者任何一个具有特殊才能的学生。总而言之,欣赏性评价重在发现学生的优势与潜能。

二、欣赏性评价之于综合素质评价的契合性

欣赏性评价之所以可作为综合素质评价的方法论,是因为它与综合素质评价具有内在的契合性,符合综合素质评价的需要。

(一)评价内容上的契合性

为了配合《国务院关于深化考试招生制度改革的实施意见》,2014年12月10日教育部颁布了《教育部关于加强和改进普通高中学生综合素质评价的意见》(以下简称《意见》)。《意见》指出:综合素质评价是对学生全面发展状况的观察、记录、分析,是发现和培育学生良好个性的重要手段;综合素质评价要把握学生的个性特点,关注成长过程,激发每个学生的潜能优势,鼓励学生不断进步;要反映学生全面发展情况和个性特长,注重考察学生社会责任感、创新精神和实践能力。从中可以看出,学生的个性与优势是综合素质评价的核心内容。在“评价程序”部分,《意见》甚至还指出“一般性的活动不必记录”“档案材料要突出重点,避免面面俱到、千人一面。”因此,从国家的文件来看,综合素质评价并不要求面面俱到,而是要突出重点。这个重点就是学生的优势潜能、优势素质或个性素质。

从综合素质评价的必要性来讲,其重点也应关注学生的个性与优势。之所以要在常规考试(普通高考与学业水平考试)之外实行综合素质评价,就是因为有些素质是高考无法评价的,而这些素质就应该是综合素质评价的对象。正是这个原因,有研究者将综合素质界定为“除高考成绩所能表征的素质以外的所有素质”,并指出它“具有综合性和个体性”特征。诸多学者都顾名思义地理解综合素质,认为它是各方面素质的综合,假若是这样,高考与学业水平考试都应该被包括在综合素质评价之中,但实际上并非如此。从互补性上讲,综合素质评价应该评价考试分数所能表征的素质以外的素质,而能够用纸笔测验来检测的素质,是带有共性的素质,因此综合素质评价就只应该评价具有个性特征的素质,“要突出学生的个性特长”。从评价内容上来讲,虽然艾斯纳指出没有什么事物不可以成为欣赏性评价的对象,但整体来看,它特别适合评价个性化素质。欣赏性评价原本是从艺术领域发展出来的,它本身不仅是一种评价艺术的方式,而且是一种艺术化的评价方式。艾斯纳借用卡西尔的话指出,“科学跨跃特殊性而集中关注普遍和共同的东西,而艺术则集中关注特殊事物独一无二的性质。”其意在指出,欣赏性评价重在关注学生的独一无二的素质。关注特殊的学生,关注学生的特殊素质,是欣赏性评价的根本使命。艾斯纳还指出,“艺术家像教育批评家一样,并不是要写存在于一定情境中的所有事情,而是要写出他或者她认为重要的东西、有倾向地选择的东西。”总之,与综合素质评价一样,欣赏性评价要求评价时要突出重点,关注学生个性。

(二)评价方式上的契合性

欣赏性评价与综合素质评价的契合性不仅表现在评价内容上,而且表现在评价方式上。具体可以从评价的思维方式与操作方式两个方面得到说明。

在评价的思维方式上,欣赏性评价同综合素质评价一样,都强调应该采用综合性的方式。对于欣赏性评价,艾斯纳指出,“评定任务应要求学生展示对结构和整体的敏感性,而不是简单地感知分散的部分。”既然评定任务是要求学生展示对结构和整体的敏感性,那评价者在评价时就不能像考试那样对要评价的内容进行分项评价,然后再综合成总成绩,而应该从整体上去评价学生的表现。对于综合素质,有研究者指出,“既然综合素质具有综合性,那就只能对其进行综合性的评价”。在评价思维方式上,欣赏性评价与综合素质评价还具有如下共同点:评价不是用既定的指标体系来全面衡量学生的素质,而是综合考察学生的优势潜能、个性素质;评价不是用同一把尺子去丈量不同的学生,而是不同的量器来衡量不同的学生;评价不是查找学生发展的缺陷,而是寻找学生的优势。

在评价的操作方式上,艾斯纳认为,欣赏性评价是一种质性探究的方式,其基本方式就是对所发现的特质进行“深度描述”,并以“非推论性语言”来陈述评价结果。为此,艾斯纳区分了“推论性语言”和“非推论性语言”。推论性语言是“用于科学和我们许多日常谈话中的形式,是我们用以分类的非常有用力的工具”。非推论性语言是情感性的,它使“我们有机会替代性地参与到别人的生活中去,接受一种移情性的情境理解,并因此用只有艺术才能提示的方式知道他们”。非推论性语言“通过运用表意(present)而非具象(represent)的概念形式或情感来传达信息”。非推论性语言是整体性的,它要求从整体上去描述、感知对象。非推论性语言其实就是通常所说的评语。《教育部关于加强和改进普通高中学生综合素质评价的意见》规定综合素质要采用“写实记录”的方式来评价,“教师要指导学生客观记录在成长过程中集中反映综合素质主要内容的具体活动,收集相关事实材料,及时填写活动记录单。”可见,综合素质评价的基本方式同样是评语评价。

三、基于“欣赏性评价”的综合素质评价思路

欣赏性评价作为评价方法论,与其对应的评价方法不是唯一的。但从整体上看,评语式评价是欣赏性评价的基本方式,也是适用于综合素质评价的方式。

(一)明确评价性质,实行评语评价

综合素质之所以是“综合素质”,就是因为它不具备学术素质那样的可分解性,不能采取适用于学术素质的“分析式评价”方式,而只能采用“综合性评价”的方式。具体而言,综合素质只能采取整体性、模糊性的评价方式。这样看来,综合素质只宜采用评语评价的方式。评语评价其实就是艾斯纳所说的“教育批评”,它要深刻揭示学生的个性特征与独特素质,要对学生的个性和优势进行深度描述。我们通常所说的“评语”基本上都是模式化的、格式化的语言描述,无法揭示学生的独特性。评语的模式化本身就说明评价没有效度。依据艾斯纳的思想,好的评语是对学生独特性的深度描述。它包括描述的维度、解释的维度、评价的维度和主题的维度。描述维度“实际上是一种用语言界定、描绘、叙写或者表达教育生活的有关性质描述的尝试。”解释方面要求指明对于描述所涉及的那些现象和特质意义、教育教学活动运作的机理、机制,所描述的这些特征和特质符合哪些思想、概念或理论,其实就是对所描述的内容进行理论性、原理性的解释。评价就是对所描述的特质的功效做出价值判断,“尽管不同的个人和群体持有不同的教育功效理念,并且尽管他们对于训练过程和结果的价值判断也许不同,但必须做出判断。”主题维度就是对主要思想和结论进行提炼,要指出这个特定的教育批评提供的经验和教训,以及所描述的特质的意蕴。

(二)注重自我评价,定位优势素质

综合素质评价的重要目的是发现学生的优势与潜能,而学生本人对自己的优势与潜能最熟悉,因此他们自然就是综合素质评价的重要主体。为了使综合素质评价具有可操作性,评价时应先让学生提供关于自己所具备的综合素质的材料。这些材料至少应包括两方面内容:一是自我评语;二是相关证明材料。根据欣赏性评价的要求,评语应该写那些自己认为是重要的东西。在综合素质评价时教师应告诉学生,没有必要将每个方面素质的发展状况都报告出来,只需要报告那些自己认为最重要、最具有优势的素质。为了方便操作,可规定学生最多只需要报告自己三个方面(或其他合适的数量)的优势素质,且字数在1000以内(或其他合适的字数)。为了避免自我评语的虚假性和雷同性,必须对学生的自我评语进行鉴定,辨别其真实性与原创性。在英国高校的录取工作中,申请者首先要向高校招生服务处(UCAS)递交个人陈述,高校招生服务处收到学生的个人陈述后,先要检测其真实性。如果发现考生的申报材料中语句抄袭率高于10%,那这份申报材料将会被特殊标注出,而对那些抄袭度较高的大学申请材料,高校招生服务处会写出一份专门的抄袭报告,并通知该考生所申请的院系,最后由该院系决定是否接受这名考生的申报。英国高校零容忍的就是考生在报考材料中的作弊或欺骗行为,即便被录取了,一旦发现有作弊或欺骗行为的还是会被开除的。学生自我评价的效度可以从两方面判断,一是评语的描述是否具有深刻性与细节性;二是评价语言的表达是否是模式化的,是否具有重复性。

(三)实行多元评价,提供结构性确证

如果遇到极具伪造能力的学生,他照样可以提交一份与众不同的自我评价材料。因此,仅靠个人陈述以及对个人陈述进行真实性审察并不充分,还需要其他材料来佐证。国外许多大学都要求学生在申请上大学时除提交自我申请(其中包含自我评价材料)外,还需要提交两份教师的推荐信。当然,教师也要对自己所写推荐信的真实性负责。如果发现推荐信弄虚作假,那写推荐信的教师的信誉就会降级。这样做的根本目的是杜绝教师不负责地撰写推荐信,以保证推荐信的真实性与可靠性。同样,如果教师的推荐信是模式化,就会因其信度低而不被重视,而且它与学生自我评语之间就不能起到相互印证的作用,进而影响到大学或其他使用者对学生综合素质的认定。

不论是教师的推荐信还是学生的自我评语,都是极具有个人色彩的、主观性比较强的文字材料,作为教育评价的结果,尤其是要作为影响学生升学的材料,其信度都是个大问题。对此,艾斯纳提出了“结构性确证”的概念。“‘结构性确证’是指收集资料和信息,并在它们之间建立联系,最终创造出一个被一些组成证据所支持的整体情境的过程。当证据之间彼此一致、情境成立,每条都恰如其分、产生出意义并组成论据时,证据在结构上就是有确证性的。”如果教师是专业的,且推荐信是独立完成的,那推荐信就应该是真实的、有价值的。大学在录取学生时,就要审查不同教师的推荐信之间,以及教师推荐信与学生的自我陈述材料之间是否具有一致性。如果一致,就具备了“结构性确证”,说明学生具备推荐信或自我陈述中所描述的素质。

在2014年以前各省市的综合素质评价中,虽然也非常强调评价主体的多元化,但要求将不同主体的评价结果以一定的比例计人到总体性的评价结果中。这一做法表面上科学、合理,实际上问题重重。它至少犯了三个错误:一是用数量化的方式去对待原本只能用质性方式来评价的内容;二是去合并原本不能合并的不同主体的评价结果;三是它是以不同主体的评价结果是有效的为前提,而实际情况并不如此。实际上,让不同的主体参与评价的实质在于让他们独立地提供有关学生综合素质的材料,以便大学来判断不同材料之间是否具有“结构性确证”。

(四)采取表现性评价,提供参照性适切

评语评价不论如何具有“结构性确证”,都仍存在不真实的可能。一个犯罪团伙的彼此证词高度一致,但这并不一定证明他们说的都是真话,因为集体性撒谎的证词也高度一致。艾斯纳指出,“在结构上确定了的结论也可能是不正确的”“要证实教育批评家的观察,必须增加更多的东西。那些东西就是由参照的适切性决定的。”那什么是参照性适切呢?“参照的适切性是把批评与其试图描述、解释和评价的现象肃对照而对其进行检验的过程。”即是说,要这一步判断教育批评(即教师评语和学生自我词语)是否具有真实性,还需要将教育批评同其所评价的现象、事物或特质等相对照,看它与评伤对象是否一致。其实,这是一个对教育评价对象进行再评价的过程。同样,在综合素质评价中,仅仅凭陈述材料(包括自我评语和教师评语),不足以断定学生是否具备材料所描述的素质。为了进一步确证,有时还需要让学生提供作品(女书法作品、美术作品、文学作品等)以起到印证作用,但这依然可能存在问题,因为并不能保证作品一定是学生独立完成的。而且,有些素质,如演讲能力、钢琴演奏能力等,根本无法提交作品。此时,通过现场实作来判断学生是否具备某种素质,是最好的办法。正因为如此,国外不少大学,尤其是某些特殊专业,都要求申请者参加面试。面试并不是简单地问一些问题让学生回答,它包括组织活动让学生参加,甚至让学生自己去组织活动,以观察学生在活动中的表现。这就是表现性评价。研究者指出:“表现性评价是实施综合素质评价的一条重要途径,不仅因为两者在理念层面的适切性,而且因为表现性评价在实际操作中的可行性。”

“在表现性评价中,常常运用真实的生活或模拟的评价练习来引发最初的反应,而这些反应可直接由高水平的评价者按照一定的标准进行观察、评判,其形式包括建构反应题、书面报告、作文、演说、操作、实验、资料收集、作品展示。”因此,表现性评价是综合素质评价的一种基本方式,是最真实、最原初的评价。表现性评价重点关注学生表现的独特性、创造性,而非追求表现的同一性、一致性。任何独特的、创造性的、有价值的表现,都将成为表现性评价关注的重点。这恰是综合素质评价所需要的。

总而言之,从欣赏性评价的角度看,评语评价是综合素质评价的基本方式,但评语应该符合下述要求:一是必须是深度描述;二是要有结构性确证;三是要有参照性适切。需要特别说明的是,评语式评价是综合素质评价的基本方式,但不是唯一方式。除此之外,还有其他的评价方式,如量化评价等。

(来源:《课程教材教法》2018.1)