kl800.com省心范文网

制定全国统一的语言能力等级量表的原则与方法


2008 年 11 月 第 31 卷 第 4 期

现代外语(季刊)

Modern Foreign Languages (Quarterly )

November 2008 Vol.31 No.4

制定全国统一的语言能力等级量表的原则与方法*
上海交通大学 / 上海师范大学

方绪军 上海交通大学 杨惠中

朱正才

提要:目前,我国外语教学层次复杂,外语考试种类繁多,相应的 教 学 与 考 试 大 纲 对 语 言 能 力 的 描述和等级划分也存在分歧,给语言教学的组织和考试分数的解释带来诸多不便。 制定全国统一的 语言能力等级量表,可以使语言教学组织更科学、语言测试更透明。 制定统一量表应遵循如下原则: 以交际语言能力理论为基础;分别描述听、说、读、写能力;对语言能力进行“能做”描述;语言 能力等 级描述根据需要决定详略;统一量表须便于理解和使用。 制定统一量表,还须确 定语言能力描述的 参数,建立描述语库,并使语言能力的描述量表化。 具体的语言测试 项目可以采取专家判断和对比 考试相结合的方法,建立自身与统一量表上的等级之间的对应关系。 关键词:语言教学、语言测试、语言能力、统一量表 [中图分类号] H319 [文献标识码] A [文章编号] 1003-6105 (2008 )04-0380-08

的。 由于参照点在量表上是确定其他等级的

1.

制定全国统一的语言能力等级量表

基准, 因此必须对参照点所表示的语言能力 进行精细而清晰的描述, 以便为确定其上和 其下的语言能力等级提供有效和可靠的参 照。 (2 )设定量表的量度单位。 语言能力等级 量表要对高低不同的语言能力水平进行描 述,就必须设定量表的量度单位,即确定语言 能力等级的跨度大小及等级之间的分界。 如 果不同量表上的量度单位长短不一, 那么所 测结果就很难直接进行比较。 设定语言能力等级量表的量度单位,需 要解决两个问题: 一是如何确定量度单位的 大小;二是等级之间的跨度是否等距。 确定语 言能力量表上的量度单位的大小, 这跟实际 需要和可操作性有关。 首先,量度单位的大小 跟精度有关。 量表的量度单位越大,同一跨距 (即量表所描述的语言能力全距)内等级数就 越少,描述或测量的结果就越粗略;反之,量 度单位越小,同一跨距内等级数就越多,描述 或测量的结果就越精细。 划分多少等级才合 适,应根据实际需要来确定。 其次,量度单位 的大小又跟构造量表的可操作性有关。 为了

问题的提出

1.1 语言能力等级量表
对语言能力进行科学的描述或评价,区 分高低不同的水平等级, 这是制定语言能力 等级量表的主要任务。 从心理测量学角度来 看, 编制心理测量量表一般包括三项基本内 容: 设定量表的参照点, 设定量表的量度单 位 , 设 定 量 表 总 长 度 ( 张 厚 粲 1988 ,Brennan 2006 )。 制定语言能力等级量表也不例外。 (1 )设定量表的参照点。 语言能力等级量 表的等级必须参照实际运用语言的某种能力 程度来设定。在语言能力等级量表上,这个参 照点设在哪儿,从理论上说可以是任意的。参 照点确定之后, 可以据此确定其他等级在量 表上的位置。 尽管语言能力等级量表上的参 照点可以任意设定,但实际上,这个参照点的 设定必须考虑实际需求情况, 即参照点所代 表的语言能力应该能够满足社会对学习者语 言能力的基本要求。一般来说,语言能力在量 表参照点上下的学习者人数应当是相对较多
*

本项研究得到国家社会科学基金(项目编号:06BYY027 )资助。 作者衷心感谢《现代外语》匿名审稿专家所提出的修改意见。

方绪军

杨惠中

朱正才

381

使描述或测量的结果达到更高的精度, 就需 要将语言能力水平划分为更多的等级。 语言 能力等级区分越细,量表的精度越高,但区分 不同等级的可操作性就越差, 保证测量信度 的困难也随之加大。 因此,设定语言能力等级 量表上的量度单位的大小面临着测量精度和 可操作性之间的矛盾: 既要从实际需要出发 确定适当的量度单位, 使测量精度满足实际 需要,又要兼顾可操作性。 为了便于用户理解和使用, 便于语言教 学的组织和管理, 语言能力量表上的等级跨 度最好是等距的。 如何使不同等级之间的跨 度做到等距,需要精心设计和严密论证。 在这 方面,North (2000 )构造等距量表的方法值得 参考(这一点后文详细讨论)。 (3 )设定量表总长度。 量表的总长度跟描 述和测量的语言能力跨距有关。 如果把人们 的语言能力看成是从“极低”到“极高”的连续 体,对这个连续体整体进行描述,就会得到一 个最长的语言能力等级量表。 但构造这样的 大而全的量表并不一定实用。 因为在语言交 际活动中, 极低的语言能力几乎不能解决什 么交际问题, 一般的交际场合又不需要极高 的语言能力。 语言能力等级量表上的“低点” 和“高点”应当根据实际需要来设定。 当然,可 以先人为地设定“低点”和“高点”,再将中间 划分为等距的等级。 但用这种先设定两头的 方法所制定的量表是封闭的, 不利于根据实 际需要调整量表的总长度。 从更加实用、灵 活、可操作的角度考虑,可以根据社会对语言 能力描述和测量的需求情况, 首先通过需求 分析,确定需求量最大的语言学习者人群,从 描述和测量这个人群的语言能力开始, 向两 端延伸, 直到不再需要描述和测量的语言能 力水平为止。 这样构造出的语言能力量表两 端是开放的,可以根据需要适当延伸。 这种方 法的可操作性和实用性更强。

年涉及千百万学生。 为了适应不同层次的教 学需要,人们制定了各种不同的教学大纲。 有 教学就有测试, 于是就有各种不同的测试项 目和不同的考试大纲。 但这些大纲对语言能 力的描述和等级划分分歧不一, 这不利于语 言教学和测试的相互交流, 不利于通过测试 对学生的语言能力进行统一的认证, 不利于 用户对测试结果的使用,因此,许多国家和地 区纷纷展开制定统一的语言能力等级量表的 研究。 在欧洲, 欧洲委员会的语言政策部门提 出了语言教学分级的要求, 希望把语言教学 过程划分成若干个较小的、 能独立授予学分 的单元, 建立一个能得到欧洲各国相互承认 和采用的共同的参照标准, 使语言教学和测 试具有透明度。 经过二十多年的努力,最后形 成了“欧洲语言能力等级共同量表”(CEFR )。 (Council of Europe 2001 ; 杨 惠 中 、 桂 诗 春

2007 )
近年来,亚洲外语(主要是英语)教学与 测试领域希望建立共同的语言能力等级量表 的呼声也逐渐高涨(郑新民 2006 )。 杨惠中和 桂诗春(2007 )更加具体地讨论了制定亚洲统 一的英语语言能力等级量表的原则和步骤。 我国也有人不断呼吁外语教学实现一条 龙(戴炜栋 2001 ),其前提也是要有统一的语 言能力等级量表。 制定统一的语言能力等级 量表,可以在语言教学中起到“量同衡”的作 用, 使语言教学与测试的讨论具有共同的基 础。 可见, 制定统一的语言能力等级量表是 当前语言教学和测试领域共同的发展趋势。

1.3 制定全国统一的语言能力等级量表
的迫切性 我国的语言教学环境和教育体制与其他 国家和地区存在着或大或小的差异。 这些差 异决定我们不宜直接采用或照搬其他国家和 地区现成的语言能力等级量表。 由于我国目 前各种语言教学和测试还缺乏统一的参照标 准, 各种考试对语言能力的定义或描述缺乏

1.2 统一的语言能力等级量表研制的国
际背景 语言教学是一种大规模的教学活动,每

382

制定全国统一的语言能力等级量表的原则与方法

统一性,结果就难免产生下列问题:(1)语言 能力描述参数设置不一。 比如,有的教学或考 试大纲在描述口头交际能力时,有对“口头交 际策略”的描述,有的则对此不作描述。(2 )语 言能力描述的精度不一。 例如,有的考试对各 等级听力材料的语速、 阅读速度等方面都提 出了定量的要求,有的则没有此项要求。 (3 ) 语言能力(水平)的等级划分不一。 比如,少的 只设两三个等级,多的则设有十一个等级。 杨 惠中和桂诗春(2007 )分析了现有一些量表或 大纲在描述语言能力或设计考试分数体系方 面所存在的经验性、相对性和主观性等特点。 因此, 立足我国的语言教学与测试的实 际, 研究制定符合我国语言教学与测试需要 的全国统一的语言能力等级量表 (以下简称 “统一量表”)势在必行。 制定统一量表, 目的是服务语言教学与 测试的实际工作,因此,制定这一量表的根本 原则就是从社会需求出发,注重科学性、实用 性和可操作性。 这一总原则具体化为如下五 个方面。

2. 制定统一量表的原则

2.1 以交际语言能力理论为理论基础
语言教学的主要目的是培养学生的交际 语言能力, 使学生能够以语言为工具满足未 来的交际需要。 相应地,语言测试也应当以评 估和测量考生的交际语言能力为基础。

Bachman (1990 )认 为 ,交 际 语 言 能 力 可
以描述为语言知识和在一定的交际场景中得 体地运用这些知识进行语言交际的能力。

1.4 制定统一量表的长期与近期目标
我国是语言教学大国,外语教学和测试, 汉语和各少数民族语言作为外语或第二语言 的教学和测试,在规模、制度、等级等方面纷 繁复杂。 理想的统一量表不仅要满足描述各 种外语能力水平的需要, 而且要满足描述国 内各种语言作为第二语言的能力水平的需 要。 这是制定统一量表的长期目标。 制定统一量表必须从实际出发。 目前国 内的外语教学与测试, 规模最大的无疑是英 语教学与测试。 除了大学、中学和小学开设不 同层次的英语课之外, 还有各种培训机构开 设的各级各类英语课程。 英语测试品种繁多, 全国性的大规模考试就不下十余种。 就我国 当前的语言教学与测试的现状而言, 首先迫 切需要制定的是全国统一的英语能力等级量 表。 另一方面,从研究现状来看,我国外语教 学界在英语教学、 学习与测试等方面的研究 也具有一定的广度和深度。 这些研究为制定 全国统一的英语语言能力等级量表做了很好 的理论准备。 因此,制定统一量表可以从描述 英语能力 (特别是关键等级的英语能力)入 手,首先制定统一的英语语言能力等级量表。 这可以作为制定统一量表的近期目标。

Bachman 的交际语言能力模型将交际语言能 力 分 为 “外 部 世 界 知 识 ”(Knowledge of the world )和“语言能力”(Language competence )
两大部分,其中“语言能力”又分为“语言组织 能力”和“语用能力”,语言组织能力和语用能 力 又 由 若 干 方 面 构 成 。 North (2000 )比 较 了 Canale 、Van Ek 和 Bachman 各自关于交际语 言能力的模型, 认为三种模型的基本结构及 其包含的主要参数项目大同小异, 都有语言 知识、社会语言能力、语篇能力、策略能力等 组成部分, 各组成部分里包含的内容也基本 一致。 交际语言能力模型反映了人们对交际 语言能力基本共同的认识。 构造统一量表应 以获得广泛认可的交际语言能力理论为背 景,并根据语言能力描述的实际需要,提出适 当的语言能力描述框架与参数项目, 并对各 具体的参数项目进行详细的、清晰的、有梯度 的描述。

2.2 分别描述听、说、读、写能力
在语言教学和测试实践中, 人们通常从 听、说、读、写等不同的方面对交际语言能力 进行描述,许多语言教学大纲对听、说、读、写 等项技能分别提出了具体的规定和要求,语 言教学机构也分别设置了听力课、口语课、阅

方绪军

杨惠中

朱正才

383

读课和写作课等。 从语言使用的实际情况来看, 人们对交 际语言能力的要求往往在不同的方面有所侧 重。比如,科技人员因为要阅读大量的科技文 献,对阅读能力有较高的要求,而导游员则须 在口头表达方面有更高的要求。当然,也有些 人,比如语言教师,在听、说、读、写等方面都 需要达到较高的水平。 因此,在制定统一量表时,应对语言能力 从听、说、读、写等方面分别进行描述与分级。 测试机构可以根据一定的测试用途设计相应 的测试产品,测试听、说、读、写等技能中的某 一方面或某几方面, 确定对某方面要求的权 重 ,并 依 据 量 表 对 听 、说 、读 、写 等 方 面 的 描 述,对考生的表现进行评价。

理解和使用考试成绩, 能更有效地发挥语言 测试对评价考生语言交际能力的作用。 对语言能力的描述与评价应该从定性和 定量两个方面来进行, 一般可以从语言使用 者接收的语言材料、产出的结果、接收或产出 的过程等方面着手。 人们能够接收的语言材 料(即能听懂或读懂的语言材料)和产出的结 果(即说出的话语或写出的语句、篇章等)都 直接反映了语言使用者的语言能力, 因此在 构造语言能力量表时必须对这些方面进行准 确的描述。 另外,语言的接收或产出过程涉及 语言的使用策略, 也反映出使用者的语言能 力水平, 可以而且应该作为语言教学的重要 内容,这一点在“能做”描述中也应当得到适 当的体现。

2.3 对语言能力进行“能做”描述
语言主要是作为交际工具而产生和存在 的,可以说,工具性功能是语言的核心功能。 当然,强调语言的工具性功能,并不排斥语言 作为文化载体的功能。 社会语言文化的成分 是交际语言能力模型中的重要组成部分。 从 语言交际实践来看, 要准确地理解语篇和话 语的含义,得体地表达思想,也都离不开社会 语言文化知识。 就我国当前外语教学形势而 言, 绝大多数人学习外语的目的主要是为了 获得使用外语进行交际的能力。据调查(张雅 萍 2004 ), 有 96.8% 的大学生学习英语的目 的是为了“加强运用英语的能力”,即使用英 语进行交际的能力。 既然学生学习语言是为了运用语言,掌 握交际工具,那么,培养学生运用语言进行交 际的能力就是语言教学的中心任务, 描述或 评价语言能力也自然应该着眼于学习者能用 语言完成怎样的交际任务。 所谓“能做”描述 (can-do statement ), 就是对语言能力直接进 行描述的一种方法, 直观地说明具有某种语 言能力的学习者能用语言完成怎样的交际任 务。 就语言测试而言, 对不同等级水平的语 言能力进行直观的“能做”描述,这便于用户

2.4 语言能力等级描述的详略
统一量表在描述各个等级的语言能力 时,应根据社会实际需要,来决定对不同能力 等级描述的详略程度。 对社会需求程度高的 关键等级的描述应该精细、充分,以满足各种 不同的需要, 对极低或极高的语言能力等级 可以暂且不作精细描述。 拿英语能力等级量 表的研制来说,一方面,二十多年来,大学英 语考试(CET )在国内的英语教学界产生了巨 大的影响。 目前,每年一千多万考生的规模, 说明大学英语四、 六级考试尤其是四级所测 的语言能力的社会需求程度很高,因此,特别 需要对其所测量的语言能力水平进行具体、 细致、准确的描述。 另一方面,围绕大学英语 考试的效度和信度, 已展开了相当规模的研 究(杨惠中、C. Weir 1998 ,杨惠中 2000 ,杨惠 中、金艳 2001 ,朱正才 2005 )。 多年来大学英 语考试积累了丰富的效度证据和适当的保证 信度的措施, 这些材料为描述相应等级的语 言能力水平提供了必要的、 可靠的依据。 因 此,对大学英语四、六级考生英语能力进行充 分且准确的“能做”描述,不但符合社会需要, 而且也可以以此为参照点,再向两端延伸,为 描述更高或更低的英语能力等级奠定基础。 从适应社会需求的角度而言, 对远离关键等

384

制定全国统一的语言能力等级量表的原则与方法

级的语言能力水平的描述,可以相对概括、抽 象甚至模糊一些, 因为极低或极高等级的语 言能力的社会需求程度都相对较低。

以及相互间的关系。 对各项参数的描述应采 用定量和定性描述相结合的方法, 并且优先 采用定量描述的方法, 即对可能进行定量描 述的参数(如在阅读方面应掌握的词汇量、阅 读速度、 听力材料的语速等) 尽量作定量描 述,难以进行定量描述的参数(如话语的得体 性)则作定性描述。 描述不同的语言技能所涉及的具体参数 项目不尽相同。 比如, 在描述阅读理解能力 时,涉及词汇量、语法结构、阅读材料难易度 和语体特点,需要描述阅读速度、理解事实和 细节的能力、把握作者观点和态度的能力、推 测隐含意义的能力等参数项目; 而在描述书 面表达能力时,涉及词汇、语法结构和文字的 准确性和丰富性、语篇结构的合理性、表情达 意的清楚程度及得体性等参数项目。

2.5 统一量表须便于理解和使用
统一量表是为语言教学、 学习和测试实 践服务的, 故其等级划分和描述必须便于理 解和使用。 只有这样, 才能发挥它应有的作 用。 多年来,国内外一些语言教学与测试机构 已经制定出各种用于教学或测试的标准或大 纲。 在制定统一量表时,这些标准或大纲对语 言能力的描述语, 可以作为建立描述语库所 需描述语的重要来源; 这些标准或大纲对语 言能力的等级划分也可供制定统一量表、划 分语言能力等级时参考。 这样做,有利于统一 量表与现有的标准和大纲衔接起来, 便于学 习者和用户理解、接受和使用。

3.2 建立描述语库 3. 制定统一量表的方法 3.1 确定语言能力描述的参数
在对听、说、读、写等分项技能进行描述 时,要确定具体的描述参数。 具体参数的确定 首先要依据交际语言能力理论, 其次也可以 参考有影响的语言教学和测试机构对语言能 力等级的界定和描述。 交际语言能力理论提 出 了 语 言 能 力 的 基 本 参 数 。 比 如 ,Bachman (1990 )将语言能力先分为“语言组织能力”和 “语用能力”两大项目,再细化为“语法能力”、 “语篇能力”、“功能能力”、“社会语言能力”等 中层参数项目,最后落实到“句法”、“词法”、 “语音”、“修辞”、“达意”、“得体” 等更具体的 参数。 一些有影响的语言教学或测试大纲(如 《大学英语教学大纲》) 对英语语言能力等级 都作了规定和描述, 根据这些规定和描述也 可以归纳出一些参数项目,如,话语中的词汇 量、话语中的语法结构范围、交际功能项目、 准确性、流利程度、熟练程度、说话的得体性, 等等。 在确定语言能力描述的各具体参数项目 时, 应明确各层次上的具体参数项目的含义 对各等级的语言能力进行描述时, 需要 相当数量的足以区别听、说、读、写等方面不 同等级语言能力的描述语,因此,有必要构造 各参数项目下的描述语。 为了使描述语能够 用来对各等级的语言能力进行充分和全面的 描述, 就有必要建立符合交际语言能力理论 的、具有一定的逻辑结构的描述语库。 构造描述语的主要途径, 一是由研究人 员根据交际语言能力理论和实践经验进行编 写, 二是收集各种有影响的语言教学或测试 大纲中的描述语, 三是收集富有经验的语言 教师评价学生语言能力的描述语。 通过不同 途径得到的描述语相互补充, 共同构成原始 的描述语库。 构造描述语应遵循以下要求:(1 )描述语 须便于理解和使用,避免含糊或歧义。 像“能 读懂语言难度一般的普通题材的文章” 之类 的描述语中的“难度一般”、“普通题材”等含 义都比较模糊,描述也不够明确。 (2 )每一条 描述语只描述一个参数项目, 描述语相互独 立。 在现有的大纲中,有些描述语涉及多个参 数项目, 如 “能就一般或专业性话题较为流 利、准确地进行对话或讨论”,这条描述口语

方绪军

杨惠中

朱正才

385

表达能力的描述语涉及“流利程度”和“准确 性”两个方面,在收入描述语库时,应将其分 为两条,归在不同的参数项目之下。 (3 )不用 否定的描述语。 描述语库所收录的描述语都 应是肯定的,即从表述形式上看,描述语不带 有 “无 ”、“不 ”或 “没 有 ”之 类 的 否 定 词 语 (如 “语句结构不完整”之类)。(4 )描述语不重复。 有些描述语出现在不同的大纲里或同一大纲 的不同等级里, 这样的描述语在描述语库中 只收录一次。 有些描述语(如“能理解所读材 料的主旨大意”和“能掌握所读材料的中心大 意”)所描述的能力是相同的,但描述语的表 述形式有所不同,这类描述语也只酌收一条。 建立描述语库时, 可先将原始的描述语 按其对听、说、读、写等不同技能的描述分门 别类, 再将各门类下的描述语按其描述的具 体参数项目归类。 比如,“发音准确”、“表达意 思清楚”等可用来描述口语表达能力,它们属 于口语表达准确性范畴, 可以将其归入口语 表达能力描述的“准确性”参数项目之下。

际上描述了“准确性”的两个侧面,即正确性 (B 、D )和 清 楚 程 度 (A 、C )。 就 正 确 性 而 言 , “表达形式正确”(D )比“语法基本正 确 ”(B ) 要求更高,“表达意思清楚” (C )自然要高于 “表达意思基本清楚”(A )。 一般来说,表达正 确是表达清楚的前提。 因此,以上四条描述语 可以临时排成序列:B → D → A → C 。 基于专家经验对每个参数项目下的描述 语进行的临时排序, 尽管经过仔细推敲和斟 酌,但仍难避免主观性。 在这种情况下,采用 专家群体调查验证的方法是降低主观性的一 条途径。 比如,约请相当数量(如 100 位)富有 经验的语言教师针对一批被试分别判断其达 到每条描述语所描述水平的程度。 根据教师 对描述语的使用情况, 每条描述语都可以得 到一个难度水平指标。 基于这些数据,运用一 定的统计手段(如 Rasch 模型),可 以 计 算 出 每条描述语的难度水平系数, 再根据难度系 数的大小, 可以对基于经验的专家排序进行 验证, 也为描述语的最终排序提供了数据支 持 。 具 体 的 技 术 处 理 细 节 可 参 考 North (2000 )。 根据对专家的群体调查所得的描述语难 度的数据指标, 并考虑语言能力等级划分的 实际需要, 可以对已经排序的描述语序列进 行基本等距的等级划分 (如分为六级或八 级)。 至此,语言能力等级量表基本形成。 这一初步的等级量表还需要进行大规模 的效度验证。 根据基本形成的语言能力等级 量表对各个等级的语言能力的描述, 设计能 够测试相应等级语言能力的试卷, 再用这些 试卷去组织测试, 测试的结果将反映语言能 力等级量表的信度和效度。 比如,根据量表上 对“六级”语言能力的描述,编制能够测试“六 级” 语言能力的试卷, 安排语言能力估计为 “六级”的考生(如 1000 名)参加考试。 考生是 否具有“六级”语言能力,可以由教师将自己 所了解的学生的语言能力和量表的描述相对 照确定下来, 也可以根据学生参加过某次难 度相当于“六级”语言能力的考试的结果来确

3.3 语言能力描述的量表化
收入描述语库的描述语所描述的某方面 的语言能力是有等级差异的。 比如,《大学英 语教学大纲》 对一级到六级水平阅读材料中 包含的词汇量分别作了描述。 要对不同能力 等级上的学习者的语言能力进行描述, 就必 须在描述语库的基础上,基于经验和实证,对 语言能力描述进行量表化处理, 主要是对描 述语库中各个参数项目下的描述语进行排 序,并根据排序的结果划分语言能力等级,初 步形成语言能力等级量表。 对描述语库中的描述语进行排序, 可以 采用基于专家经验和专家群体调查验证相结 合的方法。 所谓“基于专家经验”,就是由研究 人员根据描述语在语言能力结构中的位置, 对语言能力描述语库中的各个参数项目下的 描述语进行初步的排序。 比如,下边几条描述 语可以作为对书面表达“准确性”的描述:A. 表达意思基本清楚;B. 语法基本正确;C. 表达 意思清楚;D. 表达形式正确。 这四条描述语实

386

制定全国统一的语言能力等级量表的原则与方法

定, 这样确定的考生在语言能力水平上有较 高的同质性。 考生参加“六级”语言能力考试 的结果与教师对学生的评价的相关性, 或与 考生参加某次难度相当的考试的结果的相关 性,可以作为语言能力量表对“六级”语言能 力描述的效度证据。 另外,也可以请考生的任 课老师对考生的语言能力进行详细的“能做” 描述与判断, 这种描述与判断的材料可以作 为语言能力等级量表的效度和信度证据之 一。 当然也可以组织一定规模的考生,让其对 自身语言能力作出判断和自我报告, 这种材 料可以作为效度验证的参考和补充。 统一量表在形成初稿甚至定稿之后,仍 需要不断地收集资料(包括测试结果、教师评 价和用户意见等),对量表进行验证,并作必 要的修正,使其更加准确。 量表的效度验证是 一个长期的、不断完善的过程。

专家(包括语言测试专家、富有经验的语言教 师等) 对取得某项考试某个等级的一定数量 (如 1000 名)考生的语言能力进行判断,并按 照交际语言能力描述的参数项目对考生的语 言能力作“能做”描述。 收集、整理这些“能做” 描述, 并将整理的最后结果与统一量表上某 个最接近的等级的“能做”描述相比对,这样 就能得知某项考试的某个等级大致对应着统 一量表上的哪个等级。 (2 )对比考试。 这种方法的基本思路是, 先将一个作为“标杆”的考试铆定在统一量表 上, 然后将其他考试项目与这个标杆考试进 行等值,从而也被定位在统一量表上。 比如, 组织同一批考生同期参加 A 、B 两种考试,A 考试为能够测试统一量表上某个等级语言能 力的考试 (即已经铆定),B 考试为需要确定 其所设等级与统一量表上某个等级对应关系 的考试。 如果通过 A 考试某个等级的考生和 通过 B 考试某个等级的考生基本相同,而且 考生成绩高度相关,那就证明 B 考试的某个 等级相当于 A 考试的某个 等 级 , 换 言 之 ,B 考试的某个等级对应着统一量表上的某个等 级。 专家判断和对比考试应该结合起来,这 是因为专家判断往往具有一定的主观性,对 比考试的数据则可以弥补这种缺陷。 通过对 比考试, 确定某项考试所设的某个等级正好 与统一量表上的某个等级相当, 这是理想的 状况。 实际上可能会出现某项考试所设的等 级与统一量表上的等级并不一一对应的情 况。 在这种情况下,就更需要采用专家判断和 对比考试相结合的方法, 来确定某项考试所 设等级与统一量表上的等级的对应关系。 必 须 指 出 的 是 ,制 定 统 一 量 表 , 并 非 要 统一全国的语言教学模式或语言测试研发 工作。 参照这个统一量表,各语言教学机构 可以根据语言学习的不同需求,设计不同的 教 学 大 纲 ,组 织 各 种 形 式 的 教 学 ; 各 语 言 测 试机构仍可以根据各种用途,组织研发不同 的测试。

4. 统一量表与具体的语言测试项目之
间的关系 在具体的语言测试项目所测量的语言 能力与统一量表所描述的语言能力之间建 立起对应关系,这是制定统一量表的主要目 标之一。 当前,我国大规模的英语考试数量 众多, 有普通高等学校招生全国统一考试 (英语)、大学英语考试(CET )、英语专业考试 (TEM )、全 国 公 共 英 语 等 级 考 试 (PETS )等 , 这些考试的分数报告方式和等级设置都各 有特点。 制定出统一量表之后,就可以采取 适当的措施使其与现有的各种测试项目关 联 起 来 ,这 样 ,便 于 人 们 通 过 统 一 量 表 的 描 述直接理解考试结果,也为用户对不同测试 项目所报告的考试成绩进行比较和解释提 供便利的条件。 建立具体测试项目所测量的英语能力与 统一量表所描述的语言能力之间的对应关 系, 可以采取专家判断和对比考试相结合的 方法。 (1 )专家判断。 这种方法要求一定数量的

方绪军

杨惠中

朱正才

387

University Press.

5. 小结
目前,我国外语教学的规模越来越大,研 发并投入使用的语言测试品种繁多。 每年参 加各类考试的考生,多的达到上千万人。 如何 保证这些测试产品的质量, 增强语言测试的 透明性, 实现不同测试所报告的分数的可比 性, 制定全国统一的语言能力等级量表有助 于解决这些现实问题。 统一量表必须建立在科学的交际语言能 力理论基础之上。 语言能力描述基本框架的 建立,语言能力参数项目的确定,各参数项目 下的描述语的构造, 无不应该在交际语言能 力理论的指导下进行。 定性分析与定量描述 相结合是制定语言能力等级量表的根本方 法。 听、说、读、写等技能的量化描述及量表化 处理,统一量表的效度和信度验证,这些方面 的工作都需要在对大量的数据进行定量统计 分析的基础上进行。 统一量表应该与具体的语言教学和测 试实践联系起来,使统一量表所描述的不同 等级的语言能力与具体的教学大纲所规定 的教学任务相对应,与具体的语言测试项目 所测量的语言能力水平相对应,以便用户使 用。 总之, 制定全国统一的语言能力等级量 表是一项基于社会需求, 涉及语言教学、学 习、 测试和语言教育政策等方面的综合性很 强的工作,需要得到众多语言教学单位、测试 机构和语言教育管理或权威部门的支持。 如 何使全国统一的语言能力等级量表的制定工 作既符合科学的原则,又满足实用的需求,这 是一项十分繁重而艰巨的任务。
参考文献

Brennan , R. L. 2006. Educational Measurement
(Fourth Edition ) [M ].

National Council on Common European for Languages :
[M ].

Measurement in Education. Council of Europe. Framework Learning , North , B. of 2001. Reference

Teaching ,

Assessment

Cambridge : Cambridge University Press. 2000. The Development of a Common Framework Scale of Language Proficiency [M ]. New York : Peter Lang.
《大学英语 教 学 大 纲 》修 订 工 作 组 ,1999 ,大 学 英 语 教 学大纲(修订本) [M ]。 上海:上海外语教育出版 社,北京:高等教育出版社。 戴 炜 栋 ,2001 ,构 建 具 有 中 国 特 色 的 英 语 教 学 “一 条 龙”体系 [J ]。 外语教学与研究(5 ):322-328 。 杨惠中、C. Weir ,1998 ,大学英语四、六级考试效度研 究 [M ]。 上海:上海外语教育出版社。 杨 惠 中 ,2000 ,从 四 、六 级 考 试 看 我 国 大 学 生 当 前 的 实际英语能力 [J ]。 外语界(1 ):46-52 。 杨惠中、金 艳 ,2001 ,大 学 英 语 四 、六 级 考 试 分 数 解 释 [J ]。 外语界(1 ):62-68 。 杨 惠 中 、桂 诗 春 ,2007 ,制 定 亚 洲 统 一 的 英 语 语 言 能 力等级量表 [J ]。 中国外语(2 ):34-37 。 张厚粲,1988 ,心理与教育统计学 [M ]。 北京:北京师 范大学出版社。 张雅萍 ,2004 ,大 学 生 对 英 语 学 习 的 根 本 需 求 与 课 堂 教学 [J ]。 北京教育学院学报(1 ):57-60 。 郑 新 民 ,2006 ,多 元 化 下 的 共 识 :亚 洲 英 语 教 学 发 展 的新动态、新趋势—— —北京 Asia TEFL 第 3 届年 会述评 [J ]。 外国语(2 ):72-79 。 朱 正 才 ,2005 , 大 学 英 语 四 、 六 级 考 试 分 数 等 值 研 究—— 个 基 于 铆 题 和 两 参 数 IRT 模 型 的 解 决 —一 方案 [J ]。 心理学报(2 ):280-284 。 收稿日期:2008-03-20 ; 作者修改稿,2008-07-20 ; 本刊修订,2008-09-07 通讯地址:200234 上海市 上海师范大学对 外 汉 语 学 院 / 200030 上 海 交 通 大 学 语 言 文 字 工 程 研究所

Bachman , L. F. 1990. Fundamental Considerations in Language Testing [M ]. Oxford : Oxford

<xjfang@gmail.com>

437

cognitive linguistics and second language acquisition , sets out to represent the morphological , conceptual , syntactic and pragmatic correlations among lexical units of natural language. This representation takes the form of a lexicographical mediostructure and aims to build up a structured network in learners ’ dictionaries. A CS referential tier approach to quantifier scope , by Zhang Lianwen , p.369 Based on Jackendoff ’s semantic tripartite tiers in conceptual structure (CS) as well as his more recent theory and the Simpler Syntax (SS), this paper reconstructs the descriptive tier in the propositional structure and demonstrates that the semantic relationship of quantifier scope and variable binding can be represented in the referential tier. The referential dependency is characterized by asymmetry. Descriptive anaphora and referential anaphora are distinguished in conceptual structure. Quantificational scope comes from the interaction between lexical semantics , referential properties and information structure. The optional grounding embodies the semantically dynamic nature of quantificational scope. The tiers composition of CS forms the basis of a more accurate semantic analysis. Creating a unified scale of language ability in China , by Fang Xujun , Yang Huizhong and Zhu Zhengcai , p.380 In China , current practice in foreign language teaching and testing has given rise to diversified measures of L2 proficiency as manifested in a great variety of English tests based on different teaching and test syllabuses. The status quo has caused considerable inconvenience in score interpretations and language instruction , and called for a unified measurement scale of L2 proficiency. An attempt is thus made to create such a scale , guided by the following procedure. In keeping with the theory of communicative competence , abilities are specified of listening , speaking , reading, and writing in the form of Can-do statements. Necessity for elaboration of these statements depends on social needs and ease for use and interpretation. Feasibility of this procedure rests on a specification of the language ability parameters involved , an establishment of a detailed descriptor pool , and operationalization of L2 proficiency in quantitative and qualitative terms. Investigating the reliability of CET-SET using Multi-Facet Rasch Model , by He Lianzhen and Zhang Jie , p.388 For a test to be valid , it must be reliable. In performance assessment , candidates ’ test scores are the result of the interaction of many facets and therefore the reliability of performance assessment cannot be judged by inter-rater or intra-rater consistency alone. Based upon raw scores of a CET-SET at one of its testing centers , the present research investigates and models possible sources of score variance within the framework of Many-facet Rasch Model (MFRM). The results demonstrate statistically significant differences among all facets including rater severity , task difficulty , rating criteria , rating scale. MFRM , as an extension of the classical Rasch Model , helps to measure the effect of various facets on test scores in performance assessment and generates fair scores for each candidate , minimizing the variability due to facets other than candidates ’ ability. MFRM manifests itself as an effective means for detecting whether each test method facet functions properly in such a performance assessment setting and for providing useful feedback for test improvement. Factors predicting accurate use of the zero article in oral English : A study of tertiary-level Chinese EFL learners , by Zhu Yeqiu and Wen Qiufang , p.399 This paper reports on a study of factors that are capable of predicting accuracy of the zero article use by Chinese EFL learners. The data were taken from the Spoken English Corpus of


制定全国统一的语言能力等级量表的原则与方法.pdf

制定全国统一的语言能力等级量表的原则与方法 - 2008年11月第31卷第4期

制定亚洲统一的英语语言能力等级量表_杨惠中.pdf

制定亚洲统一的英语语言能力等级量表_杨惠中_其它语言学习_外语学习_教育专区。制定亚洲统一的英语语言能力等级量表 DOI:10.13564/j.cnki.issn.1672-9382.2007.02....

中国境内少数民族汉语语言能力培养及建立描述语库刍议.pdf

语言科学 / I S S N1 6 7 1-9 4 8 4 C N3 2-1 6 8 7 G 2 0...“第4期, 0 0 8 制定全国统一的语言能力等级量表的原则与方法 , 3 8 0-...

汉语语言能力量表制定的相关思考.pdf

“ 汉语语言能力等级共同量表 参考文献《 方绪军 杨惠中 朱正才 2 现代外语 》第4期, 0 0 8 制定全国统一的语言能力等级量表的原则与方法 , ...

证书.pdf

[5] 方绪军等.制定全国统一的语言能力等级量表的原则与方法 .现代外语, 20

语言能力等级描述.doc

2 等级描述 / 标准制定的原则 2.1 面向不同人群的语言能力等级描述 描述语言能力并进而制定语言能力等级量表是为语言教学、 学习和测试服务的, 不同的 人群对...

试论语言残障人群语言能力量表的制定.pdf

0 0 6 ‘ 朱正才 2 现代外语 “第4期, 0 0 8 制定全国统一的语言能力等级量表的原则与方法 ,‘ 3 8 0-3 8 7页? 伟 2 徐州师范大学硕士学位论文 ...

语言能力_能做_描述的原理与方案_以CEFR为例_方绪军.pdf

人们 提倡对语言能力进行全面、多侧面、 分等级的“...等在基于 交际语言能力理论的大纲设计或量表制定等...比如: “能做 ” CEFR 有一条原则 要求描述语...

二语语言能力描述语库建设的理论与实践.pdf

包括二语语言能力描述语库 , 进而确定 《 方绪军 杨惠中 朱正才 2 现代外语 》第4期, 0 0 8 制定全国统一的语言能力等级量表的原则与方法 , 3...

中国英语能力等级量表与英语学习_图文.ppt

摘要 本文首先介绍中国英语能力等级量表 ,然后就量表和英语学习之间的关系 进行阐述,并依据量表的制订原则, 从以综合应用为中心、以学习者为中 心和以循序渐进为...

如何制定幼儿园语言教学活动观察量表.doc

本文从幼儿园语言教学活动现 状;语言教学活动观察量表制定的依据;观察量表制定的方法,进 行了多方面的探索。 【关键词】幼儿园语言教学 观察量表 制定 一、幼儿园...

国外语言能力量表述评_图文.pdf

关键词 : 语言能力 、 水平 、 量表级别 [...对制定我国统一 的学生英语能力标准及开发相应的标准...( Novice2Mid ) 、级高初初 用语言描述的办法对...

朱正才:英语能力等级量表描述语量表化的可行性方案探讨.doc

不同层级的学生组 成比例要符合两个原则:第一,...笔者认为,中国英语能力等级量表应该主要采用这一方法...制定全国统一的语言能力... 9页 1下载券 语言能力...

中国英语能力等级量表对接雅思、普思考试.doc

《中国英语能力等级量表》有助于提升教师的语言测评素养,改进教学 方法、...制定亚洲统一的英语语言... 5页 免费 中国英语能力等级量表学... ...

语言能力等级量表的效度及效度验证_论文.pdf

随着制定语言能力等级量表 工作的展 开, 正确认识并验证量表 的效度 已是一项 ...着 重讨论 了对各方面效度加 以验证 的方法和要 求, 强调量表制 定和 效度...

第四章 制定教育评价表的一般方法和步骤_图文.ppt

第四章 制定教育评价表的一般方法和步骤_教育学_...的完备性、全面 性 二、制定教育评价表的原则 ? ...程度属于什么等级 方式: 一是用描述性语言表示 例如...

国外语言能力量表述评_韩宝成_图文.pdf

级别划分及 其描述特 点 , 并对 每个 量表的优...二 、它首次采 用语言描述的办法对一个人在现实...制定全国统一的语言能力... 9页 1下载券 _语言...

中国英语等级量表_图文.doc

中国英语能力等级量表 China’s Standards of English...2.7 语言理解能力 language comprehension ability 语言...能就与社会文化和学习相关的指定话题发表有一定深度...

已制定发布的语言文字规范标准明细表.pdf

贡献者等级:出口成章 六级 格式:pdf 关键词:暂无1...已制定发布的语言文字规范标准明细表已制定发布的语言...通用键盘汉字输入技能测 21 试方法 22 23 24 25 ...

工作标准编制说明2.pdf

对企业标准化领域中需要协调统一的工作事项所制定的...4 工作标准的编制要求 4.1 编制原则 4.1.1 中层...如写作能力语言表达能力、沟 通能力、电脑操作能力...