本书评述了心理测量学-结构主义语言测试、综合语言测试、交际语言运用测试、Bachman的交际语言能力和测试方法等现代语言测试模型。本书力求对这些语言测试模型。本书力求对这些语言测试模型的产生背景、理论基础、本质特征、主要采用的测试题型、优缺点等方面做了详尽的评述。
**章语言测试的一些基本概念
一、测试、测量、评估和评述
在教育测量学和语言测试文献中,有四个词义接近,使用频率很高的术语,分别是测试(testing)、测量(measurement)、评估(evaluation)和评述(assessment)。很多测试学者(如Ebel and Frisbie,1991;Davies,et al.1999等)都曾经讨论过它们的异同。
测试是一种特殊测量技术,以获取量化(由数字体现)的信息为目的,该信息反映应试者所掌握的某一方面的知识或能力的程度。在教育测量(除语言测试以外的其他教育测试)中,典型的测试由一套问题构成。测试中的每一个问题都有一个正确答案。这些问题由应试者口头或书面回答。测试中的问题和测量态度、动力、兴趣、偏好等性格因素以及学习策略、认知风格等认知因素的问题不同。后者由被测量人员根据自己的实际情况来回答,答案的正确与否不是由评分人确定。评分人无从知道这些答案是否反映了被测量人员的实际情况,只能假定被测量人员是诚实的,他们的答案反映了他们的实际情况。而对测试问题答案(包括问答题)的正确性,学科专家会取得一致意见,不会受到他们个人的价值观和好恶的影响。在语言测试中,很多问题也有正确答案。例如,多项选择题、正误判断题、配伍题等一般只有一个正确答案。而完形填空、其他形式的填空题、简短答案题则可以有不只一个正确答案,但语言专家仍可以就其正确性取得一致意见。使语言测试比较复杂的是有些主观性测试,如口语面试和作文测试,没有正确答案。但在多数情况下,语言专家仍可以就应试者提供的答案是否达到测试要求、达到测试要求的程度或反映出的知识、能力水平达成一致意见,并以分数的高低来体现应试者掌握该项测试测量的知识或能力的程度。
测量指收集量化的信息来决定被测量之物(不限于知识或能力)存在的程度。在这一点上测量和测试是一致的。但在测量中可以使用那些不要求评分人对其答案做出正误判断的问题。例如,我们可以根据被测量人员对一组问题的答案判断出他们有内向或外向倾向。这些答案是否反映被测量人员的实际情况只有他们自己知道,评分人无法,通常也无需,对其做出正误判断。因此,测量包括测试。测试是测量的一种形式。测试由一套可以由评分人对其答案做出正误判断的题目构成。而测量可以由这样的题目构成,也可以由一套无法也无须评分人对其答案做出正误判断的题目构成。测试和测量的结果都必须是由分数体现的量化信息。
评估不局限于量化手段。在评估过程中,也经常使用面晤、问卷调查、观察等定性手段来系统地收集信息,目的是做出价值判断或决定。对一个语言教学计划进行评估,能够为教育管理者、教师,甚至学生家长提供有关语言教学质量的信息,也能够决定该语言教学计划的未来。在语言教学效果评估中,语言测试是常用的手段之一,如运用教学计划前测试和教学计划后测试来考察学习者的进步情况,运用学业测试来考察学习者掌握学习内容的情况等。
评述是使用*宽泛的术语,既可以和测试换用,也可以广义地指收集语言数据,包括测试数据,又可以狭义地指不包括测试的各种评估手段,如面晤、个案研究、问卷调查、观察等。总之评价收集定量和定性信息,供评述人了解被评述之物的现状。
从某种意义上说,评估是评述的一种形式,是需要做出价值判断或决定的评述。测量是评估的一种形式,仅采用定量手段收集信息。测试是测量的一种形式,仅由评分人可以对其答案做出正误判断或是否达到测试要求的判断的题目构成。
二、测试的种类
测试可以按不同的标准分成很多种类。很多教育测量或语言测试著作(如Harris,1969;Harrison,1983;Heaton,1988;Allison,1999等)都对测试的种类做过专门介绍。
(一)测试在教育中的作用类别
测试可以根据其在教育中的作用或功能分成若于种类,包括学业测试(achievement/attainment tests)、进展测试(progress tests)、水平测试(proficiency tests)、学能测试(aptitude tests)、诊断测试(diagnostic tests)、分级测试(placement tests)等。
1.学业测试
学业测试考察学习者掌握教学大纲规定的学习内容的情况。学业测试通常在一门课程结束的时候实施,测试内容的选择应以该课程的教学大纲规定的教学目标和教学内容为依据,不受具体课程和教材的影响。很多学业测试采用标准化测试形式,由测试专家组命题。我国高中的各学科的会考和大学中的非英语专业英语四、六级考试和英语专业英语四、八级考试是典型的学业测试。
2.进展测试
进展测试又称课程进展测试(class progress tests),和学业测试很类似。课程进展测试可以在一门课程的不同阶段或结束时实施,目标是考察学习者掌握课程或教材内容的情况。课程进展测试通常由任课教师命题,参加考试的学习者人数较少。测试的正式程度一般低于学业测试。
3.水平测试
水平测试考察学习者掌握学科知识的水平,不以教学大纲、课程计划或教材为命题依据。应试者可以有不同的学习背景。在这一点上水平考试与学业和进展测试有明显不同。有些水平考试以考察应试者的一般知识或能力水平为目的,例如,我国的公共英语等级考试(PETS=Public English Test System)考察的就是应试者的一般英语水平。有些水平考试则用来确定应试者是否具备接受某种教育或培训的学科知识水平。例如,托福(TOEFL=The Test of English as a Foreign Language)和雅思(IELTS=The International EnglishLanguage Testing System)都是以考察应试者是否具备接受英语国家高等教育的英语水平为目标设计的。也有一些水平测试用来考察应试者是否具备其所从事的职业要求的语言水平。例如,我国的职称英语考试就属于这一类水平考试。
4.学能测试
学能测试又称预测性测试(prognostic tests),用来考察应试者学习某一学科的潜能。学能测试通常在应试者开始学习相关学科之前实施,以预测其将来学习该学科的结果。J.Carroll和S.Sapon(1958;1967)设计的MLAT(Modern Language Aptitude Test)和Pimsleur(1964;1966)设计的PLAB(Pimsleur Language AptitudeBattery)是著名的语言学能测试。MLAT和PLAB的测试内容并不完全相同。
MLAT考察四种能力:
1)语音编码能力:识别语音,建立语音和体现语音的符号之间的联系,并能稍长时间地记忆这些联系的能力。
2)语法敏感性:识别句子中词语的语法功能的能力。
3)归纳式学习能力:在很少的指导下从新的语言材料中推断语言形式、规则、格式的能力。
4)机械记忆能力:快速有效地学习和记忆音义之间联系的能力。
后来机械记忆能力被排除了,只有前三种能力被保留下来。MLAT由五部分测试内容组成,分别是:数字学习、语音符号、拼写提示、句子中的词语、成对的相关词语。语音编码能力主要由“语音符号”部分测量。这部分实际测量的是建立语音和语音符号之间的联系和辨音能力。语法敏感性主要由“句子中的词语”部分测量。这部分要求考生在句子中挑出具有同样语法功能的词语。R.Gardner和w.Lambert(1965)的研究表明这部分测试和考生的一般学业有密切关系。MLAT并没有明确地测量考生的归纳式学习的能力。
PLAB考察三个方面的内容:
1)言语智能:对词语的熟悉程度和分析言语材料的能力。
2)学习动力。
3)听觉能力。
PLAB包括六个部分:学生各科成绩的平均积分点、兴趣、词汇、语言分析、辩音、语音一符号。言语智能由“词汇”和“语言分析”两部分测量。“词汇”部分测量的是考生的母语词汇知识。学习动力由“兴趣”部分测量。听觉能力由“辩音”、“语音一符号”两部分测量。
在MLAT和PLAB测量的各种能力中只有语音能力才是语言学能的成分,其他能力很难和一般智能甚至情感因素区分开。但这两项测试都具有语言学习预测能力。
5.诊断测试
诊断测试的目的是确定学习者学习中的困难和存在的问题或已经学过但尚未掌握的教学内容,以便教师在后面的教学活动中采取补救措施。尽管诊断测试一词在教学和测试文献中使用频率很高,但很少有测试完全为诊断目的而设计。学业测试和进展测试,甚至水平测试,都可以用于诊断目的。辨音测试、词汇测试、语法测试、某些有控制的写作测试等都比较合适提供诊断信息。
……
王振亚,1982年毕业于北京航空航天大学外语系英语专业,获文学学士学位,留校任教。1988年毕业于北京航空航天大学研究生院外语系,获语言学与应用语言学硕士学位。1991年毕业于北京大学英语系英语语言文学专业,获文学博士学位。1991年到1999年在北京航空航天大学外语系任教。1993年起享受政府特殊津贴。1997年晋升,教授。1999年至今任北京语言大学外语学院英语系教授、博士生导师。2007年获北京市高校教学名师奖。主要研究领域包括语言与文化、语言测试、系统功能语法。
受事成分的句法投射 内容简介 本书注重形式与功能的结合,注重多种理论方法的综合运用,注重典型与非典型的对照,重视常规与变异的共现,以受事成分的句法投射机制为线索...
水木清华:二三十年代清华校园文化 内容简介 清华大学是蜚声中外的名校之一,有着与众不同的文化风情和精神理念。“自强不息,厚德载物”更是清华人代代相传的情操风范。...
《手机影像之道:手机摄影修片与短视频剪辑实战教程》内容简介:本书针对摄影与短视频的后期处理进行了系统的介绍,不仅有基础理论
乐山方言 内容简介 当读到赖先剐君的<乐山方言>时,我非常高兴。他多年来调查研究乐山方言的成果终于闻世了。作为研究四川方言的同行,我深知他为这本书付出了多少心血...
古文字通假字典 本书特色 本字典是一部记录汉语古文字资料中通假字的工具书。汇集殷周至汉初的甲骨文、金文、货币、玺印、陶文、石刻、盟书、帛书、竹木简牍等里的古文字...
罗马精神 内容简介 本书不是什么罗马历史,而是指出在罗马伟大作家眼中罗马人是什么样子的,同时他们自己又表现出罗马人的哪些特质,让他们有别于其他古人。罗马塑造其民...
最有人情味、也最逗趣的江戶怪奇物語《一日江戶人》作者杉浦日向子生涯代表作《陰陽師》夢枕獏 茂呂美耶 推薦浮世繪大師葛飾北齋,即使名聲響亮,卻仍住在髒亂破舊的房子...
王力古汉语字典 本书特色 《王力古汉语字典》有以下八个特点:扩大词义的概括性、僻义归入备考兰、注意词义的时代性、表明古韵部、注明联绵字、每部前有一篇部首总论、辨...
国粹与国学 本书特色 《国粹与国学》综汇作者许地山在大公报相继发表的十三篇议论文章,论题涵盖宗教、文物、语文三个领域。其中《宗教底妇女观》论述了佛教、基督教、伊...
中国十大情圣 内容简介 胡适、郭沫若、郁达夫、徐志摩、张爱玲、萧红、傅雷、三毛……他们是我们耳熟能详的文学艺术大师,为我们创造了卓尔不群的艺术成就。在他们的生命...
团购:美丽中国10册 本书特色 ★ 16开平装,蓝天出版社出版★ 中国科学院院士担纲顾问,中国地理学会及各省市自治区地理学会等权威机构联手打造★ 既为读者提供了...
咬文嚼字:合订本:2006 本书特色 知名社会语文类刊物《咬文嚼字》杂志,从1995年开始每年出版一本合订本,郝铭鉴主编的《咬文嚼字(2006合订本)》是200...
医疗与养生:健康的时尚 内容简介 本书主要内容包括:健康知识的三个现象、健康的时尚、西方健康责任的趋势、从医学图腾到身体图像、平衡与抵抗:西方医疗史的两种见解等...
声律启蒙 笠翁对韵诵读本 本书特色 《声律启蒙》是训练儿童应对,掌握声韵格律的启蒙读物。按韵分编,包罗天文、地理、花木、鸟兽、人物、器物等的虚实应对。从单字对到...
成语典故文选(上、下) 内容简介 成语典故,是汉语的一个重要组成部分,它构成了汉语的一大特色,丰富了汉语语汇,增强了汉语的表现力。成语典故,约定俗成,随着语言的...
中国的文房四宝 本书特色 文房四宝,即笔、墨、纸、砚,是我国书绘符号和文字的工具和材料。没有它们,就没有中国古代繁荣的经济、发达的文化和国家的强大。本书分别介绍...
至高無上「推理魂」!台日「日本推理」重量級推手傅博老師代表作!台灣最具權威性的日本推理小說評論文集!提拔無數當代推理名家泡?妻夫、栗本薰、田中芳樹、連城三紀彥,...
老话儿:正在消失的语言 本书特色 “老话儿”是古人经验的总结,广泛存在于生产、生活之中,因而具有地域性、民族性、行业性的特点。不同地域、不同民族、不同行业、不同...
-韓國江陵大學產業工藝科畢業-現經營個人網站Evens Diary(www.evenstory.com)-同時於網路、日常生活中教授書籍藝術-著有《生活中的書籍...
开卷闲话九编-开卷书坊 本书特色 《开卷闲话九编》是作者子聪多年来所写在读书界著名的“开卷闲话”读书随笔选集之续。收入《开卷》二〇一四年一月至二〇一五年四月以来...