当前课程知识点:汉语国际教育概论 > 第九章 课堂教学与语言测试 > 9.3语言测试 > 9.3语言测试
本节我们进入
四大环节的最后一个环节
测试评估
介绍语言测试的相关知识
语言测试是根据一定的评估目的
以抽样方式
通过有限试题
来诱导出受试者的言语行为
然后借助于定量描述
推断受试者
掌握该语言的知识和能力
从定义中可以看出
语言测试
不可避免带有间接性
片面性
主观性和偶然性
第二语言测试
可以从测试的用途
评分方法
命题方法
成绩反映方法
以及测试的制作要求等
不同角度进行分类
按照测试的用途
可以分为学能测试
成绩测试
水平测试和诊断测试
学能测试又称
潜能测试或性向测试
目的在于了解受试者
学习第二语言的潜在能力和素质
学习语言的潜能包括
语音的编码 解码能力
语法敏感性
语言的记忆能力
综合归纳能力等
学能测试是一种预示性的测试
成绩测试又称课程测试
是一门课程或课型的测试
目的是检查学习者
在某一教学阶段
是否掌握了教学大纲和教材
所规定的教学内容
这是一种回顾性的测试
成绩测试是教学中
用得最多的测试
学校的期中 期末
和毕业考试等
都属于这一种
水平测试又称能力测试
目的在于测量受试者
现有的整体的语言实际运用能力
以评定是否达到
胜任某项任务的要求
水平测试
根据语言交际能力的标准
或是某一特定任务的要求来命题
这是一种回顾兼预示的测试
具有较高的区分性
受试者的分数
反映了他在全体受试者中的位置
水平测试常常是
大规模标准化测试
如汉语的HSK
英语的托福考试等
诊断测试是为了
了解受试者在学习某一具体内容
或在较短一段时间里
所存在的问题而进行的测试
目的是迅速直接地获得反馈信息
及时改进教学
这也是一种回顾兼预示性的测试
常常是与一具体的
短期目标相联系
比如学校中的小测验
诊断测试是非正式的测试
命题评分都比较灵活
一般也不作为衡量
学生水平的主要依据
按评分的客观化程度来分
可以分为
客观性测试和主观性测试
客观性测试的试题答案是固定的
评分是客观的
不受评卷人主观因素影响
甚至可以用机器评分
主观性测试试题
允许有不同答案
评分在很大程度上
取决于评卷者的主观判断
按命题方法可以分为
分立式测试
综合性测试和交际性测试
分立式测试是对
语言要素和言语技能
分别进行单项测试
综合性测试是对
语言知识和言语技能
进行整体的综合性的测试
以测量受试者综合运用
语言知识和技能的能力
交际性测试是测定
受试者在实际生活中
运用语言进行交际的能力
面谈
应用性写作属于这一种
目前这种测试形式还在探索中
按分数解释的方法分为
标准参照测试和
常模参照测试
标准参照测试是测试受试者
是否达到教学大纲所规定的标准
只用他的成绩
与应达到的标准比较
不与别人的成绩作比较
成绩测试属于这一类
常模参照测试
是将受试者的个人成绩与
集体考试成绩相比较
以决定受试者的成绩
在集体中的位置
所谓 常模 是指
同一批受试者掌握的平均水平
这种测试的目的在于显示
受试者语言知识和能力的差异
分数的分布以平均分为中心
形成近似正态分布
水平测试
学能测试
属于常模参照测试
按测试的制作要求分为
标准化测试和非标准化测试
标准化测试
通常是以客观性试题为主的
常模参照测试
而成绩测试 诊断测试等
属于非标准化测试
对语言测试的质量进行评价
可以从效度 信度
区分性 可行性
及反馈作用几个方面进行
效度又称有效性
指测试的有效程度
即测试的内容和方法
是否能测出预定要测量的东西
效度又分为表面效度
结构效度和经验效度
表面效度指
某个测试从表面来看
是否有缺漏
是否有偏题怪题
这是靠观察者的
主观评价得来的效度
内容效度指测试的内容
其代表性
准确度和覆盖面如何
评价内容效度
要采用逻辑方法
进行定量分析
通常由专家审定
结构效度又称理论效度
指考试的结果在多大程度上
符合我们根据
某种理论作出的预测
而用这种理论
来解释测试的成绩
结构效度是最重要的效度
是效度的核心问题
校标关联效度是指
确定一种能反映
测试效度的参照标准
然后考察某一考试与
该标准之间的相关程度
影响效度的因素有
测试目的不明
命题的技术性问题
组织管理的问题等
信度又称可靠性
指测试结果的
可靠程度或稳定性
也就是考试成绩
是否反映了受试者的实际水平
一般从三个方面衡量
测试的稳定性
测试的等值性
测试的内部一致性
影响信度的因素有题量
题量大
分布均匀
代表性好
信度就高
反之
信度低
题量是影响信度的主要因素
影响信度的因素还有
试题同质性
试题区分性
受试水平的多样性
评分客观性等
区分性质
测试区分受试者
知识和能力差别的性能
是试题的质量标准
测试的区分性可以从
试题的难易程度
和试题的区分度两方面考虑
后者与前者相关
是更重要的指标
可行性指测试是否简便
经济
易于操作
便于管理组织
测试是用来检查教学效果的
但同时又不可避免地
给教学以影响
这就是测试的后效作用
好的测试符合教学规律
能给教学以正确的引导
对学生的学习起检查和督促作用
产生积极的后效
一个标准化的语言测试过程
大体分为四个步骤
设计命题
考试实施
阅卷评分和统计分析
下面介绍一下
语言测试中常见的几种题型
包括选择题
综合填充题
作文和口试
编制选择题最大的难点在于
设计干扰项
干扰项一定要起到
似是而非的干扰作用
不能牵强附会
随便拼凑
综合填充题
是完形测试的基本形式
与选择题相结合
既能考查综合语言能力
又能保持客观性测试的优点
作文是传统的语言测试题型
能全面反映受试者的语法 词汇
标点符号运用水平
汉字书写水平
以及成段表达能力等
采用作文题型
要解决的一个重要问题是
尽量使评分客观化
目前对于测试 说 的能力
还比较难大规模进行
这是因为
面对面的人工测试方式
过于费时费力
而采用录音方式又不够自然
对受试者心理有一定影响
以上我们介绍了测试的定义
测试的类型
测试的评析标准
测试的过程
和语言测试中常见的题型
至此
我们已经将四大环节
全部介绍完毕
下一节
我们将为大家介绍
本学科的研究方法
我们下节再见
-1.1学科名称
--1.1学科名称
--1.1学科名称
--随堂测验
-1.2学科任务和学科体系
--1.2随堂测验
-1.3学科性质、学科特点和学科定位
--1.3随堂测验
-第一章 单元测验
-2.1发展回顾
--2.1发展回顾
--2.1发展回顾
--2.1随堂测验
-2.2发展现状
--2.2发展现状
--2.2发展现状
--2.2随堂测验
-第二章 单元测验
-3.1语言的基本特征与汉语教学
--3.1随堂测验
-3.2语言学的发展与汉语教学
--3.2随堂测验
-3.3.1功能主义语言学与汉语教学
--3.3.1随堂测验
-3.3.2汉语的特点与汉语教学
--随堂测验
-3.4汉语教学的教育学基础
--随堂测验
-单元测验
-4.1心理学基础
--4.1心理学基础
--4.1心理学基础
--4.1随堂测验
-4.2 文化学基础(一)
--4.2随堂测验
-4.3 文化学基础(二)
--随堂测验
-第四章 单元测验
-5.1.1一般学习理论
--5.1.1随堂测验
-5.1.2 语言学习与习得
--5.1.2随堂测验
-5.2 第一语言习得及主要理论假说
--5.2随堂测验
-5.3.1第二语言习得理论和假说(一)
--5.3.1随堂测验
-5.3.2第二语言习得理论和假说(二)
--5.3.2随堂测验
-第五章 单元测验
-6.1.1第二语言习得过程研究(一)
--随堂测验
-6.1.2第二语言习得过程研究(二)
--6.1.2随堂测验
-6.2 学习者的个体因素
--随堂测验
-6.3语言学习环境
--6.3随堂测验
-第六章 单元测验
-7.1认知派与经验派
--7.1随堂测验
-7.2人本派与功能派
--7.2随堂测验
-7.3 第二语言教学法的发展趋向
--7.3随堂测验
-第七章 单元测验
-8.1总体设计与教学类型
--8.1随堂测验
-8.2教学目的与课程设计
--8.2随堂测验
-8.3基本教学原则
--8.3随堂测验
-8.4教材编写与选用
--8.4随堂测验
-8.5教材发展现状、趋势及存在问题
--8.5随堂测验
-单元测验
-9.1课堂教学
--9.1课堂教学
--9.1课堂教学
--9.1随堂测验
-9.2.1语言要素的教学:语音和词汇
--9.2.1随堂测验
-9.2.2语言要素的教学:语法和汉字
--9.2.2随堂测验
-9.3语言测试
--9.3语言测试
--9.3语言测试
--9.3随堂测验
-第九章 单元测验
-10.学科研究的具体方法
--10.随堂测验
-第十章 单元测验