2018年长江大学课程与教学论312心理学专业基础综合之心理与教育测量考研核心题库
● 摘要
一、简答题
1. 能力倾向测验与特殊能力测验在应用上有何区别?
【答案】能力倾向测验的目的不在于总结过去,而在于预测将来,即预测个体在将来的学习或工作中可能达到的成功程度。特殊能力测验一般针对于一种特殊能力所包含的各方面因素进行测量,测验性质介于成就测验和能力倾向测验之间,其内容与相应的专业或职业训练的重点是一致的,而测量目的既想了解个体在此专业领域的既有水平,又想预测个体今后在此专业领域成功的可能性。两者在应用上的区别主要表现为:
⑴能力倾向性测验包含的能力较多,并且对每种能力的测量不深入,但是特殊能力测验是对能力倾向测验中所涉及的某方面的能力的深入探讨,它对能力的范围涉及很小,主要是精化于某个具体的能力。
⑵能力倾向测验关注于测量个体所具有的能力,而特殊能力测验关注于个体某方面的能力发展到何种程度。
2. 与经典测验理论相比,项目反应理论有哪些优良性质?
【答案】与经典测验理论相比,项目反应理论基本上突破了经典理论的公理体系,避免了经典理论由于先天不足而产生许多限制的弱点。项目反应理论的优良特性表现在以下几个方面:
(1)题目参数的跨群体不变性
项目特征曲线是被试正确作答概率对其潜在特质水平的回归曲线,统计学上已经可以证明回归线是因变量与自变量之间本质关系的描写,在许多情况下不受样本分布的影响。
(2)潜在特质量表的可选择性
量表的可选择性实际上指量表的参照点和度量单位可以任意选择而其回归函数值保持不变。利用这一性质,可以使来自不同试卷、不同被试施测的所有潜在特质参数与题目参数定义在同一度量系统上。项目反应理论的这一优良性质为进行测验等值提供了理论基础。
(3)参数设计的科学性
项目反应理论参数设计的科学性表现在以下几点:
①题目难度参数b 与被试潜在特质参数0定义在同一度量系统上。这一性质为选择与被试水平匹配的试题施测创造了条件。
②区分度参数与难度参数相互独立。这一性质为在任何难度水平上选择高区分度试题提供了保证。
③伪机遇参数的实证性。这使得试题筛选重实际性能而不拘于表面形式。
(4)信息函数概念的引进与信息函数的可加性
①项目反应引进了一个全新的概念:测验题目信息函数。项目反应理论定义测验试题的信息函数为:
②项目反应理论证明,对于一个潜在特质水平值为的被试,试题i 施测于他时,所得9值的测量标准误差为:
③可以证明试题的信息函数与试题的区分度成正比,与伪机遇水平成反比,与减b 的差的绝对值成反比。
④项目反应理论进一步说明测验题目信息函数具有可加性,累加值称为测验信息函数,
记为
同样,整个测验的测量标准误差为:
3. 请简述效度的种类。
【答案】效度是指测量的有效性,即一个测验或量表实际测出其所要测量的心理特质的程度。它主要有三种类型,内容效度、结构效度和效标效度。
(1)内容效度
内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。内容效度的评估方法主要应用于对学绩测验的评估。一个测验要有内容效度必须具备两个条件:要有定义得完好的内容范围;测验题目应是所界定的内容范围的代表性取样。确定内容效度的方法主要有专家判断、统计分析、经验法等。
(2)结构效度
结构效度也称构想效度,是指测验能说明心理学上的理论结构或特质的程度,或是用心理学上的某种结构或特质来解释测验分数的恰当程度。结构效度的特点包括:其大小首先取决于抽象的心理理论;当观察分数无法证实理论假设时,不一定说明该测验的结构效度不高;结构效度不是靠单一数量指标描述的,而是通过对测量内容选择的证据累计起来确定的。
(3)效标效度
效标效度又称准则效度、实证效度,是指一个测验对处于特定情景中的个体的行为进行预测时的有效性,即对于研宄者所感兴趣的行为能够预测得怎么样。根据效标资料搜集的时间不同,又可分为同时效度和预测效度两种。效标是衡量测验是否有效且独立于测验的外在指标。效标效度一般可以通过统计分析得到一个数量指标,因而又可以称为统计效度。
4. 请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。
表 9位专家对14道题目的等级评定结果
【答案】从表的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:
(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容1而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5); 同理,第4、12、5、11题的内容效度亦得到很高的评价。因此,这七道题目无疑可以原封不动地保留下来。再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。
(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同的。
(3)为了增加参加评定的专家们之间的一致性,也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。如表所示,第二位专家在所有题目上所评等级与各中数间的差异之和为24, 说明该专家的评定结果与其他8位专家之间具有较大的差异,因此可以不考虑这位专家的意见,只保留8位专家的评定结果,在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。
5. 为什么人们不像对物理测量那样容易接受心理测量?如何才能证明心理测量的必要性和可能性?
【答案】(1)人们不像对物理测量那样容易接受心理测量,宄其原因在于心理测量有太多的