2017年首都医科大学附属北京安定医院620心理学专业基础综合之心理与教育测量考研仿真模拟题
● 摘要
一、简答题
1. 简述经典测验理论的局限性。
【答案】经典测验理论是以真实分数模式(亦即,观察分数等于真实分数与误差分数之和)为理论架构,所采用的计算公式简单明了、浅显易懂,适用于大多数的教育与心理测验资料,以及社会科学资料的分析,为目前测验学界使用与流通最广的理论依据。但其局限性突出表现在以下几个方面:
(1)经典测验理论所采用的指针都是一种样本依赖的指针;即这些指针的获得会因接受测验的受试者样本的不同而不同,因此,同一份试卷很难获得一致的难度、鉴别度或信度。
(2)经典测验理论以一个相同的测量标准误,作为每位受试者的测量误差指针,这种做法并没有考虑受试者能力的个别差异,对高、低能力两极端组的受试者而言,这种指针极为不合理且不准确,致使理论假设的适当性受到怀疑。
(3)经典测验理论对于非复本但功能相同的测验所测得的分数间,无法提供有意义的比较,有意义的比较仅局限于相同测验的前后测分数或复本测验分数之间。
(4)经典测验理论对信度的假设,是建立在复本测量的概念假设上,但是这种假设往往不存在于实际测验情境里。复本测量的理论假设是行不通的,从方法学逻辑观点而言,它的假设也是不合理的、矛盾的。
(5)经典测验理论忽视受试者的试题反应组型,认为原始得分相同的受试者,其能力必定一样;其实不然,即使原始得分相同的受试者,其反应组型也不见得会完全一致,因此,其能力估计值应该会有所不同。
2. 甲被试在韦氏成人智力量表测验中言语智商为102, 操作智商为110。已知两个分测验都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的信度为0.93和0.94,问:甲被试的操作智商是否显著高于言语智商?
【答案】根据题意可知,应使用两平均数之差的显著性检验,并且假设两总体正态。
(1)提出假设:
HQ :甲被试的操作智商不显著高于言语智商。
H1:甲被试的操作智商显著高于言语智商。
(2)计算相关统计量:
先求出差异标准误:
(3)确定显著性水平及临界值:
(4)做出统计决断:
接受即甲被试的操作智商不显著高于言语智商。
所以,甲被试的操作智商没有显著高于言语智商。
3. 现在流行的创造力测验依据的理论基础是什么?
【答案】现在流行的创造力测验依据的理论基础是吉尔福特的关于智力结构的理论。
⑴吉尔福特在智力结构的研究中引入因素分析方法,由此提出了他的智力三维结构模型。在此模型中,他发现智力操作中存在聚合与发散两种不同类型的思维:聚合思维是指利用已有的知识经验或传统方法来解决问题的一种有方向、有范围、有条理、有组织的思维方式;而发散思维则是既无一定方向又无一定范围的由已知探索未知的思维方式。
⑵吉尔福特还认为发散思维在行为上主要表现出3种特性:流畅性、变通性、独特性。这三种特性相互联系,变通性建立在流畅性基础之上,独特性又建立在变通性与流畅性的基础之上,因为只有反应数量众多,才有可能反应角度多样化,进而才有可能出现新视角,新观点。
⑶吉尔福特将发散思维的特性视为人的创造性活动的特性,并因此将创造力定义为发散思维的能力,即对规定的刺激产生大量的、变化多端而又独特的反应的能力。
⑷吉尔福特关于智力测验注重聚合思维而忽视发散思维的评论得到很多学者的共鸣,并且,他视发散思维为创造力之核心的观点也为很多研宄者所接受。因此,目前常见的、有一定影响力的创造力测验基本上是沿循吉尔福特的理论观点编制而成的。
4. 不同能力水平的人在接受同一测验时,为什么会有不同的测量误差?
【答案】就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度,如果被试的能力水平相差很大时,此时的测量误差就会偏大。这是因为,所计算的信息估计值大都是以相关为基础的,而相关系数的大小往往取决于全体被试得分的分布情况:
(1)当被试团体异质(即团体内能力水平彼此差异大)时,全体被试的总分分布必然较广,那么分布位于两个端点的值可能相互抵消,以相关为基础计算出来的信度值必然会大。这就很有可能高估实际的信度值而产生测量误差。
(2)当团体内部水平相差不大(即能力水平差不多的被试位于同一水平)时,其得分分布必定会较窄,以相关为基础计算出来的信度值必然会小。这时又有可能低估真正的信度值而产生测量误差。
,同样会使测(3)此外,若团体的平均水平太高(大家都得高分)或太低(大家都得低分)
验总分的分布变窄,低估测量的真正信度而产生测量误差。
5. 试析题目内容效度与目标参照测验的内容效度间的联系。
【答案】内容效度是指测验题目对有关的内容或行为范围取样的适当性,即编制测验时所选定的测验题目,是否代表了所要测的心理特点。题目内容效度与目标参照测验的内容效度间的联系可从以下几个方面进行分析。
(1)目标参照测验注重被试在其所测内容范围内的掌握程度,因而测验本身的题目组成对其欲测之内容范围的覆盖程度或代表性程度——亦即测验的内容效度就显得尤为重要。
(2)评估任一测验的内容效度,都依赖于两个条件:
①测验有明确界定的内容范围;
②对测验每一题目的内容效度的分析。因此,对题目内容效度的分析是对目标参照测验内容效度分析的重要组成部分和前提。
(3)目标参照测验一般来讲有相对比较确定的内容范围,可用命题细目表表示,同时,也可以采用专家评定的方法对题目效度进行分析,从而保留有效题目,删除无效题目。因此,题目的内容效度是目标参照测验内容效度的一种体现。
6. 能力倾向测验与特殊能力测验在应用上有何区别?
【答案】能力倾向测验的目的不在于总结过去,而在于预测将来,即预测个体在将来的学习或工作中可能达到的成功程度。特殊能力测验一般针对于一种特殊能力所包含的各方面因素进行测量,测验性质介于成就测验和能力倾向测验之间,其内容与相应的专业或职业训练的重点是一致的,而测量目的既想了解个体在此专业领域的既有水平,又想预测个体今后在此专业领域成功的可能性。两者在应用上的区别主要表现为:
⑴能力倾向性测验包含的能力较多,并且对每种能力的测量不深入,但是特殊能力测验是对能力倾向测验中所涉及的某方面的能力的深入探讨,它对能力的范围涉及很小,主要是精化于某个具体的能力。
⑵能力倾向测验关注于测量个体所具有的能力,而特殊能力测验关注于个体某方面的能力发展到何种程度。
7. 概化理论G 研宄的目的是什么?
【答案】概化理论的统计分析分为两个阶段,第一阶段称为G 研宄,第二阶段称为D 研宄。G 研究的目的是要定量估计观察领域中测量目标的方差以及各个测量侧面所产生的测量误差方差。采用的方法是方差分量分析法。
8. 心理与教育测量在教育评价中有哪些主要应用领域?有哪些测验可资利用?
【答案】(1)在测量学生的学习与发展状况中的应用
①评价学生的学习与发展,在教育评价中居于主导地位,它包括3个方面的作用:
②摸清学生的学习和发展状况,是因材施教的前提。
③弄清学生的学习和发展状况,是评价教育过程中不同阶段成效的依据。