当前位置:问答库>考研试题

2018年浙江工业大学教育科学与技术学院975心理健康教育[专业硕士]之心理与教育测量考研核心题库

  摘要

一、简答题

1. 离差智商与比率智商的本质差异是什么?

【答案】(1)离差智商

离差智商,是指一个人的智力偏离本年龄组平均水平的方向和程度。测验规定,100为平均水平,如果一个人智商分数高于100, 则表示高于平均水平;若小于100, 则表示低于平均水平。离差智商反映的是一个人与其同年龄组人的智力分布相比较下,所处的水平位置。

离差智商的公式是:其中反映了所有人的分数相对于平均数偏离的程度,说明了整体中各个分数的分布状况,离差智商也就因此而得名。100分为定义的平均智商;15是为了取消除法中的小数,并使所得的商与100有可比性而人为规定的。

(2)比率智商

比率智商:1916年美国斯坦福大学推孟修订的比纳一西蒙量表使用智商(IQ )这个概念来作为智力的测量指标,更加有利于不同年龄儿童智力的比较。

斯坦福一比纳智力测验中的智商是智力年龄与实际年龄之比,也称比率智商,计算公式为:智商(IQ )其中,智力年龄是受测者通过测验项目所属的年龄。IQ 作为智力年龄与实足年龄的比值,当其值为100的时候,就表示一个人的智力处于中等水平。在一般人口中,智商呈正态分布,即中等水平的居多数,两极端的为少数。

(3)两者的本质差异

两者的本质差异在于,通过比率智商,只能够了解到个体自己的智力发展情况,了解其心理年龄与实足年龄的关系,并且比率智商存在一个很明显的问题即是随着个体实足年龄的増长,心理年龄的变化越来越慢,会出现智商倒退的现象,并且不同个体之间不能够相互比较。而离差智商就解决了这个问题,采用Z 分数,来衡量所有人的分数相对于平均数的偏离程度,提供了不同个体间相互比较的可能。

2. 简述测验标准化的含义及提高测验标准化程度的方法。

【答案】(1)测验标准化的含义

测验标准化是指测验的编制、实施、评分和分数解释等程序的一致性。其内容包括确定目的、科学命题、选取代表性样本、做题目分析、确定统一的指导语和施测条件、规定评分与解释、分析测验的信度、效度等。其目的在于使编制或修订的心理测验符合标准测验条件的程序。

(2)提高测验标准化程度的方法

①测验编制过程要标准化。在确定测验维度、题目编制、题目分析、测验信度和效度分析等方面要严格按规定程序进行。

②测验实施过程要标准化。要统一指导语、统一步骤、统一时限,防止噪音和无关人员干扰等。

③测验评分和解释要标准化。评分和解释要制定详细、统一的标准,并据此进行严格的评分和解释。

3. 与经典测验理论相比,项目反应理论有哪些优良性质?

【答案】与经典测验理论相比,项目反应理论基本上突破了经典理论的公理体系,避免了经典理论由于先天不足而产生许多限制的弱点。项目反应理论的优良特性表现在以下几个方面:

(1)题目参数的跨群体不变性

项目特征曲线是被试正确作答概率对其潜在特质水平的回归曲线,统计学上已经可以证明回归线是因变量与自变量之间本质关系的描写,在许多情况下不受样本分布的影响。

(2)潜在特质量表的可选择性

量表的可选择性实际上指量表的参照点和度量单位可以任意选择而其回归函数值保持不变。利用这一性质,可以使来自不同试卷、不同被试施测的所有潜在特质参数与题目参数定义在同一度量系统上。项目反应理论的这一优良性质为进行测验等值提供了理论基础。

(3)参数设计的科学性

项目反应理论参数设计的科学性表现在以下几点:

①题目难度参数b 与被试潜在特质参数0定义在同一度量系统上。这一性质为选择与被试水平匹配的试题施测创造了条件。

②区分度参数与难度参数相互独立。这一性质为在任何难度水平上选择高区分度试题提供了保证。

③伪机遇参数的实证性。这使得试题筛选重实际性能而不拘于表面形式。

(4)信息函数概念的引进与信息函数的可加性

①项目反应引进了一个全新的概念:测验题目信息函数。项目反应理论定义测验试题的信息函数为:

②项目反应理论证明,对于一个潜在特质水平值为的被试,试题i 施测于他时,所得9值的测量标准误差为:

③可以证明试题的信息函数与试题的区分度成正比,与伪机遇水平成反比,与减b 的差的绝对值成反比。

④项目反应理论进一步说明测验题目信息函数具有可加性,累加值称为测验信息函数,

记为

同样,整个测验的测量标准误差为:

4. 请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。

表 9位专家对14道题目的等级评定结果

【答案】从表的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:

(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容1而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5); 同理,第4、12、5、11题的内容效度亦得到很高的评价。因此,这七道题目无疑可以原封不动地保留下来。再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。

(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同的。

(3)为了增加参加评定的专家们之间的一致性,也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。如表所示,第二位专家在所有题目上所评等级与各中数间的差异之和为24, 说明该专家的评定结果与其他8位专家之间具有较大的差异,因此可以不考虑这位专家的意见,只保留8位专家的评定结果,在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。