当前位置:问答库>考研试题

2018年东南大学人文学院709心理学综合之心理与教育测量考研强化五套模拟题

  摘要

一、简答题

1. 简述效度与信度的关系。

【答案】信度是指测量所测得的结果的一致性或稳定性,稳定性越大,一致的程度越高,就意味着测评结果越可靠。效度是指测评的有效性和正确性,即测评是否测量了它要测定的东西,

是否达到它所预定的测评目标。根据真分数理论的表达式

的关系:

(1)高信度是高效度的必要条件,但不是充分条件。

根据信度与效度的操作定义,效度是与测量目的有关的变异(有效变异)与观察分数变异的比值,即而信度是一组测量分数的真分数变异与总变异(实得变异)的比值,即因此,高效度必然有高信度,而高信度则不一定会有高效度。

(2)效度受信度系数大小的限制。

根据真分数理论的基本公式,可以将效度表达式改成如下形式:

其中表示效度,表示信度系数。 可以得到信度与效度

而上式中一定大于等于零,因而,效度的大小始终受信度系数大小的制约。

2. 测验项目分析的作用是什么?

【答案】项目分析是指对测验的难度、区分度等方面进行分析,以考查该测验在区分被试方面是否有效。具体作用如下:

(1)对难度进行分析

难度是指测验项目的难易程度。一个测验项目,如果大部分被试都能答对,则该项目的难度就小;如果大部分被试都不能答对,则该项目的难度就大。测验难度影响测验分数的分布形态。测验的难度直接依赖于组成测验项目的难度。

通过考察测验分数的分布,可以对测验的难度作出直观分析。过难或过易的测验,会使测验分数相对地集中在低分端或高分端,从而使得分数的全距缩小。分数分布范围较广,测验信度较高,反之则估度值较低。当项目的难度以集中在0.50左右最佳,以集中两极端最差。项目的难度对项目的鉴别能力有一定的联系。

(2)对区分度进行分析

区分度是指测验项目对被试心理品质水平差异的区分能力。具有良好区分度的项目,能将不同水平的被试区分开来。测量专家们把试题的区分度称为测验是否具有效度的“指示器”,并作为评价项目质量,筛选项目的主要指标与依据。评价测验项目区分度高低依赖于对被试水平的准确测量,通常称作为效标分数。测验项目区分度的效标分数更多的是用测验总分,称作为内部效标。区分度(D )的取值范围介于-1.00至+1.00之间。通常D 为正值,称作积极区分;D 为负值为消极区分;D 为0称作无区分作用。具有积极区分作用的项目,其D 值越大,区分的效果越好。

3. CTT 模型及其假设的主要内容是什么?

【答案】(1)CTT 模型

经典测验理论(CTT )假定,观察分数(记为X )与真分数(T )之间是一种线性关系,并只相差一个随机误差(记之为E )。即:X=T+E, 这就是CTT 的数学模型。

(2)CTT 模型假设的内容

根据CTT 模型,可以引伸出3个相关联的假设公理:

①若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数,即:E (X )=T,或E (E )=0;

②真分数和误差分数之间的相关为零,即:

③各平行测验上的误差分数之间相关为零,即

其中,第2、第3条假设意在说明E 是个随机误差,没有包含系统误差在内,第1条假设则在于说明E 是个服从均值为零的正态分布的随机变量。

4. 已知若希望把效度系数提高到0.65和0.70, 则测验长度要増加几倍?

【答案】测验长度与效度的公式如下:

整理得:

当时,时,

所以,要想把效度系数提高到0.65,测验长度需要增加6.42倍;要提高到0.70, 测验长度需要增加13.80倍。

5. 小明在一次统考中的语文、数学成绩转换成T 分数(平均数为50,标准差为10)后,分别为65和70, 二者的差异是否有意义?(已知这次语文、数学考试的信度分别为0.84和0.91)

【答案】小明的这两门功课的T 分数之间差异的标准误是:

在95%的置信区间上,

所以,二者相差要达到9.8分以上,才能有95%的把握它们之间的差异有统计上的意义。因其数学的T 分数只比语文高5分,故差异并不显著。

6. 测验分数为什么要合成?说明合成测验分数的主要方法。

【答案】使用测验时,需要将几个分数或几个预测源组合起来获得一个合成分数或做出总的预测。包括项目的组合、分测验或量表的组合、测验或预测源的组合等。

(1)测验分数合成的原因

测验分数要合成是因为测验施测以后,将受测者的反应与答案作比较即可得到每个人在测验上的分数,这种直接从测验上得到的分数是原始分数。它本身没有太大的意义。而为了使原始分数有意义,同时为了使不同的原始分数可以比较,必须把它们转换成具有一定的参照点和单位的测验量表上的数值。通过统计方法由原始分数转化到量表上的分数称为导出分数。有了导出分数,才能对测验结果作出有意义的解释。

(2)合成测验分数的主要方法

①临床判断。研究者根据直觉经验,主观地将各种因素组合以得出结论或预测的方法。其优点是能从整体上对各因素加以综合考虑,考虑到了各因素间的交互作用;同时,也能考虑到每个人的具体情况。其缺点是主观加权可能受判断者的偏见的影响,不够客观,没有精确的数量指标,判断者需要受过训练并具有丰富的经验。

②推理方法。不考虑各个变量之间的经验关系,而是根据某种先验的理想程序来做推理性加权。包括单位加权和等量加权。单位加权最简单的方法是将各个变量直接相加而得到一个合成分数;等量加权需要将所有分数转换成标准分数(Z 分数)。

③多重分段。当用测验来决定取舍时,必须确定一个分数线,分数在这条线以上的人接受,在这条线以下的拒绝,这是只有一个预测源的情况。在实际决策中,人们往往不只使用一个预测源。这种方法只是把人分为达到最低标准(接受)与未达到最低标准(拒绝)两类,而不在两组人内部做进一步的区分。根据确定分数线的不同情况,多重分段可有两种主要模式:综合分段、连续栅栏等。

④多重回归。当同时采用几个预测源来预测一个效标,而这些预测源变量之间又具有互偿性时,多重回归是最常用来组合分数的模式。多重回归方程式的导出一般是借助计算机来进行的。

⑤合成分数的特殊方法。在某些情况下需要采用一些特殊的方法来组合分数,比如:完形记分、轮廓分析等。完形记分就是将各个变量看作一个整体,不是孤立地看每一个反应结果,而是看总的反应模式。轮廓分析主要是考虑被试在各个测验或量表上所得分数的轮廓,而不是将各个变量做简单的线性组合。

7. 简述测验标准化的含义及提高测验标准化程度的方法。

【答案】(1)测验标准化的含义