当前位置：问答库＞考研试题

2018年大连医科大学应用心理学312心理学专业基础综合之心理与教育测量考研仿真模拟五套题

● 摘要

一、简答题

1．概化理论G 研宄的目的是什么？

【答案】概化理论的统计分析分为两个阶段，第一阶段称为G 研宄，第二阶段称为D 研宄。G 研究的目的是要定量估计观察领域中测量目标的方差以及各个测量侧面所产生的测量误差方差。采用的方法是方差分量分析法。

2．请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定，并决定题目取舍。

表 9位专家对14道题目的等级评定结果

【答案】从表的结果中，可以直接分析每一道题目的内容效度并进而决定题目的取舍：

（1）若以中数为基础进行分析，表中第2、7、14题均是针对目标内容1而编制的，经专家评定，这三题所测内容均和其目标内容之间具有完美的匹配（等级评定中数均为5）; 同理，第4、12、5、11题的内容效度亦得到很高的评价。因此，这七道题目无疑可以原封不动地保留下来。再看，第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好（中数为3）或很好（中数为4），说明这四题也还是可取的，只需根据专家意见略作修改即可，最后，第8、13、10题的内容效度一般（中数为2）或较差（中数为1），说明这三题没有能够很好地反映出其欲

测的目标内容，内容效度很低或根本不具备内容效度，一般需作较大的修改或删除。

（2）若以均值为基础进行分析，得到的结果与上述以中数为基础进行分析的结果是十分类同的。

（3）为了增加参加评定的专家们之间的一致性，也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。如表所示，第二位专家在所有题目上所评等级与各中数间的差异之和为24, 说明该专家的评定结果与其他8位专家之间具有较大的差异，因此可以不考虑这位专家的意见，只保留8位专家的评定结果，在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。

3．简述经典测验理论的局限性。

【答案】经典测验理论是以真实分数模式（亦即，观察分数等于真实分数与误差分数之和）为理论架构，所采用的计算公式简单明了、浅显易懂，适用于大多数的教育与心理测验资料，以及社会科学资料的分析，为目前测验学界使用与流通最广的理论依据。但其局限性突出表现在以下几个方面：

（1）经典测验理论所采用的指针都是一种样本依赖的指针；即这些指针的获得会因接受测验的受试者样本的不同而不同，因此，同一份试卷很难获得一致的难度、鉴别度或信度。

（2）经典测验理论以一个相同的测量标准误，作为每位受试者的测量误差指针，这种做法并没有考虑受试者能力的个别差异，对高、低能力两极端组的受试者而言，这种指针极为不合理且不准确，致使理论假设的适当性受到怀疑。

（3）经典测验理论对于非复本但功能相同的测验所测得的分数间，无法提供有意义的比较，有意义的比较仅局限于相同测验的前后测分数或复本测验分数之间。

（4）经典测验理论对信度的假设，是建立在复本测量的概念假设上，但是这种假设往往不存在于实际测验情境里。复本测量的理论假设是行不通的，从方法学逻辑观点而言，它的假设也是不合理的、矛盾的。

（5）经典测验理论忽视受试者的试题反应组型，认为原始得分相同的受试者，其能力必定一样；其实不然，即使原始得分相同的受试者，其反应组型也不见得会完全一致，因此，其能力估计值应该会有所不同。

4．目标参照测验的题目区分度可以通过哪些方法来确定？

【答案】测验项目的区分度一般采取两类指标：难度差值和相关系数。

（1）难度差值

①掌握组——未掌握组鉴别指数（D ）

a. 分别计算掌握者和未掌握者两组在某项目上的平均通过率，

记为

指数为：则该项目的鉴别

b. 鉴别指数D 的大小，可以直观反映出该项目在多大程度上对掌握者和未掌握者作出了区分。D 值从-1.00到+1.00之间变化，越接近于+1.00, 题目区分度越高。

②个人获得指数

a. 采取前测一后测方法，可获得在前测中错误回答某项目而在后测中能够正确回答的被试人数比例，此即该项目的个人获得指数，其值在0至+1.00之间变化，其大小直接反映了经过教学活动之后受益的被试比例。

b. 由于只考虑到前测中失败而在后测中通过的被试，却没有考虑到在前测中通过而在后测中反而失败的被试，因而其值不会出现负值，这使它所能反映的问题少于一般的区分度指标，因此其应用也受到限制。

（2）相关系数

以相关系数为指标的区分度在-1.00至+1.00之间变化，当其值为负时，应检查题目的问题所在，予以修改或删除；当其值为正时，越接近于1，题目越有效；当其值为0时，题目不具区分力，一般不予保留，但在纯粹目标参照测验中应视该题所测内容在内容范围中的重要性而决定其取舍。

5．测验分数为什么要合成？说明合成测验分数的主要方法。

【答案】使用测验时，需要将几个分数或几个预测源组合起来获得一个合成分数或做出总的预测。包括项目的组合、分测验或量表的组合、测验或预测源的组合等。

（1）测验分数合成的原因

测验分数要合成是因为测验施测以后，将受测者的反应与答案作比较即可得到每个人在测验上的分数，这种直接从测验上得到的分数是原始分数。它本身没有太大的意义。而为了使原始分数有意义，同时为了使不同的原始分数可以比较，必须把它们转换成具有一定的参照点和单位的测验量表上的数值。通过统计方法由原始分数转化到量表上的分数称为导出分数。有了导出分数，才能对测验结果作出有意义的解释。

（2）合成测验分数的主要方法

①临床判断。研究者根据直觉经验，主观地将各种因素组合以得出结论或预测的方法。其优点是能从整体上对各因素加以综合考虑，考虑到了各因素间的交互作用；同时，也能考虑到每个人的具体情况。其缺点是主观加权可能受判断者的偏见的影响，不够客观，没有精确的数量指标，判断者需要受过训练并具有丰富的经验。

②推理方法。不考虑各个变量之间的经验关系，而是根据某种先验的理想程序来做推理性加权。包括单位加权和等量加权。单位加权最简单的方法是将各个变量直接相加而得到一个合成分数；等量加权需要将所有分数转换成标准分数（Z 分数）。

③多重分段。当用测验来决定取舍时，必须确定一个分数线，分数在这条线以上的人接受，在这条线以下的拒绝，这是只有一个预测源的情况。在实际决策中，人们往往不只使用一个预测源。这种方法只是把人分为达到最低标准（接受）与未达到最低标准（拒绝）两类，而不在两组人内部做进一步的区分。根据确定分数线的不同情况，多重分段可有两种主要模式：综合分段、连续栅栏等。

当前位置：问答库＞考研试题

相关题目: