2018年长江大学课程与教学论629心理学基础综合之心理与教育测量考研仿真模拟五套题
● 摘要
一、简答题
1. 试证信度三个定义的等价性。
【答案】信度的三个等价操作定义为:
(1)定义1:信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比。即
:式中
异。
(2)定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即:
即:
2. 已知某个测验的信度为0.75, 要使该测验的信度达到0.90, 必须增加多少题目?
【答案】根据公式代入数据,得: (3)定义3:信度乃是一个测验X (A 卷)与它的任意一个“平行测验”(B 卷)的相关系数。代表测量的信度,代表真分数变异,代表总变异数,即实得分数的变
因此,新测验的题目数应是原来测验的3倍,即为了达到所要求的信度,要增加原测验题目数的2倍。所以,要使测验的信度达到0.90, 必须増加2倍的题目。
3. 简述效度与信度的关系。
【答案】信度是指测量所测得的结果的一致性或稳定性,稳定性越大,一致的程度越高,就意味着测评结果越可靠。效度是指测评的有效性和正确性,即测评是否测量了它要测定的东西,
是否达到它所预定的测评目标。根据真分数理论的表达式
的关系:
(1)高信度是高效度的必要条件,但不是充分条件。
根据信度与效度的操作定义,效度是与测量目的有关的变异(有效变异)与观察分数变异的比值,即而信度是一组测量分数的真分数变异与总变异(实得变异)的比值,即因此,高效度必然有高信度,而高信度则不一定会有高效度。
(2)效度受信度系数大小的限制。
根据真分数理论的基本公式,可以将效度表达式改成如下形式:
其中表示效度,表示信度系数。
第 2 页,共 49 页 可以得到信度与效度
而上式中一定大于等于零,因而,效度的大小始终受信度系数大小的制约。
4. 不同能力水平的人在接受同一测验时,为什么会有不同的测量误差?
【答案】就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度,如果被试的能力水平相差很大时,此时的测量误差就会偏大。这是因为,所计算的信息估计值大都是以相关为基础的,而相关系数的大小往往取决于全体被试得分的分布情况:
(1)当被试团体异质(即团体内能力水平彼此差异大)时,全体被试的总分分布必然较广,那么分布位于两个端点的值可能相互抵消,以相关为基础计算出来的信度值必然会大。这就很有可能高估实际的信度值而产生测量误差。
(2)当团体内部水平相差不大(即能力水平差不多的被试位于同一水平)时,其得分分布必定会较窄,以相关为基础计算出来的信度值必然会小。这时又有可能低估真正的信度值而产生测量误差。
(3)此外,若团体的平均水平太高(大家都得高分)或太低(大家都得低分),同样会使测验总分的分布变窄,低估测量的真正信度而产生测量误差。
5. 心理测量的误差来源主要包括哪些?
【答案】心理测量误差是指在心理测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应,分为系统误差和随机误差两种。其来源主要包括三个方面,即测量工具、被测对象和施测过程。
(1)在测量工具方面,心理测量工具通常是一套以测验(问卷)为核心的刺激反应系统(通常称作量表)。心理测量量表是否稳定、是否真正测到了所要测的东西是测量工具造成误差的两种主要原因。
(2)在测量对象方面,造成测量误差的主要原因是受测者真正水平是否得到正常发挥。一般地,受测者的某种心理特质水平是相对稳定的,但是他在接受测量时的生理和心理状态会影响其水平的正常发挥。
(3)在施测过程方面,产生测量误差的原因主要是一些偶然因素。比如,物理环境,主试,评分记分环节,意外干扰等。
6. 智力测验的功能是什么?
【答案】传统智力测验的功能主要有:
测验的基本功能是测量个体差异,大量的测量结果表明:在一般人群中智力高者或低者均占少数,智力中等或接近中等者约占全部人口的80%,基本上呈常态分布。
⑴将人群分类
由于智力测验所依据的理论上的特性,以及智力分布的常态性,智力测验在实际中常常行使将人群分类的功能。韦克斯勒曾按智商的高低,把智力分成七类,其是IQ 在130以上者为极优秀(天才);IQ 在120〜129者为优秀;IQ 在110〜119者为中上(聪颖);IQ 在90〜109者为中
第 3 页,共 49 页
材;IQ 在80〜89者为中下(迟钝);IQ 在70〜79者为低能边缘;70以下者为智力缺陷。
⑵预测个体未来可能的成功程度
由于传统智力测验结果与学习成绩、教师评定等外在效标间的高的正相关的存在,智力测验在实际中又常被作为预测源测验行使预测的功能。
社会对智力测验的需求不仅是将人群分类并预测个体未来可能的成功程度,还要求测验能进一步对个体进行诊断和采取相应且及时的补救措施。而智力的心理测量学概念强调G 因素的存在,只从宏观上描述个体的外在行为结果,却忽略了对个体心理活动过程进行精细的分析及对内部加工机制的探讨,因此,以此为依据的传统智力测验可以对人群进行分类和预测,却无法对个体真正的内在的薄弱点作出精确诊断,从而不能满足社会更为精细的需求。
7. 请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。
表 9位专家对14道题目的等级评定结果
【答案】从表的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:
(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容1而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5); 同理,第4、12、5、11题的内容效度亦得到很高的评价。因此,这七道题目无疑可以原封不动地保留下来。再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。
(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同
第 4 页,共 49 页
相关内容
相关标签