2018年厦门大学教育研究院641心理学专业基础综合之现代心理与教育统计学考研强化五套模拟题
● 摘要
一、概念题
1. 无偏估计
【答案】无偏估计是评价估计量的好坏的一个指标。设参数则它表明对 估计量进行多次观测,其正负偏差趋于抵消,而平均取值正好是待估参数,则称
的无偏估计量。如样本均值
2. 标准分数
【答案】标准分数指以标准差为单位的一种差异量数,又称Z 分数或基分数。它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:
数据的标准分数
,为原始数据的值,式中,Z 为某原始为该组数据的平均数,为该组数据的标准差。标准分是总体均值的无偏估计量。 为参数的估计量为若满足,数的平均数为0,标准差为1。标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。其作用除了能够表明原数据在其分布中的位置外,还能对未来不能直接比较的各种不同单位的数据进行比较。如比较各个学生的成绩在班级成绩中的位置或比较某个学生在两种或多种测验中所得分数的优劣。
3. 相关系数
【答案】相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。绝对值接近1.00端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。
4. 总体
【答案】总体(population )又译“母体”,统计学术语,指一个统计问题中研宄对象的全体。由具有某种研宄特征的个体构成。从总体中抽取一部分个体,就构成总体的一个样本。如,研宄小学生的推理能力,记X 为每个小学生的推理能力,则X 的任一个可能取值是一个个体,X 的所有可能取值的集合则是一个总体。如果随机抽取n 个小学生,测量他们的推理能力为.Y .\这就是一个取自总体X 的样本。可根据包含个体的数目,可分为有限总体和无限总体。总体本身的大小是有限还是无限,取决于研宄问题的推理范围。心理学研宄中常为无限总体。在推断统计中被定义
为一个随机变量,可运用概率论等数学工具进行统计推断。
二、简答题
5. 简述编制分组次数分布表的步骤。
【答案】(1)求全距。全距指最大数和最小数两个数据值之间的差距。从被分组的数据中找出最大数和最小数,二者相减所得差数就是全距。
(2)决定组距与组数。组距是指任意一组的起点和终点之间的距离,用符合i 表示。决定组距的大小需要以全距为参考。全距大,则组距可以大一些;全距小,则组距可以小一些。
组数的多少根据组距的多少来定。如果数据个数在100以上,习惯上一般分10〜20组,但经常取12〜16组。数据个数较少时,一般分为7〜9组。如果数据的总体分为正态,那么可以用下面的经验公式计算组数(K ),这样可使分组满足渐进最优关系。
为数据个数,K 取近似整数)。
(3)列出分组区间。分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限有表述组限和精确组限两种。在列出分组区间时要注意:最高组区间应包含最大的数据,最小组应包含最小的数据;最大组或最小组最好是组距i 的倍数;各分组区间一般在纵坐标上按照顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面;等级次数时,要按照精确组限将数据归类划分到相应的组别中。
(4)等级次数。依次将数据等级到各个相应的组别内,一般用画线计数或写“正”字的方法。
(5)计算次数。根据登记的结果计算各组的次数,计算各组次数的总和即总次数。另外,要核对各组次数总和与数据的总个数是否相等。
6. 估计总体平均数落入该区间的正确可能性概率为1-«,犯错误的可能性概率为«。1. 在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响,为什么?
【答案】(1)在进行差异的显著性检验时,首先需要考虑样本是否服从正态分布,如果服从正态分布,还需要考虑总体方差是否已知,然后看样本是否是独立样本。若将相关样本误作独立样本处理,则忽视了样本数据之间的一致性,导致错误地运用计算公式,差异的显著性也会受到误估,使本来可能有显著差异变成无显著差异。
(2)因为相关样本与独立样本不同,会运用不同的计算方法计算显著性。相关样本与独立样本是根据两个样本是否来自同一个总体来划分的。
①如果是独立样本,其和(或差)的方差等于各自方差的和,即
在进行差异的显著性检验中采用以下公式:
②相关样本之间存在着一一的对应关系。如果是相关样本前后两次结果则相互影响,而不
(N
独立。当两个变量之间相关系数为r 时,两变量差的方差为:
在进行差异的显著性检验中采用以下公式:
由计算公式可以看出,独立样本和相关样本在进行差异的显著行检验时,使用了不同计算公式,相关样本的标准误可能会比独立样本的标准误小,使得计算出的Z 值大,从而更容易达到显著性水平,所以如果将相关样本误作独立样本处理,会使本来可能有显著差异变成无显著差异。
7. 如何区分点二列相关与二列相关?
【答案】(1)点二列相关法(point-biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个为“二分”称名变量(二分型数据)之间相关程度的统计方法。
二列相关法(biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个也是连续变量不过被按照某种标准人为的划分的二分变量之间相关程度的统计方法。
(2)点二列相关与二列相关的区别
二列相关不太常用,但有些数据只适用于这种方法。在测验中,二列相关常用于对项目区分度指标的确定。有时,某一题目实际获得的测验分数是连续性测量数据,这些分数的分布为正态,当人为地根据一定标准将其得分划分为对与错、通过与不通过两个类别时,计算该题目的区分度就要使用二列相关。如果题目的类型属于错与对这样的是非类客观选择题,计算该题目的区分度就应该选用点二列相关。二者之间的主要区别是二分变量是否为正态分布。总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这时,不管观测数据代表的是一个真正的二分变量,还是一个基于正态分布的人为二分变量,这时就用点二列相关。当确认数据分布形态为正态分布时,都应选用二列相关。只要有任何疑问,选用点二列相关总是较好的选择。在实际的研究当中,二列相关很少使用。
8. 何谓次数、频率及概率?
【答案】(1)次数是指某一事件在某一类别中出现的数目,又称为频数(frequency ),用f 表示。
(2)频率,又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通常用比例(proportion )或百分数(percent )表示。
(3)概率又称机率、或然率(probability ),用符号P 表示,指某一事件在无限的观测中