2017年沈阳师范大学心理统计学考研复试核心题库
● 摘要
一、概念题
1. 抽样分布
【答案】抽样分布又称取样分布指某种统计量的概率分布,它是根据样本的所有可能的样本观察值计算出来的某个统计量的观察值的分布。抽样分布指样本统计量的分布,它是统计推论的重要依据。在科学研宄中,一般是通过一个样本进行分析,只有知道了样本统计量的分布规律,才能依据样本对总体进行推论,也才能确定推论正确或错误的概率是多少。常用的样本分布有平均数及方差的分布。
2. 二列相关
【答案】二列相关是一种两列变量的质量相关。适用的资料是两列均属于正态分布,但其中一列变量是等距或等比的测量数据,另一列变量虽然也呈正态分布,但它被人为地划分为两类,例如:健康与不健康的划分。这种相关适用于对项目区分度指标的确定。
3. 协方差分析
【答案】协方差分析指回归分析与方差分析相结合的一种统计分析方法。是将难以直接控制的变量作为协变量影响的条件下,更准确地分析与评价因素对因变量的影响。它与方差分析的不同之处在于:方差分析的各因素水平可以根据需要和实际情况人为地加以控制,而在协方差分析中,某些因素的水平是不能控制或难以控制的。如在考察不同教学方法对学生学习成绩有无显著性影响的过程中,如果只考虑教学方法对学生学习成绩的作用,而不考虑学生的智力水平和学习基础这两个不能精确控制的因素对学生学习成绩的影响,将会影响判断的准确性。协方差分析可以消除这种不可控因素的影响,提高分析的精度。教学方法是可以人为控制的因素,称为方差因素,而学生的智力和学习基础是不能精确控制的因素,称为协变量。协方差分析的基本方法是先对每一水平下的实验结果进行回归分析,求出扣除协变量以后的残值,再将各水平试验下对应的残值进行方差分析。协方差分析适合于完全随机化设计资料、随机化区组设计资料、拉丁方资料等。
二、简答题
4. 各种差异量数各有什么特点?
【答案】(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。缺点是较难理解,运算较繁琐,易受极端值的影响。
(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对
总结果的影响。因此,方差是推论统计中最常用的统计量数。
(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。
(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。
(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。
(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。当组距不确定,其他差异量数都无法计算时,可以计算四分位差。但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。
通过比较,可以发现标准差、方差价值较大,它们的应用也比较广泛,因此,一般称标准差、方差为高效差异量。相比较而言,其他差异量数,如全距、平均差、百分位差和四分位差等缺点比较明显,应用也受到限制,故称他们为低效差异量数。
5. 如何区分点二列相关与二列相关?
【答案】(1)点二列相关法(point-biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个为“二分”称名变量(二分型数据)之间相关程度的统计方法。
二列相关法(biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个也是连续变量不过被按照某种标准人为的划分的二分变量之间相关程度的统计方法。
(2)点二列相关与二列相关的区别
二列相关不太常用,但有些数据只适用于这种方法。在测验中,二列相关常用于对项目区分度指标的确定。有时,某一题目实际获得的测验分数是连续性测量数据,这些分数的分布为正态,当人为地根据一定标准将其得分划分为对与错、通过与不通过两个类别时,计算该题目的区分度就要使用二列相关。如果题目的类型属于错与对这样的是非类客观选择题,计算该题目的区分度就应该选用点二列相关。二者之间的主要区别是二分变量是否为正态分布。总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这时,不管观测数据代表的是一个真正的二分变量,还是一个基于正态分布的人为二分变量,这时就用点二列相关。当确认数据分布形态为正态分布时,都应选用二列相关。只要有任何疑问,选用点二列相关总是较好的选择。在实际的研究当中,二列相关很少使用。
6. 应用标准分数求不同质的数据总和时应注意什么问题?
【答案】应用标准分数求不同质的数据总和时应注意这些不同质的观测值的次数分布应该是正态的。因为标准分是线形变化,不改变原分布的形态,只有原分布是正态时,转化后的标准分才是正态的。
7. 独立样本和相关样本之间的差别是什么?
【答案】相关样本是指两个样本的数据之间存在一一对应的关系。而独立样本是指两个样本数据相互独立,不存在一一对应关系。
在显著性检验中,相关样本的t 检验一般不需要事先进行方差齐性检验。因为相关样本是成对数据,即两组数据存在对应关系,这样可以求出对应数据的差,使对两组数据均值差的显著性检验转化为对d 的显著性检验。而独立样本的数据不是成对的,即使两组数据的样本数相同,两组数据也不存在一一对应关系,因而不可能有对应值的差d ,只能以两个样本方差共同对总体方差进行估计(即求联合方差),必须以两组数据的方差相等为前提。
统计分析中,在考虑是参数还是非参数检验后,需要考虑是独立样本还是相关样本。这样涉及选择不同的检验方法。
8. 统计量与参数之间有何区别和关系?
【答案】在科学研究中,探寻的是关于所有事物总体的说明和解释。总体的那些特性称为参数(parameter ), 又称总体参数,是描述一个总体情况的统计指标;样本的那些特征值叫做统计量(statistics ), 又称特征值。
参数和统计量的区别
(1)一个参数是从整个总体中计算得到的量数,通常是通过样本特征值来预测得到,统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况,参数代表总体的特性,它是一个常数;
(2)统计量代表样本的特性,它是一个变量,随着样本的变化而变化;
(3)参数和统计量之间最明显的区别是参数常用希腊字母表示,而样本统计量则用英文字母表示。
参数和统计量的关系
从数值计算上讲,当总体大小已知并与实验观察的总次数相同时,它们是同一统计指标。当总体无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数能够做出预测和估计。
9. 线性回归的基本假设是什么?
【答案】(1)线性关系假设
X 与Y 在总体上具有线性关系,这是一条最基本的假设。回归分析必须建立在变量之间具有线性关系的假设成立上。如果X 与Y 的真正关系不是线性,而回归方程又是按线性关系建立的,这个回归方程就没有什么意义了。非线性的变量关系,需使用非线性模型。
(2)正态性假设
正态性的假设系指回归分析中的Y 服从正态分布。这样,与某一个
量Y 的一个子总体,所有这样的子总体都服从正态分布,其平均数记作各个子总体的方差都相等。因此经由回归方程式所分离的误差项e ,即由特定值对应的Y 值构成变方差记作所预测得到的