2018年东南大学学习科学中心947神经信息工程基础之现代心理与教育统计学考研核心题库
● 摘要
一、概念题
1. 四分差
【答案】四分差又称四分位差,是差异量数的一种。计算公式:
位数,第三个四分第一个四分位数。在次数分配上第一个四分位数与第三个四分位数之间包含着全体项数的一半。次数分配越集中,离中趋势越小,则这二者的距离也越小。根据这两个四分位数的关系,观测次数分配的离散程度也可以得到相当高的准确性。因此,四分差可以说明某系列数据中间部分的离散程度,并可避免两极端值的影响。四分差通常与中数联系起来共同应用,不适合进一步代数运算,反应不够灵敏。
2. 嵌套设计
【答案】嵌套设计又称阶层设计,是指下一层不同因素水平,只在其上一层因素某一水平下出现,而在另一水平下不出现的设计。例如,B 因素的一些水平只在A 因素的
B 因素的另一些水平,只在水平下出现,而水平下出现。出现在次一级层次因素上各水平数不同的原因是由实际研宄的问题决定的,根据因素分层的多少有不同的嵌套类型。如一级嵌套、二级嵌套、三级嵌套等。一般情况下,可有完全随机取样和重复测量等不同形式。
3. 样本
【答案】样本(sample )亦称“子样”,统计学术语,指按一定规则从统计总体中抽取的若干个体的集合或对总体X 的n 次观测结果
独立样本。
4. 逐步回归
【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。
第 2 页,共 34 页 根据样本容量(通常以30为界线)的大小,可区分为大样本和小样本。根据两样本来自的两总体是相关还是独立,可分为相关样本和
二、简答题
5. 面对同一批数据,非参数方法和参数方法都适用,请问你会选择哪种方法?为什么?
【答案】如果同一批数据,非参数方法和参数方法都适用,则会选择参数检验方法。这是因为:
(1)非参数统计检验的模型对抽出研究样本的总体的参数不规定条件。大多数非参数检验都包含一定的假设,其观测是独立的,所研究的变量具有基础的连续性。不过这些假设比起参数检验的假设来说要少得多。而且,非参数检验并不要求如参数检验所要求的那么高的测量,大多数非参数检验是用于顺序量表的数据,也有一些用于名称量表的数据。
(2)如果参数统计模型的所有假设在数据中事实上都能满足,而且测量达到了所要求的水平,那么用非参数统计检验就浪费了数据。浪费的程度用非参数检验的功效功率来表示比如,若一种非参数统计检验的功效效率为90%,这就意味着,当参数检验的所有条件都满足时,其样本容量比非参数方法小10%的适当的参数检验就正好与该非参数分析一样有效。
(3)还没有一种非参数统计方法能用来检验方差分析模型中的交互作用。
对于符合参数检验的资料,非参数检验的检验效能很低。所以某些资料既可以用参数方法也可以用非参数方法时,应使用参数方法。
6. 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?
【答案】可以应用于差异系数和标准分数中。
7. 应用算术平均数表示集中趋势要注意什么问题?
【答案】在应用算术平均数表示几种趋势时,要注意:①算术平均数易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。如果不处理好这两个问题,那么算术平均数将无法表示集中趋势。
8. 简述算术平均数的使用特点
【答案】算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。计算公式:式中N 为数据个数,为每一个数据,为相加求和。
(1)算术平均数的优点是:①反应灵敏;②严密确定。简明易懂,计算方便;③适合代数运算;④受抽样变动的影响较小。
(2)除此之外,算数平均数还有几个特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数。②用加权法可以求出几个平均数的总平均数。③用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
(3)算术平均数的缺点:①易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
第 3 页,共 34 页
三、计算题
9. 试以方差的区间估计为例说明区间估计的原理。
【答案】区间估计的原理是样本分布理论。在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误(SE )。也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,并对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。
自正态分布的总体中,随机抽取容量为n 的样本,其样本方差与总体方差比值的分布为;分布。 根据分布,可以说:有1-的概率落在之间。
10.已知r=0.79, n=10,问其总体的相关如何,能否说比零大?
【答案】假设其总体相关系数为
取
查t 表,
代入数据,得
用t 分布计算的0.95置信区间不包含0在内。说明该样本的总体相关系数不为零,因此解题时的假设,以及所用的标准误、所依据的t 分布都不恰当,从而用此方法所求的置信区间也是不恰当的。正确的方法应该用Z 函数方法。 查转换表,r=0.79时
取
0.95置信区间为:
代入数据,得
查
查转换表得r 为
0.32 转换表得r 为0.95
第 4 页,共 34 页 根据公式, 则0.95的置信区间为:
因此根据公式
相关内容
相关标签