2017年厦门大学教育研究院641心理学专业基础综合之现代心理与教育统计学考研仿真模拟题
● 摘要
一、概念题
1. 相关系数
【答案】相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。绝对值接近1.00端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。
2. 逐步回归
【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。
3. 分层随机抽样
【答案】分层随机抽样是抽样方式的一种。按照总体已有的某些特征,将总体分成几个不同
,再分别在每部分中随机抽样,这种抽样的方法称为分层随机抽样。总原则是:各层的部分(层)
内的变异要小,层与层间的变异越大越好。分层抽样充分利用了总体己知的信息,其样本代表性及推论的精确性一般优于简单随机抽样。对于同一总体,n 相同时,分层抽样误差小于简单随机抽样误差。
4. 嵌套设计
【答案】嵌套设计又称阶层设计,是指下一层不同因素水平,只在其上一层因素某一水平下出现,而在另一水平下不出现的设计。例如,B 因素的一些水平只在A 因素的
B 因素的另一些水平,只在水平下出现,而水平下出现。出现在次一级层次因素上各水平数不同的原因是由实际研宄的问题决定的,根据因素分层的多少有不同的嵌套类型。如一级嵌套、二级嵌套、三级嵌套等。一般情况下,可有完全随机取样和重复测量等不同形式。
5. 检验的显著性水平
【答案】检验的显著性水平指在假设检验中,虚无假设正确时而拒绝虚无假设所犯错误的概
率。在假设检验中有可能会犯错误,如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率用a 表示,a 就是假设检验中的显著性水平。通常选择α=0.05作为检验的显著性水平。也就是说每当实验结果发生的概率小于或等于0.05的时候,就拒绝虚无假设。
6. 推论统计
【答案】推论统计又称推断统计,主要研宄如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。这是推论统计要研宄的内容,常用的统计方法有:假设检验
的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。
二、简答题
7. 简述非参数检验的意义和常用方法。
【答案】(1)非参数检验是针对那些总体分布不能用有限个实参数来刻画,而只能对其作一些诸如分布连续、有密度、具有某阶矩等一般性假定的统计问题。
非参数检验的意义在于非参数统计问题中对总体分布的假定要求的条件很宽,因而使得针对这种问题而构造的非参数统计方法,不致于因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性。但正是因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明:当一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,其效率上的损失也很小。
(2)非参数检验的常用方法有:
用来检验样本随机性的非参数检验:单样本游程检验;
与参数检验中独立样本的t 检验相对应的秩和检验法;
与参数检验中两独立样本平均数之差的t 检验相对应的中数检验法;
与参数检验中配对样本差异显著性t 检验相对应的符号检验法以及符号等级检验法;
与参数方法中的完全随机方差分析相对应的克-瓦氏单方向方差分析;
与参数方法中的随机区组方差分析相对应的弗里德曼双向等级方差分析。
8. 判断某个变量X 的样本是否符合卡方分布的方法是什么?
【答案】判断某个变量X 的样本是否符合卡方分布可以根据卡方分布适用的条件来考虑。 卡方运用于非参数检验。适用于样本是频数分布的情况。其数据是属于点计而来的间断变量;总体分布未知;不是对总体参数的检验,而是对总体分布的假设检验。计数资料的统计检验主要用卡方检验,可以用来同时检验一个因素两项或多项分类的实际观测数据,与某理论次数分布是否相一致的问题,或有无显著差异的问题;还可用于检验两个或两个以上因素各有多项分类之间,是否有关联或是否具有独立性的问题。
卡方检验用于计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,又是一种非参数检验的方法。
9. 试举例说明各种数据类型之间的区别。
【答案】根据不同的分类标准,心理与教育科学研究中的数据可以区分为不同的类型。 (1)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 ①计数数据(count data ), 是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。
②测量数据(measurement data ), 又称计量数据是指借助于一定的测量工具或一定的测量标准而获得的数据。
(2)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。
①称名数据(nominal data)只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,在教育和心理类调查研究中,有关被试属性的调查资料,大多属于这类数据。
②顺序数据(ordinal data )是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。这种数据不具有相等单位,也没有绝对零点,只能排出一个顺序,不能指出相互间的差别大小这类数据不能进行加减乘除运算。
③等距数据(interval data )是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。只能使用加减运算,不能使用乘除运算。
④比率数据(ratio data )既表明量的大小,也有相等的单位,同时还具有绝对零点,如身高、体重、反应时、各种感觉阈值的物理量等都属于这种数据类型。
(3)按照数据是否具有连续性,把数据划分为离散数据和连续数据。
①离散数据(discrete data)又称为不连续数据、间断数据。这类数据在任何两个数据点之间所取的数值的个数是有限的。
②连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。至少在理论上从最高到最低之间都可以进一步细分。
10.哪些测量和统计的原因会导致两个变量之间的相关程度被低估。
【答案】影响两个变量之间的相关程度被低估的原因有:
(1)测量原因:测量方法的选择、两个变量测验材料的选择和收集、测量工具的精确性、测量中出现的误差、测验中主试和被试效应、测量的信度和效度、测验分数的解释等。
(2)统计原因:全距限制,指相关系数的计算要求每个变量内各个分数之间必须有足够大的差异,数值之间必须有显著的分布跨度或变异性,所以全距限制问题会导致低相关现象;没有满足计算相关系数的前提假设也会低估相关系数,比如用皮尔逊相关计算非线形关系的两个变量间的相关系数。