当前位置:问答库>考研试题

2017年首都医科大学脑重大疾病研究院620心理学专业基础综合之现代心理与教育统计学考研仿真模拟题

  摘要

一、概念题

1. 逐步回归

【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。

2. 嵌套设计

【答案】嵌套设计又称阶层设计,是指下一层不同因素水平,只在其上一层因素某一水平下出现,而在另一水平下不出现的设计。例如,B 因素的一些水平只在A 因素的

B 因素的另一些水平,只在水平下出现,而水平下出现。出现在次一级层次因素上各水平数不同的原因是由实际研宄的问题决定的,根据因素分层的多少有不同的嵌套类型。如一级嵌套、二级嵌套、三级嵌套等。一般情况下,可有完全随机取样和重复测量等不同形式。

3. 参数

【答案】参数(parameter )在数理统汁中,反映一个统计量或随机变量的分布特征的参变量。对于参数统计来讲,分布依赖的参数是有限个数(其实只确很少几个)。只要参数确定,则分布也确定了。参数可在一定允许范围内取值。它便确定了一个分布族。如正态分布两个参数。它们的取值允许范围是

参数不是有限的,其统计方法只能是非参数方法或自由分布方法。

4. 分层随机抽样

【答案】分层随机抽样是抽样方式的一种。按照总体已有的某些特征,将总体分成几个不同

,再分别在每部分中随机抽样,这种抽样的方法称为分层随机抽样。总原则是:各层的部分(层)

内的变异要小,层与层间的变异越大越好。分层抽样充分利用了总体己知的信息,其样本代表性及推论的精确性一般优于简单随机抽样。对于同一总体,n 相同时,分层抽样误差小于简单随机抽样误差。

5. 频率

【答案】频率(frequency )①亦称“相对频数”。某随机事件A , 在N 次试验中出现的次数n

第 2 页,共 33 页 只含有

。对于非参数统计来讲,分布依赖的

与试验总次数N 的比值。亦称事件A 发生的频率。记为其值介于0〜1之间。事件的频率越大,说明它出现的可能性越大;反之则越小。一个事件的频率不是一个固定的数值,与总次数N 有关,且即使再重复N 次试验,次数n 也可能不同。但在大量重复试验中频率具有稳定性,即当试验次数N 无限增大时,频率F 会在某个固定值上下波动,而且偏差越来越小。②简谐振动基本物理量。物体每秒振动的次数。单位是赫兹(Hz )。在数学关系上频率是物体振动周期的倒数。

6. 非参数检验

【答案】非参数检验指对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验。常见的非参数检验有符号检验、秩和检验、中数检验等。其优点:(1)不需要对被检验的总体作出关于正态性或其他特定分布的假定;(2)容易理解、容易操作、应用范围广。缺点是功效较低,因为它常会丢失数据中的信息。经常属于大样本检验。

二、简答题

7. 一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?为什么?举例说明。

【答案】不能说明两水平的均数间没有差异。

(1)相关关系是指两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定两类现象之间哪个是因,哪个是果。相关的情况可以有三种:一种是两列变量变动方向相同,即一种变量变动时,另一种变量也同时发生或大或小与前一种变量同方向的变动,称为正相关。如身高与体重的关系。第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小但与前一列变量指向相反的变动。例如初打字时练习次数越多,出现错误的量就越少。第三种相关是零相关,即两列变量之间无关系。比如学习成绩与身高的关系。

(2)当一个变量的两个水平的相关很高时,需要考虑这种相关是正相关还是负相关,即考虑其变化发展的方向。

(3)当一个自变量的两个水平的相关很高时,不能说明两个水平的均数之间没有差异。因为两组变量的相关系数大小只是表明两组的线性关系强弱。即使两组变量成完全正相关,即相关系数为+1,也不能说明两组变量的平均数没有差异。比如两组变量的对应关系

为即这时两组变量的相关系数为+1,而两组变量的均数不不

同的。因为这是在同一个变量的不同水平,而且缺乏足够的信息分析。如果要知道这两个水平均数之间是否有差异,可以采用t 检验等方法获得。

8. 应用算术平均数表示集中趋势要注意什么问题?

【答案】在应用算术平均数表示几种趋势时,要注意:①算术平均数易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。如果不处理好这两个问题,那么算术平均数将无法表示集中趋势。

第 3 页,共 33 页

9. 各种差异量数各有什么特点?

【答案】(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。缺点是较难理解,运算较繁琐,易受极端值的影响。

(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。因此,方差是推论统计中最常用的统计量数。

(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。

(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。

(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。

(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。当组距不确定,其他差异量数都无法计算时,可以计算四分位差。但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。

通过比较,可以发现标准差、方差价值较大,它们的应用也比较广泛,因此,一般称标准差、方差为高效差异量。相比较而言,其他差异量数,如全距、平均差、百分位差和四分位差等缺点比较明显,应用也受到限制,故称他们为低效差异量数。

10.选择统计检验程序的方法时要考虑哪些条件,才能正确应用统计检验方法分析问题。

【答案】选择统计检验程序的方法时需考虑以下条件:

(1)看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。

(2)在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用Z 检验;如果总体方差未知,根据样本方差,采取不同的t 检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取

检验。

(3)根据题目考虑用单侧还是双侧检验。

(4)在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。

11.下述一些数据,哪些是测量数据? 哪些是计数数据? 其数值意味什么?

(1)17.0千克 (2)89.85厘米 (3)199.2秒 (4)17人 (5)25本 (6)93.5分

【答案】上面的数据中测量数据有:(1)17.0千克(2)89.85厘米(3)199.2秒(6)93.5

第 4 页,共 33 页 检验;如果总体方差未知,

根据独立和相关采取不同的