当前位置:问答库>考研试题

2017年首都医科大学620心理学专业基础综合之现代心理与教育统计学考研仿真模拟题

  摘要

一、概念题

1. 观测值

【答案】随机变量所取得的值,称为观测值。

2. 假设检验

【答案】在统计学中,通过样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称假设检验。假设检验是推论统计中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。检验的推理逻辑是一定概率保证下的反证法。一般包括四个步骤:(1)根据问题要求提出原假设 (2)寻找检验统计量,用于提取样本中的用于推断的信息,要求在Ho 成立的条件下,统计量的分布已知且不包含任何未知参数;(3)由统计量的分布,计算“概率值”或确定拒绝域与接受域;(4)由具体样本值计算统计量的观测值,对统计假设作出判断。若Ho 的内容涉及到总体参数,称为参数假设检验,否则为非参数检验。

3. 次数

【答案】次数是指某一事件在某一类别中出现的数目,又称为频数(frequency ), 用f 表示。

4. 随机变量

【答案】随机变量(random variable)是在样本空间的全部事件集上的一个实值函数。通常随机变量用大写字母x ,y , z 等表示,或者希腊字母,…等表示。分离散型随机变量和连续型随机变量两类。离散型随机变量是指所有可能的取值个数是有限的或至多可列的随机变量。如随机抽取任一学生观察其性别,其样本空间只有两个男性和女性样本点,

随机变量X 只取两个值:即当某学生

是男生时,x 取1; 当学生是女生时,x 取0。连续型随机变量是指可能在一个连续区间内或整个实数范围内取值的随机变量。如,在12岁的学生总体中,随机抽一个观测其身高y 。此随机试验的样本空间

机现象。

5. T 分数

T 分数指由正态分布上的标准分数转换而来的等距量表分数。T 分数以50为平均数,【答案】

以10为标准差。T 分数是Z 分数的变形,因为Z 分数有负值和小数,人们不习惯,

是大于0的实数集。随机变量y 可在一个连续区间内取值。随机变量的引进使概率论能使用精密的数学工具(如微积分、代数、实变函数、测度论等)来处理和分析随

所以采用这个公式处理。经过变换,所得的分数全是整数,50分为普通,50分以上越高越好,50分以下越低越差。T 分数的意义及其优点和标准分数相同,不同之处是消除了小数和分数。

6. 逐步回归

【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。

二、简答题

7. 估计总体平均数落入该区间的正确可能性概率为1-«,犯错误的可能性概率为«。1. 在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响,为什么?

【答案】(1)在进行差异的显著性检验时,首先需要考虑样本是否服从正态分布,如果服从正态分布,还需要考虑总体方差是否已知,然后看样本是否是独立样本。若将相关样本误作独立样本处理,则忽视了样本数据之间的一致性,导致错误地运用计算公式,差异的显著性也会受到误估,使本来可能有显著差异变成无显著差异。

(2)因为相关样本与独立样本不同,会运用不同的计算方法计算显著性。相关样本与独立样本是根据两个样本是否来自同一个总体来划分的。

①如果是独立样本,其和(或差)的方差等于各自方差的和,即

在进行差异的显著性检验中采用以下公式:

②相关样本之间存在着一一的对应关系。如果是相关样本前后两次结果则相互影响,而不独立。当两个变量之间相关系数为r 时,两变量差的方差为:

在进行差异的显著性检验中采用以下公式:

由计算公式可以看出,独立样本和相关样本在进行差异的显著行检验时,使用了不同计算公式,相关样本的标准误可能会比独立样本的标准误小,使得计算出的Z 值大,从而更容易达到显著性水平,所以如果将相关样本误作独立样本处理,会使本来可能有显著差异变成无显著差异。

8. 简述算术平均数的使用特点

【答案】算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。计算公式:式中N 为数据个数,为每一个数据,为相加求和。

(1)算术平均数的优点是:①反应灵敏;②严密确定。简明易懂,计算方便;③适合代数运算;④受抽样变动的影响较小。

(2)除此之外,算数平均数还有几个特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数。②用加权法可以求出几个平均数的总平均数。③用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

(3)算术平均数的缺点:①易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。

9. 一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?为什么?举例说明。

【答案】不能说明两水平的均数间没有差异。

(1)相关关系是指两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定两类现象之间哪个是因,哪个是果。相关的情况可以有三种:一种是两列变量变动方向相同,即一种变量变动时,另一种变量也同时发生或大或小与前一种变量同方向的变动,称为正相关。如身高与体重的关系。第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小但与前一列变量指向相反的变动。例如初打字时练习次数越多,出现错误的量就越少。第三种相关是零相关,即两列变量之间无关系。比如学习成绩与身高的关系。

(2)当一个变量的两个水平的相关很高时,需要考虑这种相关是正相关还是负相关,即考虑其变化发展的方向。

(3)当一个自变量的两个水平的相关很高时,不能说明两个水平的均数之间没有差异。因为两组变量的相关系数大小只是表明两组的线性关系强弱。即使两组变量成完全正相关,即相关系数为+1,也不能说明两组变量的平均数没有差异。比如两组变量的对应关系

为即这时两组变量的相关系数为+1,而两组变量的均数不不

同的。因为这是在同一个变量的不同水平,而且缺乏足够的信息分析。如果要知道这两个水平均数之间是否有差异,可以采用t 检验等方法获得。