2018年第二军医大学心理与精神卫生学系312心理学专业基础综合之现代心理与教育统计学考研核心题库
● 摘要
一、概念题
1. 逐步回归
【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。
2. 概率
【答案】概率(probability ),概率论术语指,随机事件发生可能性大小度量指标。①概率描述性定义。随机事件A 在所有试验中发生可能性大小的量值,称为事件A 的概率,记为P (A )。如将一枚均匀硬币上抛足够多次,会发现“正面朝上”的事件出现的频率在0.5上下波动。这种频率稳定性从实践上表明随机事件的概率是客观存在的。②概率的精确定义。设P 是定义在“事件域”上的一个集合函数,若满足下列条件,则称之为概率:
a.P
两互不相容对一
切,则
(性质(ⅲ)称为完全可加性)。若P 是概率,则不可能事件的概率为零,即对任意事件有应当注意,若P (A )=0, 并不能说A —定是不可能事件,即不可能事件的概率一定是零,但概率为零的事件未必是不可能事件。这是由于P 是集合函数,可能在某些点集上(如有限个点)为零。同理,概率为1的事件,未必是必然事件。
3. 抽样误差
【答案】抽样误差指由抽样而造成的样本参数与总体参数之间差异或各样本参数之间差异。比如:样本平均数与总体平均数之间差异或各样本平均数之间差异。在抽样研究中,抽样误差是不可避免的,但可以估计其大小。
4. 标准误差
【答案】标准误差指描述样本均值对总体期望值的离散程度的统计量。指样本平均数与总体平均数之间的误差,即随机抽样误差分布的标准差。样本平均数的标准误差与总体标准差成正比,
与样本的容量的平方根成反比。公式为:式中为总体标准差,N 为样本的大小。标准误差是具体描述样本平均数的抽样误差的。标准误误愈大,抽样误差愈大,则样本平均数越不可靠;反之,标准误差越小,表明样本误差愈小,样本平均数越可靠。
二、简答题
5. 最小二乘法中各点到拟合直线的距离为什么要取铅直距离而不取垂直距离?
【答案】这是有最小二乘法的推导过程所决定的。 设
们也可以
把这组数据看作是一个离散的函数。根据观察,如果这组数据图像“很像”一条直线(不是直线),
我们的问题是确定一条直线
该是
程:
6. 什么是二元线性标准回归方程?
【答案】二元线性回归方程是指y
对用公式表示
对与
位,所引起y 改变
个单位。
当两个自变量的单位不同,不能直接比较它们在估计y 时的贡献。若要进行这种比较,需要将原始数据分别转换成标准分数,以标准分数建立的回归方程就叫做标准回归方程。一般的形式为:标准分数的估计值,
7. 判断某个变量X 的样本是否符合卡方分布的方法是什么?
【答案】判断某个变量X 的样本是否符合卡方分布可以根据卡方分布适用的条件来考虑。 卡方运用于非参数检验。适用于样本是频数分布的情况。其数据是属于点计而来的间断变量;总体分布未知;不是对总体参数的检验,而是对总体分布的假设检验。计数资料的统计检验主要用卡方检验,可以用来同时检验一个因素两项或多项分类的实际观测数据,与某理论次数分布是否相一致的问题,或有无显著差异的问题;还可用于检验两个或两个以上因素各有多项分类之间,是否有关联或是否具有独立性的问题。
卡方检验用于计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定
是直角平面坐标系下给出的一组数据,若我,使得它能“最好”的反映出这组数据的变化。对个别观察值来说,它可能是正的,也可能是负的。为了不使它们相加彼此抵消,故“最好”应
最小,即这时误差的平方和最小,这时可以求得比较精确的回归方 由于是散点之间连线的最小距离,因此这个距离不是到拟合直线的垂直距离。 与的线性回归方程。 与的共同估计值,为常数项,与表示当固定不变时,是y 每变化一个单式中; K 为个单位;表示当的偏回归系数。在二元线性标准回归中,固定不变时,每变化一个单位时,所引起y 改变其中和表示因变量y 的标准分数的估计值。和分别表示以叫标准偏回归系数。
的意义上来讲,又是一种非参数检验的方法。
8. 对两个以上平均数两两之间的差异检验为什么不能两两之间进行t 检验?
【答案】同时比较的平均数越多,其中差异较大的一对所得t 值超过原定临界值的概率就越大,这时《错误的概率将明显增加,或者说本来达不到显著性水平的差异就很容易被说成是显著了,这时用f 检验就不适宜。比如要比较3个总体平均数之间的差异,如果用t 检验就需要比较3
次,假如每次比较的置信区间为95%, 那么3
次比较后检验的可靠性就降低为
三、计算题
9. 何谓样本平均数的分布。
【答案】样本平均数的分布指样本平均数抽样分布(sampling distribution of sample mean ), 是抽样分布的一种,是指从基本随机变量为正态分布的总体(又称母总体)中,采用有放回随机抽样方法,每次从这个总体中抽取大小为n 的一个样本,计算出它的平均数
放回总体去,再次取n 个个体,又可计算出一个
这样如此反复,可计算出无限多个
这无限多个平均数的分布为正态分布。
10.查正态表求:
(1)
(2)
(3)
(4)
(5)
(6)
(1)
(2)
(3)
(4)
(5)
(6)
以上的概率; 以下的概率; 之间的概率; 之间的概率? ,然后将这些个体再将n 个个体放回去,再抽取n 个个体……,这无限多个平均数所构成的分布。理论及试验都可证明,【答案】查Z 表可知Z=1.5时,p=0.43,