2017年河海大学理学院432统计学[专业硕士]考研冲刺密押题
● 摘要
一、简答题
1. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?
【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行的检验,如果
次不同
每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概
率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。
2. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。
【答案】(1)多元回归模型:设因变量为如何依赖于自变量
式中
(2)多元回归方程:
根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量
(3)估计的多元回归方程:
回归方程中的参数数据去估计它们。当用样本统计
量
时,就得到了估计的
多元回归方程,其一般形式为:
式中
是参数
称为偏回归系数。
的估计值
是因变量y 的估计值。其中
之间的关系。
是未知的,需要利用样本
去估计回归方程中的未知参
数
个自变量分别为
是模型的参数
描述因变量y
为误差项。
称为多元回归
和误差项的方程称为多元回归模型。其一般形式可表示为
:
3. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?
【答案】不是。
显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。 当两个事件相互独立时,当两个事件不相互独立时,
⑴
⑵
记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左 撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。
4. 简述描述离散程度的统计量和适用类型。
【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。
(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:
极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。
(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理答。
(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号, 然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。
5. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且
的值不会由于模型中自变量个数的增加而越来越接近1,其计算公式为
6. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤: (1)确定时间序列所包含的成分,也就是确定时间序列的类型; (2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案; (4)利用最佳预测方案进行预测。
7. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。
【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为
所选择的估计量为
如果
则称为的无偏估计量。对于待估参数,
不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知参数的真值,这就是无偏性的要求。
②最小方差无偏估计
是在无偏估计类中使均方误差达到最小的估计量,即在均方误差
是的一个无偏估计量,
都有
则称是的一致最小方差无偏估计。
8. 构造下列维数的列联表,并给出
检验的自由度。
最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量
a.2行5列 b.4行6列 c.3行4列 【答案】i 行j 列联表,如表所示。
而a. 当b.
当c.
当
,所以 检验的自由度=(行数_1)(列数一 1)
时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其
检验的自由度=检验的自由度=检验的自由度=