2018年西安交通大学数学与统计学院432统计学[专业硕士]考研仿真模拟五套题
● 摘要
一、简答题
1. 说明计算统计量的步骤。
【答案】计算统计量的步骤:
(1)用观察值减去期望值(2)将(3)将平方结果
之差平方;
除以
(4)将步骤(3)的结果加总,即得:
2. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?
【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模
型对样本观测值的拟合优度。这是由于多重判定系数
随着样本解释变量个数的增加来越高(即
的值越
是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新
不是一个合适的指标,需加以
的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,调整。而修正判定系数归模型方面要优于多重判定系数
修正判定系数
的计算公式为
3. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的
即
去修正重复抽样时样本均值
其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回
在不重复抽样条件下,
样本均值的方差则需要用修正系数的方差,即
对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数对于有限总体,
当N 很大而n 很小时,其修正系数
来计算。
趋向于1;
也趋向于1,
这时样本均值的方差也可以按公式
4. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当然相当好,此时随机变量X 的分布是相对于其平均值
时,二项分布的正态近似仍
和
都
对称的。当p 趋于0或1时,二项分
布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使
大于或等于5时,近似的效果就相当好。
5. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。
【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。
此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用值。
检验,检验方程是否存在一阶自相关问题,或采用
或仍用
检验高阶自相关问题。如果存在自
相关,可以采用可行广义最小二乘法
法,但使用方差-协方差矩阵的稳健估计
二、计算题
6. 某中学为了考察学习效果,对本年级3个班的部分同学学习成绩进行抽样,见表, 学校想知道这几个班同学的成绩有无显著差异,请予以分析。(a=0.05)
表
【答案】(1)设三个班同学的平均成绩分别为提出假设:
三个班的成绩无显著性差异
不全相等三个班的成绩有显著性差异
(2)构造检验统计量 由已知数据可得,
检验统计量(3)统计决策
则
显著性差异。
所以拒绝原假设,表明这三个班同学的成绩有