当前位置:问答库>考研试题

2018年西安交通大学数学与统计学院432统计学[专业硕士]考研仿真模拟五套题

  摘要

一、简答题

1. 说明计算统计量的步骤。

【答案】计算统计量的步骤:

(1)用观察值减去期望值(2)将(3)将平方结果

之差平方;

除以

(4)将步骤(3)的结果加总,即得:

2. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加来越高(即

的值越

是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新

不是一个合适的指标,需加以

的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,调整。而修正判定系数归模型方面要优于多重判定系数

修正判定系数

的计算公式为

3. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?

【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的

去修正重复抽样时样本均值

其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回

在不重复抽样条件下,

样本均值的方差则需要用修正系数的方差,即

对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数对于有限总体,

当N 很大而n 很小时,其修正系数

来计算。

趋向于1;

也趋向于1,

这时样本均值的方差也可以按公式

4. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?

【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当然相当好,此时随机变量X 的分布是相对于其平均值

时,二项分布的正态近似仍

对称的。当p 趋于0或1时,二项分

布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使

大于或等于5时,近似的效果就相当好。

5. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用值。

检验,检验方程是否存在一阶自相关问题,或采用

或仍用

检验高阶自相关问题。如果存在自

相关,可以采用可行广义最小二乘法

法,但使用方差-协方差矩阵的稳健估计

二、计算题

6. 某中学为了考察学习效果,对本年级3个班的部分同学学习成绩进行抽样,见表, 学校想知道这几个班同学的成绩有无显著差异,请予以分析。(a=0.05)

【答案】(1)设三个班同学的平均成绩分别为提出假设:

三个班的成绩无显著性差异

不全相等三个班的成绩有显著性差异

(2)构造检验统计量 由已知数据可得,

检验统计量(3)统计决策

显著性差异。

所以拒绝原假设,表明这三个班同学的成绩有