当前位置:问答库>考研试题

2017年河北工程大学理学院432统计学[专业硕士]考研仿真模拟题

  摘要

一、简答题

1. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?

【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行的检验,如果

次不同

每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概

率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。

2. 回归分析结果的评价。

【答案】对回归分析结果的评价可以从以下四个方面入手: (1)所估计的回归系数的符号是否与理论或事先预期相一致; (2)如果理论上认为归方程也应该如此;

(3)用判定系数

来回答回归模型在多大程度上解释了因变量取值的差异;

(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。

3. 简述季节指数的计算步骤。

【答案】以移动平均趋势剔除法为例,计算季节指数的基本步骤为:

,(1)计算移动平均值(如果是季度数据采用4项移动平均,月份数据则采用12项移动平均)并将其结果进行“中心化”处理,也就是将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”

(2)计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值。

(3)季节指数调整。由于各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。具体方法是:将第(2)步计算的每个季节比率的平均值除以它们的总平均值。

之间的关系不仅是正的,而且是统计上显著的,那么所建立的回

4. 简述时间序列的组成要素。

【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

5. 下列调查问卷中的提问都有问题,请修改。

(1)您和您爱人是否对现有住房满意? (2)您最近一次是几点上班的?

(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗? 【答案】(1)您对现有住房满意吗?您爱人呢? (2)您最近一次的工作是几点上班? (3)您认为明光牛奶的口味纯正吗?

6. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。

【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。

从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果数取值;如果

即一般以

为显著

结果更倾向于接受假定的参数取值。

为非常显著,其含义是样本间的差异由抽样误差所致的概率

小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。样本间的差异比时更大,这种说法是错误的。

7. 说明计算统计量的步骤。

【答案】计算(2)将(3)将平方结果

统计量的步骤:

之差平方;

除以

(1)用观察值减去期望值

说明是较强的判定结果,拒绝假定的参

说明

说明是较弱的判定结果,拒绝假定的参数取值;如果

(4)将步骤(3)的结果加总,即得:

8. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?

【答案】相关系数r 的取值范围在关关系;若相关关系;若相关关系。

说明两个变量之间的线性关系越强时. 可视为中度相关

说明两个变量之间的线性关系越弱。对于一

时,

可视为高度相关时,说明两个变量之间的

个具体的r 取值,根据经验可将相关程度分为以下几种情况:

时。视为低度相关;当

之间。若

表明变量

之间存在正线性相

表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当

表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,

二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性

相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

9. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用

检验,检验方程是否存在一阶自相关问题,或采用

或仍用

检验高阶自相关问题。如果存在自

相关,可以采用可行广义最小二乘法

法,但使用方差-协方差矩阵的稳健估计

值。

10.简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述式为:

式中,

列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

联表,是因为对于列联表中的数据,计算出的系数可以控制在