2017年中国地质大学(武汉)经济管理学院958统计学原理之统计学考研强化模拟题
● 摘要
一、简答题
1. 简述非抽样误差类型。
【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:
(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。
(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。
(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。
(4)调查员误差,是指由于调查员的原因而产生的调查误差。
(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。
2. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?
【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。
3. 简述时间序列的构成要素。
【答案】时间序列的构成要素分为4种,即趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;
(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;
(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;
(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
4. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?
【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。
不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。
(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。
5. 在盒子图(箱线图)的作图中,会使用哪些描述指标。
,是利用数据中的五个统计量:最【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot )
小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面
叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。
6. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?
【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行
的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。
7. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当
然相当好,此时随机变量X 的分布是相对于其平均值
大于或等于5时,近似的效果就相当好。
时,二项分布的正态近似仍和都对称的。当p 趋于0或1时,二项分 只要当n 大到使布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说,
8. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。
【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。
此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用
或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计
值。
9. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?
【答案】在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数。
在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性。
10.简述复合型时间序列的预测步骤。
【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:
(1)确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;
(2)建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测;
(3)计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。
二、计算题
相关内容
相关标签