当前位置:问答库>考研试题

2017年安徽财经大学应用统计432统计学[专业硕士]之统计学考研题库

  摘要

一、简答题

1. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。

【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即

(2)回归平方和(^狀)是各回归值

来解释的变差部分。

(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即

称为误差平方和。

(4)三者之间的关系

2. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?

【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为

由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性

犯取伪错误的可能性

一办法只有增大样本容量,这样既能保证满足取得较小的又能取得较小的值。

3. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?

【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行

的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概 势必增大

它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线也就是说,

的大小和显著性水平的大小成相反方向变化。解决的唯率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。

4. 若有线性回归模型

问:

第 2 页,共 48 页 其中

(1)该模型是否违背古典线性回归模型的假定,请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为

量有关。

(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权

数以调整各项在平方和中的作用。即寻找参数的估计值使得离差平方和

与自变

达到最小。这样,就消除了异方差性的影响。

5. 在研宄方法上,参数估计与假设检验有什么相同点和不同点?

【答案】(1)参数估计和假设检验的相同点

①是根据样本信息推断总体参数;

②都以抽样分布为理论依据,建立在概率论基础之上的推断,推断结果都有风险;

③对同一问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。

(2)参数估计和假设检验的不同点

①参数估计是以样本资料估计总体参数的可能范围,假设检验是以样本资料检验对总体参数的先验假设是否成立;

②区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;

③区间估计立足于大概率,通常以较大的把握程度(可信度)

成立。

6. 简述概率抽样与非概率抽样的区别。

【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。

(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

第 3 页,共 48 页 去估计总体参数的置信区间;假设检验立足于小概率,

通常是给定很小的显著性水平去检验对总体参数的先验假设是否

7. 简述时间序列的组成要素。

【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;

(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

8. 中心极限定理。

【答案】设随机变量

也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方

9. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线

第 4 页,共 48 页