当前位置:问答库>考研试题

2017年武汉大学统计学复试实战预测五套卷

  摘要

一、简答题

1. 简述统计分组的原则。

【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。

2. 简述平稳序列和非平稳序列的含义。

【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。

(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

3. 简述假设检验的过程。

【答案】假设检验的过程如下: (1)根据所研宄问题的要求提出原假设

(或称为零假设、无效假设)和备择假设

定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以

值与显著性水平比较,若

则拒绝

接受

其中

问:

(1)该模型是否违背古典线性回归模型的假定,请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。

【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等

第 2 页,共 41 页

若则不拒绝

4. 若有线性回归模型

方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为量有关。

与自变

(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权

以调整各项在平方和中的作用。即寻找参数

的估计值

使得离差平方和

达到最小。这样,就消除了异方差性的影响。

5. 二项分布与超几何分布的适用场合有什么不同?它们的均值和方差有什么区别?

【答案】(1)从理论上讲,二项分布只适合于重复抽样(即从总体中抽出一个个体观察完后放回总体,然后再抽下一个个体)。但在实际抽样中,很少采用重复抽样。不过,当总体的元素数目况很大而样本量, 相对于AT 来说很小时,二项分布仍然适用。

但如果是采用不重复抽样,各次试验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本量 «相对于W 来说较大时,二项分布就不再适用,这时,样本中“成功”的次数则服从超几何概率分布。

(2)若X 服从二项分布若Y 服从超几何分布

6. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

回归平方和占总平方和的比例称为判定系数,记为

其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

好;反之

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是

越接近于7,表明回归平方和占总平方和的比例越大,回则则

归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越

越接近于0, 回归直线的拟合程度就越差。

二、计算题

7. 某水果商店1999年的销售数据如表1所示。

表1

第 3 页,共 41 页

2000年芦柑的销售量为850千克,平均销售价格为每千克2.6元;香蕉的销售量为980千克,平均销售价格为每千克5.6元;苹果的销售量为1800千克,销售价格的统计数据如表2所示。

2

根据上面的有关统计数据,计算三种水果的总销售额2000年1999年相比增长的百分比及増加的绝对值,并分析销售量和价格变动对销售额的影响。

【答案】由表中数据可得的平均销售价格为:

则2000年苹果

三种水果销售额的变动:

2000年与1999年相比,三种水果的总销售额増长了7.76%,増加的绝对值为:

其中:

(1)销售量变动的影响

销售量上升使销售额增加的绝对值为:

第 4 页,共 41 页