2017年武汉大学统计学复试实战预测五套卷
● 摘要
一、简答题
1. 简述统计分组的原则。
【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。
2. 简述平稳序列和非平稳序列的含义。
【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。
(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
3. 简述假设检验的过程。
【答案】假设检验的过程如下: (1)根据所研宄问题的要求提出原假设
(或称为零假设、无效假设)和备择假设
确
定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以
值与显著性水平比较,若
则拒绝
接受
其中
问:
(1)该模型是否违背古典线性回归模型的假定,请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。
【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等
第 2 页,共 41 页
若则不拒绝
4. 若有线性回归模型
方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为量有关。
与自变
(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权
数
以调整各项在平方和中的作用。即寻找参数
的估计值
使得离差平方和
达到最小。这样,就消除了异方差性的影响。
5. 二项分布与超几何分布的适用场合有什么不同?它们的均值和方差有什么区别?
【答案】(1)从理论上讲,二项分布只适合于重复抽样(即从总体中抽出一个个体观察完后放回总体,然后再抽下一个个体)。但在实际抽样中,很少采用重复抽样。不过,当总体的元素数目况很大而样本量, 相对于AT 来说很小时,二项分布仍然适用。
但如果是采用不重复抽样,各次试验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本量 «相对于W 来说较大时,二项分布就不再适用,这时,样本中“成功”的次数则服从超几何概率分布。
(2)若X 服从二项分布若Y 服从超几何分布
6. 简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为
其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
好;反之
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是
则
越接近于7,表明回归平方和占总平方和的比例越大,回则则
归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越
越接近于0, 回归直线的拟合程度就越差。
二、计算题
7. 某水果商店1999年的销售数据如表1所示。
表1
第 3 页,共 41 页
2000年芦柑的销售量为850千克,平均销售价格为每千克2.6元;香蕉的销售量为980千克,平均销售价格为每千克5.6元;苹果的销售量为1800千克,销售价格的统计数据如表2所示。
表
2
根据上面的有关统计数据,计算三种水果的总销售额2000年1999年相比增长的百分比及増加的绝对值,并分析销售量和价格变动对销售额的影响。
【答案】由表中数据可得的平均销售价格为:
则2000年苹果
三种水果销售额的变动:
2000年与1999年相比,三种水果的总销售额増长了7.76%,増加的绝对值为:
其中:
(1)销售量变动的影响
销售量上升使销售额增加的绝对值为:
第 4 页,共 41 页
相关内容
相关标签