2017年中国民航大学产业经济学专业(统计学、国际经济学)之统计学复试仿真模拟三套题
● 摘要
一、简答题
1. 中心极限定理。
【答案】设随机变量
令
则
也就是说,当n 趋于无穷大时,
2. 简述统计分组的原则。
【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。
3. 说明回归模型的假设以及当这些假设不成立时的应对方法。
【答案】(1)多元回归模型的基本假定有: ①自变量
③对于自变
量
④误差项是一个服从正态分布的随机变量,且相互独立,即
(2)若模型中存在多重共线性时,解决的方法有:
第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。
第 2 页,共 24 页 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方
差的分布趋向于标准正态分布 是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方
差都相同,且不序列相关,
即
的所有
值②误差项s 是一个期望值为0的随机变量,即
第二,如果要在模型中保留所有的自变量,那就应该:避免根据统计量对单个参数进行检验;对因变量Y 值的推断(估计或预测)限定在自变量样本值的范围内。
若模型中存在序列相关时,解决的方法有:如果误差项不是相互独立的,则说明回归模型存在序列相关性
,这时首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的自变量,则应増加自变量;如果以上两种方法都不能消除序列相关性,则需采用迭代法、差分法等方法处理。
若模型中存在异方差性时,解决的方法有:当存在异方差性时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。
4. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
5. 全概率公式与逆概率公式分别用于什么场合?
【答案】(1)全概率公式为:
其中
,
是互不相容的事件且式中为变量的标准化值,是该组数据均值,s 为该组数据的
如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些事件下A 的条件概率较易于确定,就可以用全概率公式。
(2)逆概率公式也称贝叶斯公式,即
式中:
发生概率。
第 3 页,共 24 页 表示完备事件组。 中每个事件的逆概率公式是要在事件A 已经发生的条件下来计算完备事件组
6. 给出在一元线性回归中:
(1)相关系数的定义和直观意义;
(2)判定系数的定义和直观意义;
(3)相关系数和判定系数的关系。
【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
称为样本相关系数,记为r 。样本
相关系数的计算公式为:
按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。
(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
判定系数测度了回归直线对观测数据的拟合程度。
的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变
差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。
(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。
二、计算题
7. 某银行分行1999年平均存款余额为1250万元,2003年的存款资料如表所示。
表
要求(1)计算该分行2003年的平均存款余额。
(2)计算该分行1999年至2003年存款余额的年平均增长速度。
(3)根据年平均增长速度推断2005的年平均存款余额。
(4)若该分行计划2007年的平均存款余额达到2000万元,那么从2003年到2007年存款余
第 4 页,共 24 页