当前位置:问答库>考研试题

2017年内蒙古工业大学MBA教育中心822应用统计学考研强化模拟题

  摘要

一、简答题

1. 解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X 为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。

2. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

3. 中心极限定理。

【答案】设随机变量

第 2 页,共 53 页 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方

也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布

4. 解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为

(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1,

其计算公式为

5. 简述时间序列的构成要素。

【答案】时间序列的构成要素分为4种,即趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;

(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

6. 简述平稳序列和非平稳序列的含义。

【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。

(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

7. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】(1)众数、中位数和平均数的关系

从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:

①如果数据的分布是对称的,众数中位数第 3 页,共 53 页

和平均数必定相等,即

②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:

③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,

(2)众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。

8. 简述统计分组的原则。

【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。

9. 利用增长率分析时间序列时应注意哪些问题?

【答案】在应用増长率分析实际问题时,应注意以下几点:

(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;

(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。

10.统计分组标志选择的原则。

【答案】在进行统计分组标志选择时要遵循三个原则:

(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。

(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,

第 4 页,共 53 页