当前位置:问答库>考研试题

2018年西安交通大学公共政策与管理学院718应用统计学之统计学考研基础五套测试题

  摘要

一、简答题

1. 二项分布与超几何分布的适用场合有什么不同?它们的均值和方差有什么区别?

【答案】(1)从理论上讲,二项分布只适合于重复抽样(即从总体中抽出一个个体观察完后放回总体,然后再抽下一个个体)。但在实际抽样中,很少采用重复抽样。不过,当总体的元素数目况很大而样本量, 相对于AT 来说很小时,二项分布仍然适用。

但如果是采用不重复抽样,各次试验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本量 «相对于W 来说较大时,二项分布就不再适用,这时,样本中“成功”的次数则服从超几何概率分布。

(2)若X 服从二项分布若Y 服从超几何分布

2. 说明计算

统计量的步骤。

统计量的步骤:

之差平方; 除以则则 【答案】计算(2)将(1)用观察值减去期望值(3)将平方结果(4)将步骤(3)的结果加总,即得:

3. 简述指数平滑法的基本含义。

【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第

形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。 期的预测值等于

期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊

使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生

不同的影响。当

大的权数;同样时,预测值仅仅是重复上一期的预测结果;

当时,预测值就是上一期实际

越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的

反应就越慢。一般而言,当时间序列有较大的随机波动时,

宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的但实际应用时,还应考虑预测误差,这里仍用误差均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值。

4. 试述统计总体及其特征。

【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。

总体具有的特征包括:(1)同质性,即总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是 构成总体的条件;(2)大量性,即构成总体的总体单位数目要足够多;(3)差异性,即总体单位必须具有一个或 若干个品质变异标志或数量变异标志。

5. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?

【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;

②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。

③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差

⑤当为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。越大,正态曲线 越扁平;越小,正态曲线越陡峭。 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。

⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。

(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求

方差为总体方差的

态分布。

),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正

二、计算题

6. 某灯泡厂对生产的10000只日光灯进行质量检验,随机抽取100只,测得灯管的平均发光时间为2000小时,发光时间的标准差为50小时。在的概率保证下,试估计这批灯管平均发光时间的范围。如果要求 最大允许误差不超过15小时,试问这批灯管的平均发光时间范围又是多少?其估计的概率保证程度又是多大?

【答案】(1)在的概率保证下,这批灯管平均发光时间的置信区间为:

即(1990,2010)小时。

(2)假如最大允许误差不超过15小时,

则这批灯管的平均发光时间范围是

小时。

所以估计的概率保证程度为

7. 随机抽取25个网络用户,得到他们的年龄数据如表1所示。

1 即

要求:(1)计算众数、中位数。(2)计算平均数和标准差。(3)计算偏态系数和峰态系数。(4)对网民年龄 的分布特征进行综合分析。

【答案】(1)对表中数据按从小到大顺序排列:

由排序数据可知,年龄出现频数最多的是19和23, 都出现3次,所以有两个众数,即

和. 由于中位数位置所以

(2)平均数

由平均数可得: