2017年黑龙江大学数学科学学院432统计学[专业硕士]考研题库
● 摘要
一、简答题
1. 简述季节指数的计算步骤。
【答案】以移动平均趋势剔除法为例,计算季节指数的基本步骤为:
,(1)计算移动平均值(如果是季度数据采用4项移动平均,月份数据则采用12项移动平均)
并将其结果进行“中心化”处理,也就是将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”
(2)计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值。
(3)季节指数调整。由于各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。具体方法是:将第(2)步计算的每个季节比率的平均值除以它们的总平均值。
2. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
3. 统计分组标志选择的原则。
【答案】在进行统计分组标志选择时要遵循三个原则:
(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。
(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本 质的标志进行分组。
(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经 济条件下,选择的分组标志也不一样,要根据情况的变化而变化。
式中为变量的标准化值,是该组数据均值,s 为该组数据的
4. 中心极限定理。
【答案】设随机变量
令
则
也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方
差
5. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
6. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?
【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。
不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽
取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。
(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。
7. 简述概率抽样与非概率抽样的区别。
【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。
(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
8. 请给出你所知道的概率抽样的组织方式。
【答案】概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。调查的实践中经常采用的概率抽样方式有以下几种:
(1)简单随机抽样。简单随机抽样指从包括总体N 个单位的抽样框中随机地、一个一个地抽取n 个单位作为样本,每个单位入样的概率是相等的;
(2)分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、 随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;
(3)整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查;
(4)系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;
(5)多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。
相关内容
相关标签