2017年厦门大学王亚南经济研究院432统计学[专业硕士]之统计学考研题库
● 摘要
一、简答题
1. 何谓统计分组?统计分组有哪些作用?
【答案】根据统计研宄的目的和客观现象的内在特点,按某个标志(或几个标志)把被研宄的总体划分为若干个不同性质的组,称为统计分组。
统计分组的作用有:(1)发现社会经济现象的特点与规律;(2)将复杂的社会经济现象划分为性质不同的各种类型;(3)反映总体内部结构;(4)揭示现象之间的依存关系。
2. 利用增长率分析时间序列时应注意哪些问题?
【答案】在应用増长率分析实际问题时,应注意以下几点:
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;
(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。
3. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
4. 全概率公式与逆概率公式分别用于什么场合?
【答案】(1)全概率公式为:
其中
,
是互不相容的事件且
如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些事件下A 的条件概率较易于确定,就可以用全概率公式。
(2)逆概率公式也称贝叶斯公式,即
式中:表示完备事件组。
中每个事件的逆概率公式是要在事件A 已经发生的条件下来计算完备事件组
发生概率。
5. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤:
(1)确定时间序列所包含的成分,也就是确定时间序列的类型;
(2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案;
(4)利用最佳预测方案进行预测。
6. 统计分组标志选择的原则。
【答案】在进行统计分组标志选择时要遵循三个原则:
(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。
(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本 质的标志进行分组。
(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经 济条件下,选择的分组标志也不一样,要根据情况的变化而变化。
7. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当
然相当好,此时随机变量X 的分布是相对于其平均值
时,二项分布的正态近似仍和都对称的。当p 趋于0或1时,二项分布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使
大于或等于5时,近似的效果就相当好。
8. 简述相关系数和函数关系的差别。
【答案】变量之间的关系可分为两种类型:函数关系和相关关系。
(1)函数关系 设有两个变量
和(2)相关关系
相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。
变量随变量一起变化,并完全依赖于当变量取某个数值时,依确定的关系取相应的值,则称是的函数。由此可见函数关系是一种一一对应的确定性关系。
二、计算题
9. 假设我国年平均人口的増长速度为0.6%, GDP 增长率为7%。
(1)计算我国GDP 翻两番所需的时间。
(2)计算我国人均GDP 翻两番所需的时间。
【答案】(1)设所需的时间是两番所需时间是20.5年。
(2)我国人均GDP 增长率
设人均GDP 翻两番所需时间是《年,由题意可知 解得即我则由题意得解得即我国GDP 翻国人均GDP 翻两番所需时间是22.5年。
10.为检验A 、B 两种烟草的尼古丁含量是否相同,从这两种烟草中各自随机抽取重量相同的5例进行化验,测得尼古丁含量(单位:毫克)为:
烟草 A : 24,27, 26,21,24
烟草 B : 27,28,23,31,26
据经验知,尼古丁含量服从正态分布,且烟草A 的方差为5, B 的方差为8, 在显著性水平之下,问两种烟草尼古丁含量是否有差异?
【答案】建立假设:
已知
由于两个总体服从正态分布,并且方差已知,应选用z 作为检验统计量。则检验统计量的值为:
当时
,烟草尼古丁含量没有显著差异。
因为故不能拒绝原假设,即认为两种