当前位置:问答库>考研试题

2017年湖南大学金融与统计学院850统计学之统计学考研强化模拟题

  摘要

一、简答题

1. 利用增长率分析时间序列时应注意哪些问题?

【答案】在应用増长率分析实际问题时,应注意以下几点:

(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;

(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。

2. 试述统计总体及其特征。

【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。

总体具有的特征包括:(1)同质性,即总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是 构成总体的条件;(2)大量性,即构成总体的总体单位数目要足够多;(3)差异性,即总体单位必须具有一个或 若干个品质变异标志或数量变异标志。

3. 简述古典概率法和经验概率法如何定义事件发生的概率。

【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A 发生的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件数n 的比值,记为:

经验概率又称主观概率,是指对一些无法重复的试验,只能根据以往的经验,人为确定这个事件的概率。

4. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。

(2)请说明如何对这100例身高数据进行描述性统计分析。

【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。

样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量

(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。

参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

5. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?

【答案】不是。

显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。

当两个事件相互独立时,

当两个事件不相互独立时,⑴ ⑵

记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左

撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。

6. 简述假设检验的过程。

【答案】假设检验的过程如下:

(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若则拒绝接受若则不拒绝

7. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为如何依赖于自变量

式中(2)多元回归方程:

根据回归模型的假定有

个自变量分别为是模型的参数描述因变量y

为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为

方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数

数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

之间的关系。 是未知的,需要利用样本去估计回归方程中的未知参

式中

是参数称为偏回归系数。

8. 统计分组标志选择的原则。

【答案】在进行统计分组标志选择时要遵循三个原则:

(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。

(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本 质的标志进行分组。

(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经 济条件下,选择的分组标志也不一样,要根据情况的变化而变化。

9. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述

式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列的估计值是因变量y 的估计值。其中

联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,

果列联表中有一维为2,即

当两个变量完全相关时,所以V 的取值在之间。如则V 值就等于值。