当前位置:问答库>考研试题

2017年南京邮电大学理学院432统计学[专业硕士]考研冲刺密押题

  摘要

一、简答题

1. 简述假设检验的过程。

【答案】假设检验的过程如下:

(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若则拒绝

2. 解释总体分布、样本分布和抽样分布的含义。 接受

若则不拒绝

【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X 为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。

3. 简述概率抽样与非概率抽样的区别。

【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的

对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。

(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

4. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?

【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。

影响抽样平均误差的因素有四个:

(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。

(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。

(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。

(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

5. 利用增长率分析时间序列时应注意哪些问题?

【答案】在应用増长率分析实际问题时,应注意以下几点:

(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;

(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。

6. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

,是利用数据中的五个统计量:最【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot )

小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面

叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

7. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。

(2)请说明如何对这100例身高数据进行描述性统计分析。

【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄

的一些个体组成。 本例中的总体是广州市所有初中学生。

样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。

参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

8. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?

【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。

不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。

(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。

9. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、

“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变