当前位置:问答库>考研试题

2018年厦门大学统计系432统计学[专业硕士]考研核心题库

  摘要

一、简答题

1. “假设检验的基本思路是:概率性质的反证法,主要依据的是:小概率事件原理”。你同意这种说法吗?简要叙述你对假设检验的理解和检验步骤。

【答案】同意。

假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。例如,在10000件的产品中,如果只有1件是次品,那么可以得知,在一次试验中随机抽取1件次品的概率就为此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中任意抽取1件,恰好是次品,我们就可以断定,该次品率应该不是很小的,否则我们就不会那么轻易的就能抽到次品。从而,我们就有足够的理由否认产品的次品率是很低的假设。

假设检验的基本步骤为:第一,对所考察总体的分布形式或总体的某些未知参数做出某些假设,称之为原假设。第二,根据检验对象构造合适的检验统计量,并通过数理统计分析确定在原假设成立的条件下该检验统计量的抽样分布。第三,在给定的显著性水平下,根据抽样分布得出原假设成立时的临界值,由临界值构造拒绝域和接受域。第四,由所抽取的样本资料计算样本统计量的取值,并将其与临界值进行比较,从而对所提出的原假设做出接受还是拒绝的统计判断。

假设检验就是利用样本中所蕴含的信息对事先假设的总体情况做出推断。假设检验不是毫无根据的,而是在一定的统计概率下支持这种判断。

2. 简述假设检验的过程。

【答案】假设检验的过程如下:

(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定

值,以值与显著性水平比较,若则拒绝接受

若则不拒绝

3. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。

【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。

设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知参数的真值,这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量,即在均方误差

是的一个无偏估计量,都有

则称是的一致最小方差无偏估计。

4. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。

(2)请说明如何对这100例身高数据进行描述性统计分析。

【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。

样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。

参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

5. 何谓统计分组?统计分组有哪些作用?

【答案】根据统计研宄的目的和客观现象的内在特点,按某个标志(或几个标志)把被研宄

最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量

的总体划分为若干个不同性质的组,称为统计分组。

统计分组的作用有:(1)发现社会经济现象的特点与规律;(2)将复杂的社会经济现象划分为性质不同的各种类型;(3)反映总体内部结构;(4)揭示现象之间的依存关系。

6. 请给出你所知道的概率抽样的组织方式。

【答案】概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。调查的实践中经常采用的概率抽样方式有以下几种:

(1)简单随机抽样。简单随机抽样指从包括总体N 个单位的抽样框中随机地、一个一个地抽取n 个单位作为样本,每个单位入样的概率是相等的;

(2)分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、 随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;

(3)整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查;

(4)系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;

(5)多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

7. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤

按照假设检验的步骤: