当前位置:问答库>考研试题

2017年黑龙江大学数学科学学院432统计学[专业硕士]考研强化模拟题

  摘要

一、简答题

1. 在研宄方法上,参数估计与假设检验有什么相同点和不同点?

【答案】(1)参数估计和假设检验的相同点

①是根据样本信息推断总体参数;

②都以抽样分布为理论依据,建立在概率论基础之上的推断,推断结果都有风险;

③对同一问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。

(2)参数估计和假设检验的不同点

①参数估计是以样本资料估计总体参数的可能范围,假设检验是以样本资料检验对总体参数的先验假设是否成立;

②区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;

③区间估计立足于大概率,通常以较大的把握程度(可信度)

成立。

2. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

,是利用数据中的五个统计量:最【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot )

小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面

叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

3. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

第 2 页,共 50 页 去估计总体参数的置信区间;假设检验立足于小概率,

通常是给定很小的显著性水平去检验对总体参数的先验假设是否

4. 简述概率抽样与非概率抽样的区别。

【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。

(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

5. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立) (其中是行变量,是列变量)

选取统计量:

(其中,

第i 行第j 列类别的期望频数;并且

为列联表中第i 行第j 列类别的实际频数;

第 3 页,共 50 页 为列联表中

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

6. 简述假设检验的过程。

【答案】假设检验的过程如下:

(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定

值,以值与显著性水平比较,若则拒绝接受若则不拒绝

7. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间

【答案】记赢钱数为

则的函数定义为:

则有

于是X 的概率分布为:

以及随机变量X 的定义和概率分布。 其中 为投掷后出现的两种结果,令

8. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?

【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。

不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。

(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。

第 4 页,共 50 页