当前位置:问答库>考研试题

2017年苏州大学应用统计综合考研复试核心题库

  摘要

一、简答题

1. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?

【答案】不是。

显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。

当两个事件相互独立时,

当两个事件不相互独立时

,⑴ ⑵

记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左

撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。

2. 简述标准化值的意义及计算公式。

【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:

标准差。

标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。

3. 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否己知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。

【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本情况。

(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为

为当总体方差已知时,总体均值的检验统计量为:

当总体方差

为: 未知时,可以用样本方差来近似代替总体方差,此时总体均值检验的统计量总体方差

!还是小样本此外还需要区分总体是否服从正态分布、总体方差是否已知等几种式中为变量的标准化值,是该组数据均值,s 为该组数据的

(2)在小样本情况下,假设总体服从正态分布: ①当总体方差 已知时,样本均值的抽样分布近似服从正态分布。总体均值检验的统计量为:

②当总体方差未知时,需要用样本方差代替总体方差样本均值的抽样分布服从自由度为(n -l )的t 分布。因此需要采用t 分布来检验总体均值。检验的统计量为:

4. 解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X 为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。

5. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。

【答案】(1)总平方和(S^T)是实际观测值

与其均值的离差平方和,即

(2)回归平方和(^狀)是各回归值

来解释的变差部分。

(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即

称为误差平方和。

(4)三者之间的关系

与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又

6. 请给出你所知道的概率抽样的组织方式。

【答案】概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。调查的实践中经常采用的概率抽样方式有以下几种:

(1)简单随机抽样。简单随机抽样指从包括总体N 个单位的抽样框中随机地、一个一个地抽取n 个单位作为样本,每个单位入样的概率是相等的;

(2)分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、 随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;

(3)整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查;

(4)系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;

(5)多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

二、计算题

7. 从总体中随机抽取了 n =200的样本,调查后按不同属性归类,得到如下结果

依据经验数据,各类别在总体中的比例分别为:

以 的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用P 值)。

现在情况与经验数据相比没有发生变化,现在情况与经验数据相【答案】提出假设:

比发生了变化。 由已知条件可得值为:

而故拒绝原假设。

8. 康祥医药公司2004年第三季度和第四季度三种药品的销售数据如表所示。