当前位置:问答库>考研试题

2017年上海交通大学理学院(数学系)432统计学[专业硕士]考研强化模拟题

  摘要

一、判断题

1. 任意随机变量X 的数学期望和方差都存在。( )

【答案】×

【解析】柯西分布的数学期望和方差都不存在,其密度函数为

2. 方差分析过程中因子不独立,则存在交互影响;如果因子间是相互独立的,则无交互影响。

交互影响是对实验结果产生作用的一个新因素,有必要将它的影响作用也单独分离开来。( )

【答案】√

3. 有50个调查者分别对同一个正态总体进行抽样,样本量都是100, 总体方差未知。他们分别根据各自的样本数据得到总体均值的一个置信度为90%的置信区间(双侧),则这些置信区间中正好有45个区间会覆盖总体均值。( ) 【答案】

【解析】从大量样本来看,约有90%的置信区间会覆盖总体真值,但对50次抽样的结果来看,不一定刚好占90%。

4. 如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;在实验中变化的因素不只一个时,就称多因素方差分析。( )

【答案】√

5. 样本均值的标准差也称抽样估计的标准误差,可用公式表示为

【答案】×

【解析】样本均值的标准差也称抽样估计的标准误差,可用公式表示为

6. 总体X 的数学期望和方差均存在,

的无偏估计,但【答案】

所以

第 2 页,共 46 页 ( ) 时,尽管是

是来自X 的样本,当并非的无偏估计。( ) 【解析】由于

即不是的无偏估计。

7. 某地区医生人数逐年増加,1993年、1994年、1995年各年的环比增长率分别为8%、18%、15%。该地区三年来医生人数共増长了

【答案】×

【解析】由环比发展速度和定基增长速度之间的关系可得,该地区三年来医生人数的定基增 长速度为

8. 检验显著性水平的选择,对接受和拒绝原假设

【答案】 ( ) 没有影响。( )

9. 所谓小概率原理是指发生概率很小的事件,在试验中不可能发生。( ) 【答案】

【解析】小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。小概率事件虽然发生概率很小,但并不代表不可能发生。

10.概率密度曲线位于X 轴的上方并且与X 轴之间的面积为1。( )

【答案】√

【解析】概率密度函数是指用来代表连续型随机变量的概率分布的一种公式或运算,它的值始终大于等于0, 所以位于X 轴的上方,并且与X 轴之间的面积为1。

二、简答题

11.简述标准化值的意义及计算公式。

【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:

标准差。

标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。

12.概述相关分析与回归分析的联系与区别。

【答案】(1)相关分析和回归分析的联系

它们具有共同的研宄对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析

第 3 页,共 46 页

式中为变量的标准化值,是该组数据均值,s 为该组数据的

去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。

(2)相关分析和回归分析的区别

①从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值。

②从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分自变量和因变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是在变量因果关系分析的基础上研宄其中的自变量的变动对因变量的具体影响,必须明确划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。

13.简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】(1)众数、中位数和平均数的关系

从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:

①如果数据的分布是对称的,众数中位数和平均数必定相等,即

②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:

③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,

(2)众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。

第 4 页,共 46 页