当前位置:问答库>考研试题

2017年兰州大学数学与统计学院432统计学[专业硕士]考研题库

  摘要

一、简答题

1. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

【答案】单因素方差分析的实质是研宄一个分类型自变量对一个数值型因变量的影响。

单因素方差分析的步骤为:

(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。

(2)构造检验统计量,计算各样本均值(3)计算样本统计量

(4

)统计决策。比较统计量拒绝原假设。

2. 给出在一元线性回归中:

(1)相关系数的定义和直观意义;

(2)判定系数的定义和直观意义;

(3)相关系数和判定系数的关系。

【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

称为样本相关系数,记为r 。样本

相关系数的计算公式为:

按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则 的值。若拒绝原假设;反之,不能样本总均值误差平方和 与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。

(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

判定系数测度了回归直线对观测数据的拟合程度。

的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变

差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。

(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。

3. 简述统计分组的原则。

【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。

4. “假设检验的基本思路是:概率性质的反证法,主要依据的是:小概率事件原理”。你同意这种说法吗?简要叙述你对假设检验的理解和检验步骤。

【答案】同意。

假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。例如,在10000件的产品中,如果只有1件是次品,那么可以得知,在一次试验中随机抽取1件次品的概率就为此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中任意抽取1件,恰好是次品,我们就可以断定,该次品率应该不是很小的,否则我们就不会那么轻易的就能抽到次品。从而,我们就有足够的理由否认产品的次品率是很低的假设。

假设检验的基本步骤为:第一,对所考察总体的分布形式或总体的某些未知参数做出某些假设,称之为原假设。第二,根据检验对象构造合适的检验统计量,并通过数理统计分析确定在原假设成立的条件下该检验统计量的抽样分布。第三,在给定的显著性水平下,根据抽样分布得出原假设成立时的临界值,由临界值构造拒绝域和接受域。第四,由所抽取的样本资料计算样本统计量的取值,并将其与临界值进行比较,从而对所提出的原假设做出接受还是拒绝的统计判断。

假设检验就是利用样本中所蕴含的信息对事先假设的总体情况做出推断。假设检验不是毫无根据的,而是在一定的统计概率下支持这种判断。

5. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。

【答案】

抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来

抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。

6. 简述概率抽样与非概率抽样的区别。

【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。

(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

7. 说明计算统计量的步骤。

【答案】计算

(2)将

(3)将平方结果统计量的步骤:

之差平方; 除以(1)用观察值减去期望值(4)将步骤(3)的结果加总,即得:

8. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

,是利用数据中的五个统计量:最【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot )

小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面

叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

二、计算题

9. 设总体

【答案】由题意得

是取自总体x 的简单随机样本。试问n 取多大,

才能使得