当前位置:问答库>考研试题

2017年西南大学统计学原理(同等学力加试)复试实战预测五套卷

  摘要

一、简答题

1. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

2. 简述假设检验的过程。

【答案】假设检验的过程如下:

(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定

值,以值与显著性水平比较,若则拒绝接受

若则不拒绝

3. “假设检验的基本思路是:概率性质的反证法,主要依据的是:小概率事件原理”。你同意这种说法吗?简要叙述你对假设检验的理解和检验步骤。

【答案】同意。

假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。例如,在10000件的产品中,如果只有1件是次品,那么可以得知,在一次试验中随机抽取1件次品的概率就为此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中任意抽取1件,恰好是次品,我们就可以断定,该次品率应该不是很小的,否则我们就不会那么轻易的就能抽到次品。从而,我们就有足够的理由否认产品的次品率是很低的假设。

假设检验的基本步骤为:第一,对所考察总体的分布形式或总体的某些未知参数做出某些假设,称之为原假设。第二,根据检验对象构造合适的检验统计量,并通过数理统计分析确定在原假设成立的条件下该检验统计量的抽样分布。第三,在给定的显著性水平下,根据抽样分布得出原假设成立时的临界值,由临界值构造拒绝域和接受域。第四,由所抽取的样本资料计算样本统计量的取值,并将其与临界值进行比较,从而对所提出的原假设做出接受还是拒绝的统计判断。

假设检验就是利用样本中所蕴含的信息对事先假设的总体情况做出推断。假设检验不是毫无根据的,而是在一定的统计概率下支持这种判断。

4. 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否己知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。

【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本情况。

(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为

为当总体方差已知时,总体均值的检验统计量为:

当总体方差

为:

(2)在小样本情况下,假设总体服从正态分布: ①当总体方差 已知时,样本均值的抽样分布近似服从正态分布。总体均值检验的统计量为:

②当总体方差未知时,需要用样本方差代替总体方差样本均值的抽样分布服从自由未知时,可以用样本方差来近似代替总体方差,此时总体均值检验的统计量总体方差

!还是小样本此外还需要区分总体是否服从正态分布、总体方差是否已知等几种度为(n -l )的t 分布。因此需要采用t 分布来检验总体均值。检验的统计量为:

5. 何谓统计量?

【答案】设

函数

又称出分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处? 是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。

从以上统计量的定义可以看出,当.

赖于任何未知参数时,则.

未知参数,则它们就不是统计量。

分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。

t 分布:一般当时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。

F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验

是一个统计量。通常,时,代入T ,计算分布、t 分布、F 分布是由样本构造的函数,而且不依分布、t 分布、F 分布中含有分布、t 分布、F 分布就是统计量;若

与方差分析中做很重要的检验统计量。

6. 简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。

(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:

极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。

(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理答。

(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号, 然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。

二、计算题

7. 为检验A 、B 两种烟草的尼古丁含量是否相同,从这两种烟草中各自随机抽取重量相同的5例进行化验,测得尼古丁含量(单位:毫克)为:

烟草 A : 24,27, 26,21,24

烟草 B : 27,28,23,31,26

据经验知,尼古丁含量服从正态分布,且烟草A 的方差为5, B 的方差为8, 在显著性水平之下,问两种烟草尼古丁含量是否有差异?

【答案】建立假设:

已知

由于两个总体服从正态分布,并且方差已知,应选用z 作为检验统计量。则检验统计量的值为:

当时

,因为

故不能拒绝原假设,即认为两种