当前位置:问答库>考研试题

2017年河海大学720统计学原理(同等学力加试)复试实战预测五套卷

  摘要

一、简答题

1. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】(1)众数、中位数和平均数的关系

从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:

①如果数据的分布是对称的,众数中位数和平均数必定相等,即

②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:

③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,

(2)众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。

2. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是则

越接近于7,表明回归平方和占总平方和的比例越大,回

归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越

好;反之越接近于0, 回归直线的拟合程度就越差。

3. 什么是指数?它有哪些性质?

【答案】指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。它有如下一些性质:

(1)相对性。指数是总体各变量在不同场合下对比形成的相对数,它可以度量一个变量在不同时间或不同空间的相对变化,如一种商品的价格指数或数量指数。它也可以反映一组变量的综合变动,比如综合物价指数是根据一组商品价格的相对变化并给每种商品的相对数定以不同权数计算出来的,这种指数称为综合指数。另外根据对比两变量所处的是不同时间还是不同空间,它们计算出来的指数分时间性指数和区域性指数。

(2)综合性。综合性说明指数是一种特殊的相对数,它是由一组变量或项目综合对比形成的。比如,由若干种商品和服务构成的一组消费项目,通过综合后计算价格指数,以反映消费价格的综合变动水平。

(3)平均性。平均性含义有二:一是指数进行比较的综合数量是作为个别量的一个代表,这本身就具有平均的性质;二是两个综合量对比形成的指数反映了个别量的平均变动水平,比如物价指数反映了多种商品和服务项目价格的平均变动水平。

4. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。

【答案】

抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。

5. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?

【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行

的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免

拒绝一个真实的原假设。

方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。

6. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

来越高(即的值越是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新

不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,

调整。而修正判定系数

归模型方面要优于多重判定系数修正判定系数的计算公式为

其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回二、计算题

7. 某保险公司为50个集体投保人提供医疗保险,假设他们医疗花费相互独立,且花费(单位为百元)服从相同的分布律|当花费超过百元时,保险公司应支付超过百元的部分;

作为预期的总支

则由题意知其中为相对附加保费。为使公司获利的当花费不超过百元时,由患者自己负担费用。如果以总支付费X 的期望值付费,那么,保险公司应收取总保险费为概率超过附加保费至少应为多少。(己知为保险公司支付给每个投保人的费用,且

相互独立并且分布律为:

因此

【答案】设

那么,由中心极限定理可得: