当前位置:问答库>考研试题

2017年东南大学550统计学基础复试实战预测五套卷

  摘要

一、简答题

1. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。

【答案】

抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。

2. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是则

越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。

3. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。

【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知

参数的真值,这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量,即在均方误差

是的一个无偏估计量,都有

则称是的一致最小方差无偏估计。

4. 简述平稳序列和非平稳序列的含义。

【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。

(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

5. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述

公式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量列联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。

6. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:

(1)值能告诉我们什么信息?

(2)当相应的值较小时为什么要拒绝原假设?

(3)显著性水平与值有何区别?

【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,

称为值,也称为观察到的显著性水平。

(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。

(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。

(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,

如果选择的值相同,

所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。

二、计算题

7. 假设本,令

求满足下列各式的常数a ,b 和c :

【答案】由条件知:

因此

和为来自总体的两个相互独立的简单随机样

所以

查表得又

即解得

查表