当前位置:问答库>考研试题

2017年湖南科技大学管理学院630统计学考研题库

  摘要

一、简答题

1. 方差分析中的基本假定。

【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差

的。

2. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?

【答案】相关系数r 的取值范围在关关系;若

相关关系;若

相关关系。

说明两个变量之间的线性关系越强

时. 可视为中度相关

;说明两个变量之间的线性关系越弱。对于一时,

可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:

当时。视为低度相关;当之间。若表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独立二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性

相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

3. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

,是利用数据中的五个统计量:最【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot )

小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面

叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

4. 若有线性回归模型

问:

(1)该模型是否违背古典线性回归模型的假定,请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为

量有关。

(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权

第 2 页,共 52 页 其中

与自变

数以调整各项在平方和中的作用。即寻找参数的估计值使得离差平方和

达到最小。这样,就消除了异方差性的影响。

5. 给出在一元线性回归中:

(1)相关系数的定义和直观意义;

(2)判定系数的定义和直观意义;

(3)相关系数和判定系数的关系。

【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

称为样本相关系数,记为r 。样本

相关系数的计算公式为:

按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。

(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

判定系数测度了回归直线对观测数据的拟合程度。

的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变

差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。

(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。

6. 简述时间序列的组成要素。

【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;

(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式

第 3 页,共 52 页

变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

7. 什么是指数?它有哪些性质?

【答案】指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。它有如下一些性质:

(1)相对性。指数是总体各变量在不同场合下对比形成的相对数,它可以度量一个变量在不同时间或不同空间的相对变化,如一种商品的价格指数或数量指数。它也可以反映一组变量的综合变动,比如综合物价指数是根据一组商品价格的相对变化并给每种商品的相对数定以不同权数计算出来的,这种指数称为综合指数。另外根据对比两变量所处的是不同时间还是不同空间,它们计算出来的指数分时间性指数和区域性指数。

(2)综合性。综合性说明指数是一种特殊的相对数,它是由一组变量或项目综合对比形成的。比如,由若干种商品和服务构成的一组消费项目,通过综合后计算价格指数,以反映消费价格的综合变动水平。

(3)平均性。平均性含义有二:一是指数进行比较的综合数量是作为个别量的一个代表,这本身就具有平均的性质;二是两个综合量对比形成的指数反映了个别量的平均变动水平,比如物价指数反映了多种商品和服务项目价格的平均变动水平。

8. 简述统计分组的原则。

【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。

9. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?

【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。

影响抽样平均误差的因素有四个:

(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。

(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。

第 4 页,共 52 页