当前位置:问答库>考研试题

2017年西北大学综合知识(应用统计学、组织理论与设计)之统计学复试实战预测五套卷

  摘要

一、简答题

1. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?

【答案】相关系数r 的取值范围在关关系;若

相关关系;若

相关关系。

说明两个变量之间的线性关系越强

时. 可视为中度相关;说明两个变量之间的线性关系越弱。对于一时,

可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:

当时。视为低度相关;

当之间。若

表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性

相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

2. 简述概率抽样与非概率抽样的区别。

【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。

(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

3. 简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。

(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:

极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。

(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理答。

(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号, 然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。

4. 多元线性回归模型中有哪些基本的假定?

【答案】多元回归模型的基本假定有:

(1)自变量

(3)对于自变

(4)误差项是一个服从正态分布的随机变量,且相互独立,即

5. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?

【答案】在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数。

在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性。

6. 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否己知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。

【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本情况。

(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为

为当总体方差已知时,总体均值的检验统计量为:

当总体方差

为:

是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方

差都相同,且不序列相关,

即 的所有

值(2)误差项是一个期望值为0的随机变量,即!还是小样本此外还需要区分总体是否服从正态分布、总体方差是否已知等几种总体方差

未知时,可以用样本方差来近似代替总体方差,此时总体均值检验的统计量

(2)在小样本情况下,假设总体服从正态分布: ①当总体方差 已知时,样本均值的抽样分布近似服从正态分布。总体均值检验的统计量为:

②当总体方差未知时,需要用样本方差代替总体方差样本均值的抽样分布服从自由度为(n -l )的t 分布。因此需要采用t 分布来检验总体均值。检验的统计量为:

二、计算题

7. 已知用最小二乘方法得到的样本回归方程为

【答案】因为所以有:

又因为

由于是根据最小二乘法得到的,所以有:

试证明

绘制残差图,你会得出什么结论?