当前位置:问答库>考研试题

2017年湖南科技大学商学院623统计学考研冲刺密押题

  摘要

一、简答题

1. 简述标准化值的意义及计算公式。

【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:

标准差。

标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。

2. 中心极限定理。

【答案】设随机变量

也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方

差式中为变量的标准化值,是该组数据均值,s 为该组数据的

3. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

来越高(即的值越

是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模

型的解释功能。因此在多元线性回归模型之间比较拟和优度时,

调整。而修正判定系数

归模型方面要优于多重判定系数修正判定系数的计算公式为

不是一个合适的指标,需加以其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回

4. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、

“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……

5. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立) (其中是行变量,是列变量)

选取统计量:

(其中,

第i 行第j 列类别的期望频数;并且

为列联表中第i 行第j 列类别的实际频数;

为列联表中

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

6. 统计分组标志选择的原则。

【答案】在进行统计分组标志选择时要遵循三个原则:

(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。

(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本 质的标志进行分组。

(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经 济条件下,选择的分组标志也不一样,要根据情况的变化而变化。

7. 简述时间序列的预测程序。

【答案】在对时间序列进行预测时,通常包括以下几个步骤:

(1)确定时间序列所包含的成分,也就是确定时间序列的类型;

(2)找出适合此类时间序列的预测方法;

(3)对可能的预测方法进行评估,以确定最佳预测方案;

(4)利用最佳预测方案进行预测。

8. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计

模型用于预测,影响预测精度的因素有哪些?

【答案】(1

)误差项是一个服从正态分布的随机变量,且独立,即

0的随机变量,即线性函数;②无偏性

具有最小方差的估计量。

(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度

具有哪些统计特性?若)。独立性意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值为对于所有的值分别是的方差都相同。 为随机变量的是所有线性无偏估计量中(2

)模型参数的最小二乘估计的统计特性:①线性,即估计量的无偏估计;③有效性越大,相应的预测区间就越宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④