当前位置:问答库>考研试题

2017年兰州大学数学与统计学院432统计学[专业硕士]考研强化模拟题

  摘要

一、简答题

1. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为如何依赖于自变量

式中(2)多元回归方程:

根据回归模型的假定有

方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数

数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

式中是参数称为偏回归系数。

2. 方差分析中的基本假定。

【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差

的。

3. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤:必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独立的估计值是因变量y 的估计值。其中

之间的关系。 是未知的,需要利用样本去估计回归方程中的未知参

数个自变量分别为是模型的参数描述因变量y

为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立) (其中是行变量,是列变量)

选取统计量:

(其中,

第i 行第j 列类别的期望频数;并且

为列联表中第i 行第j 列类别的实际频数;

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

4. 简述相关系数和函数关系的差别。

【答案】变量之间的关系可分为两种类型:函数关系和相关关系。

(1)函数关系 设有两个变量

和(2)相关关系

相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。

5. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述

式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列变量随变量一起变化,并完全依赖于当变量取某个数值时,依确定的关系取相应的值,则称是的函数。由此可见函数关系是一种一一对应的确定性关系。 为列联表中联表,是因为对于

计算公式为: 列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。

6. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?

【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;

②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。

③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差

⑤当为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。越大,正态曲线 越扁平;越小,正态曲线越陡峭。 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。

⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。

(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求

方差为总体方差的,不论原来的总)体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正态分布。

7. 构建综合评价指数时需要考虑哪些方面的问题?

【答案】构建综合评价指数需要考虑如下几个方面的问题:

(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。

(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的