2017年兰州大学数学与统计学院432统计学[专业硕士]考研强化模拟题
● 摘要
一、简答题
1. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。
【答案】(1)多元回归模型:设因变量为如何依赖于自变量
式中(2)多元回归方程:
根据回归模型的假定有
方程,它描述了因变量y 的期望值与自变量
(3)估计的多元回归方程:
回归方程中的参数
数据去估计它们。当用样本统计
量
时,就得到了估计的
多元回归方程,其一般形式为:
式中是参数称为偏回归系数。
2. 方差分析中的基本假定。
【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差
的。
3. 举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
按照假设检验的步骤:必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独立的估计值是因变量y 的估计值。其中
之间的关系。 是未知的,需要利用样本去估计回归方程中的未知参
数个自变量分别为是模型的参数描述因变量y
为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为
:
按照假设检验的步骤:
设定假设:
(行变量与列变量独立)
(行变量与列变量不独立) (其中是行变量,是列变量)
选取统计量:
(其中,
第i 行第j 列类别的期望频数;并且
为列联表中第i 行第j 列类别的实际频数;
最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。
4. 简述相关系数和函数关系的差别。
【答案】变量之间的关系可分为两种类型:函数关系和相关关系。
(1)函数关系 设有两个变量
和(2)相关关系
相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。
5. 简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述
式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的列变量随变量一起变化,并完全依赖于当变量取某个数值时,依确定的关系取相应的值,则称是的函数。由此可见函数关系是一种一一对应的确定性关系。 为列联表中联表,是因为对于
计算公式为: 列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。
6. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?
【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;
②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。
③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差
⑤当为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。越大,正态曲线 越扁平;越小,正态曲线越陡峭。 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。
⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。
(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求
方差为总体方差的,不论原来的总)体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正态分布。
7. 构建综合评价指数时需要考虑哪些方面的问题?
【答案】构建综合评价指数需要考虑如下几个方面的问题:
(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。
(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的