2017年河海大学理学院432统计学[专业硕士]考研强化模拟题
● 摘要
一、简答题
1. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。
【答案】(1)多元回归模型:设因变量为如何依赖于自变量
式中
(2)多元回归方程:
根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量
(3)估计的多元回归方程:
回归方程中的参数数据去估计它们。当用样本统计
量
时,就得到了估计的
多元回归方程,其一般形式为:
式中
是参数
称为偏回归系数。
2. 简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述式为:
式中,
列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的
列
的估计值
是因变量y 的估计值。其中
之间的关系。
是未知的,需要利用样本
去估计回归方程中的未知参
数
个自变量分别为
是模型的参数
描述因变量y
为误差项。
称为多元回归
和误差项的方程称为多元回归模型。其一般形式可表示为
:
联表,是因为对于计算公式为:
列联表中的数据,计算出的系数可以控制在
(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,果列联表中有一维为2,即
当两个变量完全相关时,
所以V 的取值在
之间。如
则V 值就等于值。
3. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且
的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
4. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计模型用于预测,影响预测精度的因素有哪些?
【答案】(1
)误差项是一个服从正态分布的随机变量,且独立,即0的随机变量,即线性函数;②无偏性
具有最小方差的估计量。
(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度
越大,相应的预测区间就越
宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心间越窄,精度越高。
5. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的
即
去修正重复抽样时样本均值
区
对于所有的值分别是
的方差
都相同。
为随机变量的
是所有线性无偏估计量中
)。独立性
意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值为
(2
)模型参数的最小二乘估计
的统计特性:①线性,即估计量的无偏估计;③有效性
具有哪些统计特性?若
在不重复抽样条件下,样本均值的方差则需要用修正系数的方差,即
对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数对于有限总体,
当N 很大而n 很小时,
其修正系数
趋向于1;
也趋向于1,这时样本均值的方差也可以按公式
来计算。
6. 简述相关系数和函数关系的差别。
【答案】变量之间的关系可分为两种类型:函数关系和相关关系。 (1)函数关系 设有两个变量
和
(2)相关关系
相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。
7. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为
就知道该数值低于平均数1.5倍的标准差。在对
多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
8. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。
【答案】
抽样调查(
)是一种非全面调查,它是按照随机原则从总体中抽取
一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。
变量随变量一起变化,并完全依赖于当变量取某个数值时,依
确定的关系取相应的值,则称是的函数。由此可见函数关系是一种一一对应的确定性关系。
式中为变量的标准化值,是该组数据均值,s 为该组数据的
相关内容
相关标签