2017年新疆农业大学统计学(加试)考研复试核心题库
● 摘要
一、简答题
1. 多元线性回归模型中有哪些基本的假定?
【答案】多元回归模型的基本假定有: (1)自变量(3)对于自变
量
(4)误差项是一个服从正态分布的随机变量,且相互独立,即
2. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?
【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模
型对样本观测值的拟合优度。这是由于多重判定系数
随着样本解释变量个数的增加来越高(即
的值越
是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新
不是一个合适的指标,需加以
是非随机的、固定的,且相互之间互不相关(无多重共线性);
的方
差
都相同,且不序列相关,
即
的所有
值
(2)误差项是一个期望值为0的随机变量,即
的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,调整。而修正判定系数归模型方面要优于多重判定系数
修正判定系数
的计算公式为
3. 在研宄方法上,参数估计与假设检验有什么相同点和不同点?
【答案】(1)参数估计和假设检验的相同点 ①是根据样本信息推断总体参数;
②都以抽样分布为理论依据,建立在概率论基础之上的推断,推断结果都有风险; ③对同一问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。
(2)参数估计和假设检验的不同点
①参数估计是以样本资料估计总体参数的可能范围,假设检验是以样本资料检验对总体参数的先验假设是否成立;
②区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;
第 2 页,共 41 页
其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回
③区间估计立足于大概率,通常以较大的把握程度(可信度)成立。
4. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量
的数学期望等于未知参数
即:
去估计总体参数的置信区
间;假设检验立足于小概率,
通常是给定很小的显著性水平去检验对总体参数的先验假设是否
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性
设
(3)—致性(相合性) 如果依概率收敛于则称
即
有
是的一致估计量。
5. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的
即
去修正重复抽样时样本均值
与
且至少对于某一个
都是的无偏估计量,若对于任意
上式中的不等号成立,则称
较
有效。
有
在不重复抽样条件下,
样本均值的方差则需要用修正系数的方差,即
对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数对于有限总体,
当N 很大而n 很小时,其修正系数
来计算。
6. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。
【答案】(1)众数、中位数和平均数的关系
趋向于1;
也趋向于1,
这时样本均值的方差也可以按公式
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上
第 3 页,共 41 页
的值,而平均数 则是全部数据的算术平均。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系: ①如果数据的分布是对称的,众数
中位数
和平均数
必定相等,即
②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:
③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,
则
(2)众数、中位数和平均数在实际中的应用
①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。
②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。
③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。
二、计算题
7. 某厂生产某产品1000件,其价格为
其使用寿命X (单位:天)的分布密度为
现由某保险公司为其质量进行保险:
厂方向保险公司交保费(1)若保费(2)试确定保费
保险公司亏本的概率? 使保险公司亏本概率不超过
【答案】(1)设该厂出现产品寿命小于1095天的总产品件数是Y 。保险公司刚好亏本时,产品寿命小于1095天的总产品件数是y ;,则
当
时,
所以保险公司亏本的概率为:
每件产品寿命小于1095天的概率为:
第 4 页,共 41 页
元/件,每件产品若寿命小于
1095天(3年),则由保险公司按原价赔偿2000元/件,试由中心极限定理计算: