2017年新疆财经大学统计与信息学院432统计学[专业学位]考研导师圈点必考题汇编
● 摘要
目录
2017年新疆财经大学统计与信息学院432统计学[专业学位]考研导师圈点必考题汇编(一) . 2 2017年新疆财经大学统计与信息学院432统计学[专业学位]考研导师圈点必考题汇编(二)14 2017年新疆财经大学统计与信息学院432统计学[专业学位]考研导师圈点必考题汇编(三)23 2017年新疆财经大学统计与信息学院432统计学[专业学位]考研导师圈点必考题汇编(四)33 2017年新疆财经大学统计与信息学院432统计学[专业学位]考研导师圈点必考题汇编(五)42
一、简答题
1. 概述相关分析与回归分析的联系与区别。
【答案】(1)相关分析和回归分析的联系
它们具有共同的研宄对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。
(2)相关分析和回归分析的区别
①从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值。
②从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分自变量和因变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是在变量因果关系分析的基础上研宄其中的自变量的变动对因变量的具体影响,必须明确划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。
2. 简述搜集数据的基本方法及其弱点。
【答案】搜集数据的基本方法:
(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。
(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。
(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,
电话调查由于不是面对面的交流,在被访者不愿意接受调查 时,要说服他们就更为困难。
此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。
3. 简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是则
越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。
4. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当
然相当好,此时随机变量X 的分布是相对于其平均值时,二项分布的正态近似仍
和都对称的。当p 趋于0或1时,二项分布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使大于或等于5时,近似的效果就相当好。
5. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计
模型用于预测,影响预测精度的因素有哪些?
【答案】(1
)误差项是一个服从正态分布的随机变量,且独立,
即
0的随机变量,即线性函数;②无偏性
具有最小方差的估计量。 对于所有的值分别是的方差都相同。 具有哪些统计特性?若)。独立性意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值为(2
)模型参数的最小二乘估计的统计特性:①线性,即估计量的无偏估计;③有效性为随机变量的是所有线性无偏估计量中
(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度越大,相应的预测区间就越宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心间越窄,精度越高。
区
6. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的即
去修正重复抽样时样本均值在不重复抽样条件下,
样本均值的方差则需要用修正系数
的方差,即
对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数
对于有限总体,
当N 很大而n 很小时,其修正系数
来计算。
7. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。 趋向于1; 也趋向于1,
这时样本均值的方差也可以按公式
【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知参数的真值,这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量,即在均方误差
是的一个无偏估计量,都有
则称是的一致最小方差无偏估计。
8. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对式中为变量的标准化值,是该组数据均值,s 为该组数据的最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量