2017年新疆财经大学统计与信息学院432统计学[专业学位]考研冲刺密押题
● 摘要
一、简答题
1. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:
(1)值能告诉我们什么信息?
(2)当相应的值较小时为什么要拒绝原假设?
(3)显著性水平与值有何区别?
【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。
(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。
(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。
(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,
如果选择的值相同,
所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。
2. 若有线性回归模型问:
(1)该模型是否违背古典线性回归模型的假定,请简要说明。
(2)如果对该模型进行估计,你会采用什么方法?请说明理由。
【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为
量有关。
(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权
数以调整各项在平方和中的作用。即寻找参数的估计值使得离差平方和
与自变
其中
达到最小。这样,就消除了异方差性的影响。
3. 什么叫变异、变量和变量值,试举例说明。
【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。
变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:
(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;
“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、
“次品”等;
(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……
4. 概述相关分析与回归分析的联系与区别。
【答案】(1)相关分析和回归分析的联系
它们具有共同的研宄对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。
(2)相关分析和回归分析的区别
①从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值。
②从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分自变量和因变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是在变量因果关系分析的基础上研宄其中的自变量的变动对因变量的具体影响,必须明确划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。
5. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量的数学期望等于未知参数
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。
(2)有效性
即:
设(3)—致性(相合性) 如果依概率收敛于则称
与且至少对于某一个即都是的无偏估计量,若对于任意
上式中的不等号成立,则称有
较有效。 有是的一致估计量。
6. 简述相关系数和函数关系的差别。
【答案】变量之间的关系可分为两种类型:函数关系和相关关系。
(1)函数关系 设有两个变量
和(2)相关关系
相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。
7. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为 变量随变量一起变化,并完全依赖于当变量取某个数值时,依确定的关系取相应的值,则称是的函数。由此可见函数关系是一种一一对应的确定性关系。
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
8. 多元线性回归模型中有哪些基本的假定?
【答案】多元回归模型的基本假定有:
(1)自变量
(3)对于自变
量
(4)误差项是一个服从正态分布的随机变量,且相互独立,即
9. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置
; 是非随机的、固定的,且相互之间互不相关(无多重共线性) 的方
差都相同,且不序列相关,
即 的所有
值(2)误差项是一个期望值为0的随机变量,即
相关内容
相关标签