2017年西北大学经济管理学院806西方经济学与应用统计学之统计学考研仿真模拟题
● 摘要
一、简答题
1. 简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是则
越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。
2. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?
【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模
型对样本观测值的拟合优度。这是由于多重判定系数
随着样本解释变量个数的增加
来越高(即的值越
是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新
不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,
调整。而修正判定系数
归模型方面要优于多重判定系数修正判定系数的计算公式为
3. 简述复合型时间序列的预测步骤。
【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:
(1)确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;
(2)建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据
第 2 页,共 49 页 其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回
这一模型进行预测;
(3)计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。
4. 利用增长率分析时间序列时应注意哪些问题?
【答案】在应用増长率分析实际问题时,应注意以下几点:
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;
(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。
5. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
6. 举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
按照假设检验的步骤
:式中为变量的标准化值,是该组数据均值,s 为该组数据的
按照假设检验的步骤:
设定假设:
(行变量与列变量独立)
第 3 页,共 49 页
(行变量与列变量不独立) (其中是行变量,是列变量)
选取统计量:
(其中,
第i 行第j 列类别的期望频数;并且
为列联表中第i 行第j 列类别的实际频数;
最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。
7. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即
(2)回归平方和(^狀)是各回归值
来解释的变差部分。
(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即
称为误差平方和。
(4)三者之间的关系
8. 简述搜集数据的基本方法及其弱点。
【答案】搜集数据的基本方法:
(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。
(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。
(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,
第 4 页,共 49 页
为列联表中与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又
相关内容
相关标签