2017年广东财经大学统计学考研复试核心题库
● 摘要
一、简答题
1. 举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
按照假设检验的步骤
:
按照假设检验的步骤:
设定假设:
(行变量与列变量独立)
(行变量与列变量不独立) (其中是行变量,是列变量)
选取统计量:
(其中,
第i 行第j 列类别的期望频数;并且
为列联表中第i 行第j 列类别的实际频数;
最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。
2. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。为列联表中
其计算公式为:
标准差。 式中为变量的标准化值,是该组数据均值,s 为该组数据的
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
3. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若
相关关系;若
相关关系。
当
说明两个变量之间的线性关系越强
时. 可视为中度相关
;说明两个变量之间的线性关系越弱。对于一时,
可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当时。视为低度相关;当之间。若表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
4. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:
(1)值能告诉我们什么信息?
(2)当相应的值较小时为什么要拒绝原假设?
(3)显著性水平与值有何区别?
【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。
(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。
(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。
(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,
如果选择的值相同,
所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。
5. 什么是指数?它有哪些性质?
【答案】指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。它有如下一些性质:
(1)相对性。指数是总体各变量在不同场合下对比形成的相对数,它可以度量一个变量在不同时间或不同空间的相对变化,如一种商品的价格指数或数量指数。它也可以反映一组变量的综合变动,比如综合物价指数是根据一组商品价格的相对变化并给每种商品的相对数定以不同权数计算出来的,这种指数称为综合指数。另外根据对比两变量所处的是不同时间还是不同空间,它们计算出来的指数分时间性指数和区域性指数。
(2)综合性。综合性说明指数是一种特殊的相对数,它是由一组变量或项目综合对比形成的。比如,由若干种商品和服务构成的一组消费项目,通过综合后计算价格指数,以反映消费价格的综合变动水平。
(3)平均性。平均性含义有二:一是指数进行比较的综合数量是作为个别量的一个代表,这本身就具有平均的性质;二是两个综合量对比形成的指数反映了个别量的平均变动水平,比如物价指数反映了多种商品和服务项目价格的平均变动水平。
6. 简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
好;反之
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是则
越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越越接近于0, 回归直线的拟合程度就越差。
二、计算题
7. —超市为提高收银台的工作效率,设计了四种结账流程,并随机选取了3个收银员进行重复试验,记录了流程的持续时间(单位:秒),实验结果如表1所示。
表1
相关内容
相关标签