2017年华侨大学统计学院856统计学之统计学考研仿真模拟题
● 摘要
一、简答题
1. 简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是则
越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。
2. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若
相关关系;若
相关关系。
当
说明两个变量之间的线性关系越强
时. 可视为中度相关;说明两个变量之间的线性关系越弱。对于一时,
可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当时。视为低度相关;
当之间。若
表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
3. 试述统计总体及其特征。
【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。
总体具有的特征包括:(1)同质性,即总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是 构成总体的条件;(2)大量性,即构成总体的总体单位数目要足够多;(3)差异性,即总体单位必须具有一个或 若干个品质变异标志或数量变异标志。
4. 给出在一元线性回归中:
(1)相关系数的定义和直观意义;
(2)判定系数的定义和直观意义;
(3)相关系数和判定系数的关系。
【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
称为样本相关系数,记为r 。样本
相关系数的计算公式为:
按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。
(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
判定系数测度了回归直线对观测数据的拟合程度。
的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变
差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。
(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。
5. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
式中为变量的标准化值,是该组数据均值,s 为该组数据的
6. 利用增长率分析时间序列时应注意哪些问题?
【答案】在应用増长率分析实际问题时,应注意以下几点:
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;
(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。
7. 简述假设检验的过程。
【答案】假设检验的过程如下:
(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若则拒绝接受
8. 构建综合评价指数时需要考虑哪些方面的问题? 若则不拒绝
【答案】构建综合评价指数需要考虑如下几个方面的问题:
(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。
(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的筛选,以提高指标的客观性。
(3)评价方法研宄,主要包括综合评价指数的构造方法、指标的赋权方法以及各种评价方法的比较等。
二、计算题
9. 某艺术家拍卖会上油圆价格和油画年龄的关系。研宄收集25个样本,数据见表1。以油画价格为因变量,油画年龄为自变量建立一元线性回归模型,结果见表2。
表1