2017年广东海洋大学029统计学原理(同等学力加试)考研复试核心题库
● 摘要
一、简答题
1. 简述搜集数据的基本方法及其弱点。
【答案】搜集数据的基本方法:
(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。
(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。
(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,电话调查由于不是面对面的交流,在被访者不愿意接受调查 时,要说服他们就更为困难。
此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。
2. 简述时间序列的构成要素。
【答案】时间序列的构成要素分为4种,即趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;
(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;
(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;
(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
3. 举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
按照假设检验的步骤
:
按照假设检验的步骤:
设定假设:
(行变量与列变量独立)
(行变量与列变量不独立) (其中是行变量,是列变量)
选取统计量:
(其中,
第i 行第j 列类别的期望频数;并且
为列联表中第i 行第j 列类别的实际频数;
最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。
4. 简述假设检验的过程。
【答案】假设检验的过程如下:
(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若
5. 给出在一元线性回归中:
(1)相关系数的定义和直观意义;
(2)判定系数的定义和直观意义;
(3)相关系数和判定系数的关系。
为列联表中则拒绝接受若则不拒绝
【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
称为样本相关系数,记为r 。样本
相关系数的计算公式为:
按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。
(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
判定系数测度了回归直线对观测数据的拟合程度。
的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变
差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。
(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。
6. 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否己知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。
【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本情况。
(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为
为当总体方差已知时,总体均值的检验统计量为:
当总体方差
为:
(2)在小样本情况下,假设总体服从正态分布: ①当总体方差 已知时,样本均值的抽样分布近似服从正态分布。总体均值检验的统计量为:
!还是小样本此外还需要区分总体是否服从正态分布、总体方差是否已知等几种总体方差
未知时,可以用样本方差来近似代替总体方差,此时总体均值检验的统计量