当前位置:问答库>考研试题

2017年广东财经大学统计学原理复试仿真模拟三套题

  摘要

一、简答题

1. 简述搜集数据的基本方法及其弱点。

【答案】搜集数据的基本方法:

(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。

(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。

(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,电话调查由于不是面对面的交流,在被访者不愿意接受调查 时,要说服他们就更为困难。

此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。

2. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?

【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为

由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性

犯取伪错误的可能性

一办法只有增大样本容量,这样既能保证满足取得较小的又能取得较小的值。

3. 解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为 势必增大

也就是说,

的大小和显著性水平的大小成相反方向变化。解决的唯

(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1,其计算公式为

4. 简述平稳序列和非平稳序列的含义。

【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。

(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

5. 统计数据质量的基本标准是什么?

【答案】(1)准确:用数字语言来反映客观实际;(2)快速:统计信息服务必须具有时效性和紧迫性;(3)完整:调查单位没有遗漏,调查项目没有缺陷,资料数据齐全;(4)精练:统计信息具有针对性、有效性、精确性。

6. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

好;反之

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是则

越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越越接近于0, 回归直线的拟合程度就越差。

二、计算题

7. 某城市的餐饮业管理协会估计,餐馆的月平均用水量为100吨。一家研宄机构认为实际用水

,量要高于这 个数字。该研宄机构随机抽取了 36家餐馆,记录了每个餐馆的月用水量(单位:吨)

经初步计算得到样本数据的部分描述统计量如表所示。

(1)确定餐馆月平均用水量95%的置信区间。

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因。

(3)如果要检验研宄机构的看法是否正确,应该如何建立原假设和备择假设?并谈谈拒绝和不拒绝原假设的含义。

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

【答案】(1)已知

所以餐馆月平均用水量95%的置信区间为:

即 由于总体方差未知,但为大样本,

(2)餐馆实际月平均用水量不一定包含在所建立的置信区间里。由于用该样本所构造的区间是一个特定的区间,而不再是随机区间,所以无法知道这个样本所产生的区间是否包含总体参数的真值。

(3)设为餐馆月平均用水量。建立的原假设和备择假设分别为:

拒绝原假设意味着所构造的与原假设相矛盾的小概率事件发生了,即结论

不超过为真出错的概率不拒绝原假设意味着所构造的与原假设相矛盾的小概率事件没有发生,但可能还有许多

结果解 释为“没有发现充足的证据反对”,或更严格地解释为

”。

其他的与原假设矛盾的小概率事件,我们没有也无法证实所有的这些小概率事件会不会发生。因此,我们把假设检验中出现接受“在显著性水平下没有发现充足的证据反对在此题中,接受原假设意味着认为餐馆的月平均用水量未超过100吨;而拒绝原假设意味着认为餐馆的月平均用水量超过了 100吨。原假设为真而拒绝原假设的概率不超过

(4)在上面的估计和检验中,使用了中心极限定理。

中心极限定理:设从均值为方差为(有限)的任意一个总体中抽取样本量为n 的样本,

的正态分布。 当n 充分大时,样本均值的抽样分布近似服从均值为方差为

8. 工业企业某种产品产量与单位成本资料如表所示:

要求:

(1)根据上表资料,绘制相关图,判别该数列相关与回归的种类;

(2)配合适当的回归方程;

(3)根据回归方程,指出每当产品产量増加1万件时,单位成本的变动情况;

(4)计算相关系数;