当前位置：问答库＞考研试题

2017年厦门大学统计系432统计学[专业硕士]之统计学考研强化模拟题

● 摘要

一、简答题

1．下列调查问卷中的提问都有问题，请修改。

（1）您和您爱人是否对现有住房满意？

（2）您最近一次是几点上班的？

（3）绝大多数喝过明光牛奶的人都认为它口味纯正，您认为是这样的吗？

【答案】（1）您对现有住房满意吗？您爱人呢？

（2）您最近一次的工作是几点上班？

（3）您认为明光牛奶的口味纯正吗？

2．解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量（标志）的取值所形成的分布。假设X 为总体随机变量，那么总体分布就是指X 的分布。很显然，同一变量不同的总体或同一总体不同的变量，其分布是不同的。

样本分布就是样本中所有个体关于某个变量（标志）的取值所形成的分布。假设x 为总体随机变量X 在样本中的体现，那么样本分布就是指x 的分布，或者说是关于《个观测值的分布。同样，同一变量不同的样本或同一样本不同的变量，其分布是不同的。

一般意义上说，抽样分布就是样本统计量的概率分布，它由样本统计量的所有可能取值和与之对应的概率组成。如果说样本分布是关于样本观测值的分布，那么抽样分布则是关于样本统计量的分布，而样本统计量是由样本观测值计算而来的。具体地说，抽样分布就是从容量为W 的总体中抽取容量为n 的样本时，所有可能的样本统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本，那么把所有m 个样本统计值形成频率分布，就是抽样分布。可以说，抽样分布是研宄样本分布与总体分布之间的桥梁。

3．简述复合型时间序列的预测步骤。

【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来，然后再进行预测，分解法预测通常按下面的步骤进行：

（1）确定并分离季节成分。计算季节指数，以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去，即用每一个时间序列观测值除以相应的季节指数，以消除季节性；

（2）建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型，并根据这一模型进行预测；

（3）计算出最后的预测值。用预测值乘以相应的季节指数，得到最终的预测值。

4．在假设检验中，犯两类错误之间存在什么样的数理关系？是否有什么办法使得两类错误同时减少？

【答案】第一类错误是指原假设为真，拒绝原假设，又称弃真错误，犯这类错误的概率记为第二类错误是指原假设为假，接受原假设，又称取伪错误，犯这类错误的概率记为

由于两类错误是矛盾的，在其他条件不变的情况下，减少犯弃真错误的可能性

犯取伪错误的可能性

一办法只有增大样本容量，这样既能保证满足取得较小的又能取得较小的值。

5．解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】（1）多重判定系数是多元回归中的回归平方和占总平方和的比例，它是度量多元回归方程拟合程度的一个统计量，反映了在因变量y 的变差中被估计的回归方程所解释的比例，其计算公式为势必增大也就是说

，

的大小和显著性水平的大小成相反方向变化。解决的唯

（2）调整的多重判定系数考虑了样本量（n ）和模型中自变量的个数（k ）的影响，这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1，

其计算公式为

6．简述搜集数据的基本方法及其弱点。

【答案】搜集数据的基本方法：

（1）自填式。自填式方法的弱点：首先，问卷的返回率比较低。其次，自填式方法不适合结构复杂的问卷，对调查的内容有所局限。此外，自填式方法的调查周期通常都比较长，调查人员也需要对问卷的递送和回收方法进行仔细的研宄和选择。最后，对于在数据搜集过程中出现的问题，一般难以及时采取调改措施。

（2）面访式。面访式的弱点主要有：首先，调查的成本比较高。其次，面访这种搜集数据的方式对调查过程的质量控制有一定难度。此外，对于敏感性问题的调查，需要对调查员的访谈技巧进行技术培训。

（3）电话式。电话调查也有一定的局限。因为电话调查的工具是电话，如果被调查者没有电话，调查将无法实施。所以在电话拥有率不高的地区，电话调查这种方式就受到限制。另外，使用电话进行访问的时间不能太长，人们不愿意通过电话进行冗长的交谈，特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时，电话调查所使用的问卷要简单。最后，与面访式相比，电话调查由于不是面对面的交流，在被访者不愿意接受调查时，要说服他们就更为困难。

此外，搜集数据的方法还有观察式，即调查人员通过直接观测的方法获取信息。

7．简述季节指数的计算步骤。

【答案】以移动平均趋势剔除法为例，计算季节指数的基本步骤为：

，（1）计算移动平均值（如果是季度数据采用4项移动平均，月份数据则采用12项移动平均）

并将其结果进行“中心化”处理，也就是将移动平均的结果再进行一次2项的移动平均，即得出“中心化移动平均值”

（2）计算移动平均的比值，也称为季节比率，即将序列的各观察值除以相应的中心化移动平均值，然后再计算出各比值的季度（或月份）平均值。

（3）季节指数调整。由于各季节指数的平均数应等于1或100%，若根据第2步计算的季节比率的平均值不等于1时，则需要进行调整。具体方法是：将第（2）步计算的每个季节比率的平均值除以它们的总平均值。

8．简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差，其中最常用的是方差和标准差。

（1）极差是指一组数据的最大值与最小值之差。用R 表示，其计算公式为：

极差是描述数据离散程度的最简单测度值，计算简单，易于理答，但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息，不能反映出中间数据的分散状况，因而不能准确描述出数据的分散程度。

（2）平均差也称平均绝对离差，它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心，反映了每个数据与平均数的平均差异程度，它能全面准确地反映一组数据的离散状况。平均差越大，说明数据的离散程度越大；反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题，平均差在计算时对离差取了绝对值，以离差的绝对值来表示总离差，这就给计算带来了不便，因而在实际中应用较少。但平均差的实际意义比较清楚，容易理答。

（3）方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号，然后再进行平均，方差开方后即得到标准差，方差或标准差能较好地反映出数据的离散程度，是实际中应用最广泛的离散程度测度值。与方差不同的是，标准差是具有量纲的，它与变量值的计量单位相同，其实际意义要比方差清楚。因此，在对实际问题进行分析时更多地使用标准差。

二、计算题

9．某大学为了答学生每天上网的时间，在全校7500名学生中采取重复抽样方法随机抽取36人，调查他们每天上网的时间，得到下面的数据（单位：小时）：

求该校大学生平均上网时间的置信区间，置信水平为95%

当前位置：问答库＞考研试题

相关题目: