当前位置:问答库>考研试题

2017年大连海洋大学921统计学(同等学力加试)复试仿真模拟三套题

  摘要

一、简答题

1. 简述搜集数据的基本方法及其弱点。

【答案】搜集数据的基本方法:

(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。

(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。

(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,电话调查由于不是面对面的交流,在被访者不愿意接受调查 时,要说服他们就更为困难。

此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。

2. 全概率公式与逆概率公式分别用于什么场合?

【答案】(1)全概率公式为:

其中,是互不相容的事件且

如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些事件下A 的条件概率较易于确定,就可以用全概率公式。

(2)逆概率公式也称贝叶斯公式,即

式中:

发生概率。

第 2 页,共 23 页 表示完备事件组。 中每个事件的逆概率公式是要在事件A 已经发生的条件下来计算完备事件组

3. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?

【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。

影响抽样平均误差的因素有四个:

(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。

(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。

(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。

(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

4. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。

【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即

(2)回归平方和(^狀)是各回归值

来解释的变差部分。

(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即

称为误差平方和。

(4)三者之间的关系

5. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?

【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。

6. 简述概率抽样与非概率抽样的区别。

【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研宄目的

第 3 页,共 23 页 与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又

对数据的要求, 采用某种方式从总体中抽出部分单位对其实施调查。

(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存 在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在 进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机 原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

二、计算题

7. 对某地打土方的工人按重复抽样的方法抽取144个工人进行调查,得出平均每人完成工作量为立方米,标准差为

要求计算:

(1)以的概率保证,计算全部工人平均完成工作量将落在什么范围之内。

立方米时,应抽取多少工人。 (2)按上述(1)的条件,当抽样误差不超过

果有何关系。

【答案】(1)在

区间为:

(2)

(3)准确性増加一倍,即3600人。

8. 已知用最小二乘方法得到的样本回归方程为

【答案】因为所以有:

又因为

由于是根据最小二乘法得到的,所以有:

第 4 页,共 23 页 立方米。 (3)按照上述(2)的条件,如果准确性增加一倍,又应抽取多少工人? 说明它与(2)的结的概率保证下,则全部工人平均完成工作量的置信立方米。 即故应至少抽取900人。 缩小到原来的所以n 应该扩大到原来的四倍,即应抽取试证明