当前位置:问答库>考研试题

2017年大连海洋大学生物医学工程812统计学概论考研仿真模拟题

  摘要

一、简答题

1. 简述非抽样误差类型。

【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:

(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。

(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。

(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。

(4)调查员误差,是指由于调查员的原因而产生的调查误差。

(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。

2. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用

值。

第 2 页,共 40 页 检验,检验方程是否存在一阶自相关问题,或采用或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计

3. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。

【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即

(2)回归平方和(^狀)是各回归值

来解释的变差部分。

(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即

称为误差平方和。

(4)三者之间的关系

4. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

【答案】单因素方差分析的实质是研宄一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为:

(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。

(2)构造检验统计量,计算各样本均值(3)计算样本统计量

(4)统计决策。比较统计量拒绝原假设。

5. 抽样误差影响因素分析。

【答案】影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的 抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

6. 方差分析中的基本假定。

【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差

的。

第 3 页,共 40 页 与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又 样本总均值 的值。若误差平方和 拒绝原假设;反之,不能必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独立

7. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?

【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。

不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。

(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。

8. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?

【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当

然相当好,此时随机变量X 的分布是相对于其平均值

大于或等于5时,近似的效果就相当好。

时,二项分布的正态近似仍和都对称的。当p 趋于0或1时,二项分 只要当n 大到使布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说,

二、计算题

9. 设二维离散随机向量的分布列为

问:(1) X 与Y 是否相关?

(2)X 与Y 是否独立?

【答案】(1)由的联合分布可以分别得到X 和Y 的概率分布分别为:

可求得X 和F 的期望

的概率分布为:

第 4 页,共 40 页