2018年大连海洋大学生物医学工程812统计学概论考研基础五套测试题
● 摘要
一、简答题
1. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?
【答案】不是。
显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。
当两个事件相互独立时,
当两个事件不相互独立时
,⑴ ⑵
记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左
撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。
2. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:
(1)值能告诉我们什么信息?
(2)当相应的值较小时为什么要拒绝原假设?
(3)显著性水平与值有何区别?
【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。
(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。
(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。
(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,
如果选择的值相同,
所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。
3. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在之间。若
表明变量
关关系;若表明x 与y 之间存在负线性相关关系;若
第 2 页,共 49 页 之间存在正线性相表明x 与y 之间为完全正线性
相关关系;若
相关关系。
当
表明x 与y 之间为完全负线性相关关系。可见当时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性说明两个变量之间的线性关系越强
时. 可视为中度相关;说明两个变量之间的线性关系越弱。对于一时,
可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当时。视为低度相关;
当
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
4. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。
【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。
此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用
或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法值。
5. 说明条形图和直方图的区别和联系。
【答案】(1)条形图与直方图的区别
①形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少, 矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
②由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 ③条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
第 3 页,共 49 页 法,但使用方差-协方差矩阵的稳健估计
(2)联系
两者都是用矩形表示数据分布情况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。
6. 统计数据质量的基本标准是什么?
【答案】(1)准确:用数字语言来反映客观实际;(2)快速:统计信息服务必须具有时效性和紧迫性;(3)完整:调查单位没有遗漏,调查项目没有缺陷,资料数据齐全;(4)精练:统计信息具有针对性、有效性、精确性。
7. 简述平稳序列和非平稳序列的含义。
【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。
(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
8. 给出在一元线性回归中:
(1)相关系数的定义和直观意义;
(2)判定系数的定义和直观意义;
(3)相关系数和判定系数的关系。
【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
称为样本相关系数,记为r 。样本
相关系数的计算公式为:
按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。
(2)回归平方和占总平方和的比例称为判定系数,记为
第 4 页,共 49 页 其计算公式为:
相关内容
相关标签