2018年中国矿业大学(徐州)管理学院891统计学A之统计学考研仿真模拟五套题
● 摘要
目录
2018年中国矿业大学(徐州)管理学院891统计学A 之统计学考研仿真模拟五套题(一) .. 2 2018年中国矿业大学(徐州)管理学院891统计学A 之统计学考研仿真模拟五套题(二) 10 2018年中国矿业大学(徐州)管理学院891统计学A 之统计学考研仿真模拟五套题(三) 21 2018年中国矿业大学(徐州)管理学院891统计学A 之统计学考研仿真模拟五套题(四) 31 2018年中国矿业大学(徐州)管理学院891统计学A 之统计学考研仿真模拟五套题(五) 40
一、简答题
1. 简述假设检验的过程。
【答案】假设检验的过程如下:
(1)根据所研宄问题的要求提出原假设
(或称为零假设、无效假设)和备择假设
确
定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定 值,以值与显著性水平比较,若则拒绝接受
若则不拒绝
2. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间以及随机变量X 的定义和概率分布。
【答案】记赢钱数为为投掷后出现的两种结果,令其中
则的函数定义为:
则有
于是X 的概率分布为:
3. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
4. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为
就知道该数值低于平均数1.5倍的标准差。在对
多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
5. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在之间。若
表明变量关关系;若相关关系;若相关关系。
当
说明两个变量之间的线性关系越强
说明两个变量之间的线性关系越弱。对于一
时,可视为高度相关
个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当
式中为变量的标准化值,是该组数据均值,s 为该组数据的
之间存在正线性相
表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当
表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,
二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
时. 可视为中度相关;时。视为低度相关;
当时,说明两个变量之间的
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
二、计算题
6. 离散型随机变量X 的概率分布率如下。
(1)确定概率分布率中a 的值。 (2)试给出随机变量X 的分布
(3)计算随机变量X 的均值和方差。
【答案】(1)根据离散型随机变量的概率分布列的正则性,即得
当当当当
(2)当
时,时,时,时,时,
可知:
所以随机变量X 的分布为:
7. 分别从上海证券市场和深圳证券市场各抽取了 25只和31只股票计算出它们的收益率,算出其样本方差分别为益率服从正态分布。
【答案】提出假设:
检验统计量的值为:
(收益率的方差可反映证券风险,方差越大,则可认为其
假定收
风险越大)。试问上海证券市场与深圳证券市场的投资风险是否有显著性差异