2017年西北师范大学913统计学复试仿真模拟三套题
● 摘要
一、简答题
1. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?
【答案】不是。
显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。
当两个事件相互独立时,
当两个事件不相互独立时
,⑴ ⑵
记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左
撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。
2. 二项分布与超几何分布的适用场合有什么不同?它们的均值和方差有什么区别?
【答案】(1)从理论上讲,二项分布只适合于重复抽样(即从总体中抽出一个个体观察完后放回总体,然后再抽下一个个体)。但在实际抽样中,很少采用重复抽样。不过,当总体的元素数目况很大而样本量, 相对于AT 来说很小时,二项分布仍然适用。
但如果是采用不重复抽样,各次试验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本量 «相对于W 来说较大时,二项分布就不再适用,这时,样本中“成功”的次数则服从超几何概率分布。
(2)若X 服从二项分布若Y 服从超几何分布
3. 抽样误差影响因素分析。
【答案】影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的 抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
4. 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否己知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。
【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大
第 2 页,共 24 页 则则
样本情况。 !还是小样本此外还需要区分总体是否服从正态分布、总体方差是否已知等几种
总体方差
(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为
为当总体方差已知时,总体均值的检验统计量为:
当总体方差
为:
(2)在小样本情况下,假设总体服从正态分布: ①当总体方差未知时,可以用样本方差来近似代替总体方差,此时总体均值检验的统计量 已知时,样本均值的抽样分布近似服从正态分布。总体均值检验的统计量为:
②当总体方差未知时,需要用样本方差代替总体方差样本均值的抽样分布服从自由度为(n -l )的t 分布。因此需要采用t 分布来检验总体均值。检验的统计量为:
5. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态
第 3 页,共 24 页
分布或单峰偏态分布逼近。
6. 方差分析中的基本假定。
【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差立的。
必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独
二、计算题
7. 某银行分行1999年平均存款余额为1250万元,2003年的存款资料如表所示。
表
要求(1)计算该分行2003年的平均存款余额。
(2)计算该分行1999年至2003年存款余额的年平均增长速度。
(3)根据年平均增长速度推断2005的年平均存款余额。
(4)若该分行计划2007年的平均存款余额达到2000万元,那么从2003年到2007年存款余额的年平均增长速度应达到什么水平?
【答案】(1)2003年的平均存款余额
(2)1999年至2003年的年平均增长速度
(3)2005年的年平均存款余额为
(4)从2003年到2007
年存款余额的年平均增长速度
8. 某家用电器生产厂家主要生产空调、电冰箱和洗衣机三种产品,2000年,空调、电冰箱和洗衣机的总生产费用分别为1500万元、1200万元、1000万元。2001年三种产品的总生产费用分别增长了15.36%、3.88%、2.6%, 产品产量分别增长了12%、6%、8%。单位产品成本的变化情况是:空调增长了3%,电冰箱下降了2%, 洗衣机下降了5%。
(1)计算全部产品总生产费用增长的百分比及增长的绝对额。
(2)用2000年的总生产费用作权数,计算三种产品总产量增长的百分比,以及由于产量变动而增加的生产费用。
(3)用2001年的总生产费用作权数,计算三种产品单位成本增长的百分比,以及由于单位
第 4 页,共 24 页