当前位置:问答库>考研试题

2018年西安交通大学公共政策与管理学院718应用统计学之统计学考研仿真模拟五套题

  摘要

一、简答题

1. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……

2. 抽样误差影响因素分析。

【答案】影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的 抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

3. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:

(1)值能告诉我们什么信息?

(2)当相应的值较小时为什么要拒绝原假设?

(3)显著性水平与值有何区别?

【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。

(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉

我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。

(2)值是反映实际观测到的数据与原假设明实际观测到的数据与

之间不一致程度的一个概率值。值越小,说

之间不一致的程度就越大,检验的结果也就越显著。

(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,

如果选择的值相同,

所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。

4. 什么是置信区间估计和预测区间估计?二者有何区别?

【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;

预测区间估计,它是对x 的一个给定值

求出y 的一个个别值的估计区间,

这一区间称为预测区间。

(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;对同一个区间要比置信区间宽一些。

5. 简述估计量的无偏性,有效性和一致性。

【答案】(1)无偏性

若估计量

的数学期望等于未知参数

则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若

是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性

(3)—致性(相合性) 如果依概率收敛于则称

是的一致估计量。

且至少对于某一个

都是的无偏估计量,若对于任意

上式中的不等号成立,则称

有效。

即:

这两个区间的宽度也是不一样的,预测

二、计算题

6. 一学生接连参加同一课程的两次考试。第一次及格的概率为P ,若第一次及格则第二次及格的概率也为p ; 若第一次不及格则第二次及格的概率为

若至少有一次及格则他能取得某种资

格,求他取得该资格的概率。

【答案】设事件A 为第一次及格,事件B 为第二次及格,事件C

为至少有一次及格。则有

则至少有一次及格的概率:

即他取得该资格的概率为

7. 下面是随机抽取的30名排球、体操、游泳三个项目的运动员(各10名)的纵跳成绩(单位: 厘米),

论述:(只需完整的计算过程,不需具体计算结果)

(1)假设三个项目的运动员的纵跳成绩具有方差均等的正态分布,如何推断运动项目对纵跳成绩的影响;

(2)若数据中纵跳成绩的取值仅为“远”(例如上面数据中纵跳距离>68厘米,为“远”)或“近”,则如何推断运动项目对纵跳成绩的影响?

【答案】(1)设排球运动员的纵跳平均成绩为体操运动员的纵跳平均成绩为动员的纵跳平均成绩为

①提出假设:

②计算检验统计量Z7值。

其中

代入数据求得:则

③作出决策。 根据给定的显著性水平临界值

拒绝

分子自由度

和分母自由度

查F 分布表,找到相应的

表明之间的差异是显著的,也就是说运动项目对纵跳成绩的影响

游泳运

不全相等

厘米,