当前位置:问答库>考研试题

2017年中国地质大学(武汉)经济管理学院958统计学原理之统计学原理考研仿真模拟题

  摘要

一、简答题

1. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述

式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。

2. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。

【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知参数的真值,这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量,即在均方误差

是的一个无偏估计量,都有

则称是的一致最小方差无偏估计。

最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量

3. 统计分组标志选择的原则。

【答案】在进行统计分组标志选择时要遵循三个原则:

(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。

(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本 质的标志进行分组。

(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经 济条件下,选择的分组标志也不一样,要根据情况的变化而变化。

4. 在研宄方法上,参数估计与假设检验有什么相同点和不同点?

【答案】(1)参数估计和假设检验的相同点

①是根据样本信息推断总体参数;

②都以抽样分布为理论依据,建立在概率论基础之上的推断,推断结果都有风险;

③对同一问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。

(2)参数估计和假设检验的不同点

①参数估计是以样本资料估计总体参数的可能范围,假设检验是以样本资料检验对总体参数的先验假设是否成立;

②区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;

③区间估计立足于大概率,通常以较大的把握程度(可信度)

成立。

5. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

去估计总体参数的置信区间;假设检验立足于小概率,

通常是给定很小的显著性水平去检验对总体参数的先验假设是否

6. 抽样误差影响因素分析。

【答案】影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的 抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

7. 简述时间序列的组成要素。

【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;

(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

8. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

二、计算题

9. 某公司的一种设备从甲、乙、丙三个厂进货。甲、乙、丙三厂的进货比例分别占

甲、乙、丙三厂生产的设备的次品率分别为和

(1)现从这批进货中任取一件,求取到的设备是次品的概率;

(2)经检验发现取到的设备是次品,求该设备是丙厂生产的概率。

【答案】(1)记事件

根据全概率公式可得,

分别表示“产品来自甲、乙、丙厂”,事件为取到次品。 和