当前位置:问答库>考研试题

2017年首都经济贸易大学城市经济与公共管理学院702统计学考研强化模拟题

  摘要

一、简答题

1. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

2. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立) (其中是行变量,是列变量)

选取统计量:

(其中,

第i 行第j 列类别的期望频数;并且

第 2 页,共 55 页 为列联表中第i 行第j 列类别的实际频数; 为列联表中

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

3. 要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?

【答案】方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的检验。随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会増加(并非均值真的存在差别)。而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

4. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?

【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为

由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性

犯取伪错误的可能性 势必增大也就是说

的大小和显著性水平的大小成相反方向变化。解决的唯一办法只有增大样本容量,这样既能保证满足取得较小的又能取得较小的值。

5. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?

【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。

6. 简述非抽样误差类型。

【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:

(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。

(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。

(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。

第 3 页,共 55 页

(4)调查员误差,是指由于调查员的原因而产生的调查误差。

(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。

7. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?

【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。

影响抽样平均误差的因素有四个:

(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。

(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。

(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。

(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

8. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

9. 中心极限定理。

【答案】设随机变量

也就是说,当n 趋于无穷大时,

第 4 页,共 55 页 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方

差的分布趋向于标准正态分布