2017年新疆财经大学统计与信息学院432统计学[专业学位]考研仿真模拟题
● 摘要
一、简答题
1. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。
【答案】(1)众数、中位数和平均数的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:
①如果数据的分布是对称的,众数中位数和平均数必定相等,即
②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:
③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,
则
(2)众数、中位数和平均数在实际中的应用
①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。
②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。
③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。
2. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?
【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。
影响抽样平均误差的因素有四个:
(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。
(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。
(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N
非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。
(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
3. 回归分析结果的评价。
【答案】对回归分析结果的评价可以从以下四个方面入手:
(1)所估计的回归系数的符号是否与理论或事先预期相一致;
(2)如果理论上认为
归方程也应该如此;
(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;
(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,
都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的
简单方法是画出残差的直方图或正态概率图。
4. 简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述
式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的列之间的关系不仅是正的,而且是统计上显著的,那么所建立的回联表,是因为对于
计算公式为:
列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即
5. 构造下列维数的列联表,并给出则V 值就等于值。 检验的自由度。
a.2行5列 b.4行6列 c.3行4列
【答案】i 行j 列联表,如表所示。
而
a. 当
b. 当
c. 当,所以 检验的自由度=(行数_1)(列数一 1)时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其检验的自由度=检验的自由度=检验的自由度=
6. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。
【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。
此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用
或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法值。
7. 试述统计总体及其特征。
【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。
法,但使用方差-协方差矩阵的稳健估计
相关内容
相关标签