2018年湘潭大学公共管理学院723统计学(一)考研仿真模拟五套题
● 摘要
一、简答题
1. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。
【答案】(1)众数、中位数和平均数的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:
①如果数据的分布是对称的,众数中位数和平均数必定相等,即
②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:
③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,
则
(2)众数、中位数和平均数在实际中的应用
①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。
②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。
③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。
2. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。
【答案】(1)多元回归模型:设因变量为个自变量分别为
y 如何依赖于自变量式中(2)多元回归方程:
根据回归模型的假定有
方程,它描述了因变量y 的期望值与自变量
第 2 页,共 49 页 描述因变量为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为
:是模型的参数之间的关系。
(3)估计的多元回归方程:
回归方程中的参数
数据去估计它们。当用样本统计
量
时,就得到了估计的
多元回归方程,其一般形式为:
式中是参数称为偏回归系数。 的估计值是未知的,需要利用样本去估计回归方程中的未知参
数是因变量y 的估计值。其中
3. 何谓统计分组?统计分组有哪些作用?
【答案】根据统计研宄的目的和客观现象的内在特点,按某个标志(或几个标志)把被研宄的总体划分为若干个不同性质的组,称为统计分组。
统计分组的作用有:(1)发现社会经济现象的特点与规律;(2)将复杂的社会经济现象划分为性质不同的各种类型;(3)反映总体内部结构;(4)揭示现象之间的依存关系。
4. 简述系数、c 系数、系数的各自特点。
【答案】(1)
相关系数是描述列联表数据相关程度最常用的一种相关系数。它的计算公式为:式中,《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的列联表,是因为对于
计算公式为:
列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即
5. 构造下列维数的列联表,并给出则V 值就等于值。 检验的自由度。
a.2行5列 b.4行6列 c.3行4列
【答案】i 行j 列联表,如表所示。
第 3 页,共 49 页
而
a. 当
b. 当
c. 当
检验的自由度=(行数_1)(列数一 1),所以 时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其检验的自由度=检验的自由度=检验的自由度=
二、计算题
6. 某艺术家拍卖会上油圆价格和油画年龄的关系。研宄收集25个样本,数据见表1。以油画价格为因变量,油画年龄为自变量建立一元线性回归模型,结果见表2。
表
1
表
2
就上述结果,试写一份报告,答释油画年龄如何影响油画价格。报告中至少涵盖以下内容: (1)油画年龄如何影响油画价格的线性模型是什么?
(2)前述模型是否合理?
(3)按前述模型,哪些油画被低估了。:Excel 输出的回归结果,如表3、4和5所示。
表3回归结果
第 4 页,共 49 页
相关内容
相关标签