2017年西南财经大学统计学(数理统计+经济统计)考研复试核心题库
● 摘要
一、简答题
1. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。
【答案】(1)众数、中位数和平均数的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:
①如果数据的分布是对称的,众数中位数和平均数必定相等,即
②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:
③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,
则
(2)众数、中位数和平均数在实际中的应用
①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。
②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。
③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。
2. 多元线性回归模型中有哪些基本的假定?
【答案】多元回归模型的基本假定有:
(1)自变量
(3)对于自变
量
(4)误差项是一个服从正态分布的随机变量,且相互独立,即
是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方
差都相同,且不序列相关,
即的所有
值(2)误差项是一个期望值为0的随机变量,即
3. 简述方差分析的基本原理。
【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。
4. 说明回归模型的假设以及当这些假设不成立时的应对方法。
【答案】(1)多元回归模型的基本假定有: ①自变量
③对于自变
量
④误差项是一个服从正态分布的随机变量,且相互独立,即
(2)若模型中存在多重共线性时,解决的方法有:
第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。
第二,如果要在模型中保留所有的自变量,那就应该:避免根据统计量对单个参数进行检验;对因变量Y 值的推断(估计或预测)限定在自变量样本值的范围内。
若模型中存在序列相关时,解决的方法有:如果误差项不是相互独立的,则说明回归模型存在序列相关性
,这时首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的自变量,则应増加自变量;如果以上两种方法都不能消除序列相关性,则需采用迭代法、差分法等方法处理。
若模型中存在异方差性时,解决的方法有:当存在异方差性时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。
5. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?
【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模
型对样本观测值的拟合优度。这是由于多重判定系数
随着样本解释变量个数的增加
是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方
差都相同,且不序列相关,
即
的所有
值②误差项s 是一个期望值为0的随机变量,即 的值越
来越高(即是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新
不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,
调整。而修正判定系数
归模型方面要优于多重判定系数修正判定系数的计算公式为
6. 在盒子图(箱线图)的作图中,会使用哪些描述指标。
【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot ),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。
其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回二、计算题
7. 某企业生产三种产品的成本支出资料如表所示。
表
要求:(1)计算总成本指数、单位成本指数和产量指数。
(2)分析各因素变动对总成本指数影响的相对程度和绝对额。
【答案】(1
)令总成本指数为
单位成本指数为
产量指数为则一季度成本支出总额=20+45+35=100(万元),二季度成本支出总额=18+50+52=120(万元)。所以总成本指数为:
单位成本指数为:
甲产品的产量变化为
别为:116.96%和165.08%。
同理可求得乙、丙的产量变化分
相关内容
相关标签