2017年哈尔滨工业大学应用统计考研复试核心题库
● 摘要
一、简答题
1. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若相关关系;若相关关系。
当
说明两个变量之间的线性关系越强时. 可视为中度相关
;
说明两个变量之间的线性关系越弱。对于一
时,
可视为高度相关时,说明两个变量之间的
个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当
时。视为低度相关;当
之间。若
表明变量
之间存在正线性相
表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当
表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,
二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
2. 何谓统计量?分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?
【答案】设函数又称出
是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数
为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。
从以上统计量的定义可以看出,当. 赖于任何未知参数时,则.
未知参数,则它们就不是统计量。
分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。t 分布:一般当
时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本
理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。
F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。
3. 全概率公式与逆概率公式分别用于什么场合?
【答案】(1)全概率公式为:
其中,
是互不相容的事件且
分布、t 分布、F 分布是由样本构造的函数,而且不依
分布、t 分布、F 分布中含有
分布、t 分布、F 分布就是统计量;若
是一个统计量。通常,
时,代入T ,计算
如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些
事件下A 的条件概率较易于确定,就可以用全概率公式。
(2)逆概率公式也称贝叶斯公式,即
式中:
表示完备事件组。
中每个事件的
逆概率公式是要在事件A 已经发生的条件下来计算完备事件组发生概率。
4. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤: (1)确定时间序列所包含的成分,也就是确定时间序列的类型; (2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案; (4)利用最佳预测方案进行预测。
5. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。
【答案】(1)多元回归模型:设因变量为y 如何依赖于自变量
式中
(2)多元回归方程:
根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量
(3)估计的多元回归方程:
回归方程中的参数数据去估计它们。当用样本统计
量
时,就得到了估计的
多元回归方程,其一般形式为:
式中
是参数
称为偏回归系数。
6. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
的估计值之间的关系。 个自变量分别为
是模型的参数
描述因变量
为误差项。
称为多元回归
是未知的,需要利用样本
和误差项的方程称为多元回归模型。其一般形式可表示为
:
去估计回归方程中的未知参
数
是因变量y 的估计值。其中
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。
数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性
就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。
二、计算题
7. 对表1中的数据分别拟合线性趋势线
并对结果进行比较。
表
1
二阶曲线
和三阶曲线
【答案】在求二阶曲线和三阶曲线时,首先将其线性化,然后用最小二乘法按线性回归进行求解。用Excel 求得的趋势直线、二阶曲线和三阶曲线的系数,如表2所示。
表
2
所以各趋势方程为: 线性趋势二阶曲线三阶曲线
根据趋势方程求得的预测值和预测误差,如图所示。