当前位置:问答库>考研试题

2017年哈尔滨工业大学应用统计考研复试核心题库

  摘要

一、简答题

1. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?

【答案】相关系数r 的取值范围在关关系;若相关关系;若相关关系。

说明两个变量之间的线性关系越强时. 可视为中度相关

说明两个变量之间的线性关系越弱。对于一

时,

可视为高度相关时,说明两个变量之间的

个具体的r 取值,根据经验可将相关程度分为以下几种情况:

时。视为低度相关;当

之间。若

表明变量

之间存在正线性相

表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当

表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,

二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性

相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

2. 何谓统计量?分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?

【答案】设函数又称出

是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数

为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。

从以上统计量的定义可以看出,当. 赖于任何未知参数时,则.

未知参数,则它们就不是统计量。

分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。t 分布:一般当

时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本

理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。

F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。

3. 全概率公式与逆概率公式分别用于什么场合?

【答案】(1)全概率公式为:

其中,

是互不相容的事件且

分布、t 分布、F 分布是由样本构造的函数,而且不依

分布、t 分布、F 分布中含有

分布、t 分布、F 分布就是统计量;若

是一个统计量。通常,

时,代入T ,计算

如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些

事件下A 的条件概率较易于确定,就可以用全概率公式。

(2)逆概率公式也称贝叶斯公式,即

式中:

表示完备事件组。

中每个事件的

逆概率公式是要在事件A 已经发生的条件下来计算完备事件组发生概率。

4. 简述时间序列的预测程序。

【答案】在对时间序列进行预测时,通常包括以下几个步骤: (1)确定时间序列所包含的成分,也就是确定时间序列的类型; (2)找出适合此类时间序列的预测方法;

(3)对可能的预测方法进行评估,以确定最佳预测方案; (4)利用最佳预测方案进行预测。

5. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为y 如何依赖于自变量

式中

(2)多元回归方程:

根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

式中

是参数

称为偏回归系数。

6. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

的估计值之间的关系。 个自变量分别为

是模型的参数

描述因变量

为误差项。

称为多元回归

是未知的,需要利用样本

和误差项的方程称为多元回归模型。其一般形式可表示为

去估计回归方程中的未知参

是因变量y 的估计值。其中

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性

就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

二、计算题

7. 对表1中的数据分别拟合线性趋势线

并对结果进行比较。

1

二阶曲线

和三阶曲线

【答案】在求二阶曲线和三阶曲线时,首先将其线性化,然后用最小二乘法按线性回归进行求解。用Excel 求得的趋势直线、二阶曲线和三阶曲线的系数,如表2所示。

2

所以各趋势方程为: 线性趋势二阶曲线三阶曲线

根据趋势方程求得的预测值和预测误差,如图所示。