2018年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研核心题库
● 摘要
一、简答题
1. 统计数据质量的基本标准是什么?
【答案】(1)准确:用数字语言来反映客观实际;(2)快速:统计信息服务必须具有时效性和紧迫性;(3)完整:调查单位没有遗漏,调查项目没有缺陷,资料数据齐全;(4)精练:统计信息具有针对性、有效性、精确性。
2. 什么叫变异、变量和变量值,试举例说明。
【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。
变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:
(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;
“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、“次品”等;
(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……
3. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间
【答案】记赢钱数为则的函数定义为:
则有
于是X 的概率分布为:
以及随机变量X 的定义和概率分布。
其中
为投掷后出现的两种结果,令
4. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
【答案】(1)总平方和(S^T)是实际观测值
与其均值的离差平方和,即
(2)回归平方和(^狀)是各回归值来解释的变差部分。
(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即
称为误差平方和。
(4)三者之间的关系
5. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。
【答案】(1)多元回归模型:设因变量为个自变量分别为y 如何依赖于自变量
式中
(2)多元回归方程:
根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量
(3)估计的多元回归方程:
回归方程中的参数数据去估计它们。当用样本统计
量
时,就得到了估计的
多元回归方程,其一般形式为:
式中
是参数
称为偏回归系数。
6. 试述统计总体及其特征。
【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,
与实际观测值的均值y 的离差平方和,即
其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线
它是除了
的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又
描述因变量
为误差项。
称为多元回归
和误差项的方程称为多元回归模型。其一般形式可表示为
:
是模型的参数
之间的关系。
是未知的,需要利用样本
去估计回归方程中的未知参
数
的估计值是因变量y 的估计值。其中
如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。
总体具有的特征包括:(1)同质性,即总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是 构成总体的条件;(2)大量性,即构成总体的总体单位数目要足够多;(3)差异性,即总体单位必须具有一个或 若干个品质变异标志或数量变异标志。
二、计算题
7. 抽样调查某地区50户居民的月消费品支出额数据资料,如表1所示(单位:元)。
表
1
要求:
(1)试根据上述资料编制频数分布表。(2)编制向上和向下累积频数、频率分布表。
【答案】(1)编制次数分布和频率分布表,如表2所示。
表2 居民户月消费品支出额频数分布和频率分布表
(2)编制向上累积和向下累积频数以及频率分布表,如表3、4所示。
表3 居民户月消费品支出额向上累积表