当前位置:问答库>考研试题

2018年清华大学社会科学学院312心理学专业基础综合之现代心理与教育统计学考研基础五套测试题

  摘要

一、概念题

1. 推论统计

【答案】推论统计又称推断统计,主要研宄如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。这是推论统计要研宄的内容,常用的统计方法有:假设检验

的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。

2. 参数

【答案】参数(parameter )在数理统汁中,反映一个统计量或随机变量的分布特征的参变量。对于参数统计来讲,分布依赖的参数是有限个数(其实只确很少几个)。只要参数确定,则分布也确定了。参数可在一定允许范围内取值。它便确定了一个分布族。如正态分布与两个参数。它们的取值允许范围是

的参数不是有限的,其统计方法只能是非参数方法或自由分布方法。

3. 相关系数

【答案】相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。绝对值接近1.00端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。

4. 分层随机抽样

【答案】分层随机抽样是抽样方式的一种。按照总体已有的某些特征,将总体分成几个不同的部分(层),再分别在每部分中随机抽样,这种抽样的方法称为分层随机抽样。总原则是:各层内的变异要小,层与层间的变异越大越好。分层抽样充分利用了总体己知的信息,其样本代表性及推论的精确性一般优于简单随机抽样。对于同一总体,n 相同时,分层抽样误差小于简单随机抽样误差。

只含有

。对于非参数统计来讲,分布依赖

二、简答题

5. 线性回归的基本假设是什么?

【答案】(1)线性关系假设

X 与Y 在总体上具有线性关系,这是一条最基本的假设。回归分析必须建立在变量之间具有线性关系的假设成立上。如果X 与Y 的真正关系不是线性,而回归方程又是按线性关系建立的,这个回归方程就没有什么意义了。非线性的变量关系,需使用非线性模型。

(2)正态性假设

正态性的假设系指回归分析中的Y 服从正态分布。这样,与某一个

量Y 的一个子总体,所有这样的子总体都服从正态分布,其平均数记作各个子总体的方差都相等。因此经由回归方程式所分离的误差项e ,即由特定与实际值对应的Y 值构成变方差记作所预测得到的之间的差距,也应呈正态分布。误差项e 的平均数为0。所以,也有人指出线性回归中应满足变量X 没有测量误差这一严格假设,但在实际中很难满足,常常只是对X 的测量误差忽略不计。

(3)独立性假设

①指与某一个X 值对应的一组F 值和与另一个X 值对应的一组7值之间没有关系,彼此独立。

②指误差项独立,不同的X 所产生的误差之间应相互独立,无自相关

误差项也需与自变量X 相互独立。

(4)误差等分散性假设

特定X 水平的误差,除了应呈随机化的常态分配,其变异量也应相等,称为误差等分散性。不相等的误差变异量(即误差变异歧异性,),反应出不同水平的X 与Y 的关系不同,不应以单一的回归方程式去预测Y 。当研究资料具有极端值存在时,或非线性关系存

在时,误差变异歧异性的问题就容易出现。违反假设时,对于参数的估计检验力就会变得不足。

6. 简述使用积差相关系数的条件。

【答案】积差相关又较积矩相关,是求直线相关的基本方法。积差相关系数适合的情况如下:

(1)两列数据都是测量数据,而且两列变量各自总体的分布是正态的,即正态双变量。为了判断计算相关的两列变量其总体是否为正态分布,一般要根据已有的研究资料进行查询。如果没有资料查询,研究者应取较大样本分别对两变量作正态性检验。这里只要求保证双变量总体为正态分布,而对要计算相关系数的两样本的观测数据并不一定要求正态分布。

(2)两列变量之间的关系应是直线性的。如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否直线式,可以作相关散布图进行线性分析。相关散布图是以两列变量中的一列变量为横坐标,以另一变量为纵坐标,画散点图。如果呈椭圆形则说明两列变量

是线性相关的,如果散点是弯月状(无论弯曲度大小或方向),说明两变量之间呈非线性关系。

(3)实际测验中,计算信度涉及的积差相关时,分半的两部分测验须满足在平均数、标准

差、分布形态、测题间相关、内容、形式和题数都相似的假设条件。

另外,积差相关要求成对的数据,即若干个体中每个个体都有两种不同的观测值。任意两个个体之间的观测值不能求相关。每对数据与其他对数据相互独立。计算相关的成对数据的数目不少于30对,否则数据太而缺乏代表性。

7. 回归分析与相关分析的区别和联系是什么?

【答案】相关分析和回归分析的联系是:它们通常都是基于两正态连续变量的假设,都是处理两变量间相互关系的统计方法,通常两种方法不同时出现在文章中;

二者的区别是作为相互关系分析的方法,相关分析是通过提供一个相关系数来考察两变量间的联系程度,而回归分析则是重在建立两变量间的函数关系式,因此通常可以先考察相关系数的显著型,如果显著则可以进一步考虑建立变量间的回归方程。此外,相关分析和回归分析又各有一些具体方法用于处理不同的情况,如相关分析还包括等级相关,质量相关和品质相关,回归分析还包括非线性回归等。

8. 简述算术平均数的使用特点

【答案】算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。计算公式:式中N 为数据个数,为每一个数据,为相加求和。

(1)算术平均数的优点是:①反应灵敏;②严密确定。简明易懂,计算方便;③适合代数运算;④受抽样变动的影响较小。

(2)除此之外,算数平均数还有几个特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数。②用加权法可以求出几个平均数的总平均数。③用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

(3)算术平均数的缺点:①易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。

三、计算题

9. 下面是某校几年来毕业生的人数,问平均增加率是多少? 并估计10年后的毕业人数有多少。

【答案】(1)根据题意,应用公式3.6d :

代入数据,得

(2)10年的毕业人数约有:

,求平均增长率。