2018年首都医科大学附属北京安定医院347心理学专业综合[专硕]之现代心理与教育统计学考研基础五套测试题
● 摘要
一、概念题
1. 非参数检验
【答案】非参数检验指对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验。常见的非参数检验有符号检验、秩和检验、中数检验等。其优点:(1)不需要对被检验的总体作出关于正态性或其他特定分布的假定;(2)容易理解、容易操作、应用范围广。缺点是功效较低,因为它常会丢失数据中的信息。经常属于大样本检验。
2. 逐步回归
【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。
3. 描述统计
【答案】描述统计指研宄如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。
4. 分层随机抽样
【答案】分层随机抽样是抽样方式的一种。按照总体已有的某些特征,将总体分成几个不同的部分(层),再分别在每部分中随机抽样,这种抽样的方法称为分层随机抽样。总原则是:各层内的变异要小,层与层间的变异越大越好。分层抽样充分利用了总体己知的信息,其样本代表性及推论的精确性一般优于简单随机抽样。对于同一总体,n 相同时,分层抽样误差小于简单随机抽样误差。
5. 随机原则
【答案】随机原则指在进行抽样时,总体中每一个个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能性使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的
某些特征在样本中得以表现。这时可以说随机样本可以保证样本代表总体。
6. 相关系数
【答案】相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。绝对值接近1.00端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。
二、简答题
7. 简述编制分组次数分布表的步骤。
【答案】(1)求全距。全距指最大数和最小数两个数据值之间的差距。从被分组的数据中找出最大数和最小数,二者相减所得差数就是全距。
(2)决定组距与组数。组距是指任意一组的起点和终点之间的距离,用符合i 表示。决定组距的大小需要以全距为参考。全距大,则组距可以大一些;全距小,则组距可以小一些。
组数的多少根据组距的多少来定。如果数据个数在100以上,习惯上一般分10〜20组,但经常取12〜16组。数据个数较少时,一般分为7〜9组。如果数据的总体分为正态,那么可以用下面的经验公式计算组数(K ),这样可使分组满足渐进最优关系。
为数据个数,K 取近似整数)。
(3)列出分组区间。分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限有表述组限和精确组限两种。在列出分组区间时要注意:最高组区间应包含最大的数据,最小组应包含最小的数据;最大组或最小组最好是组距i 的倍数;各分组区间一般在纵坐标上按照顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面;等级次数时,要按照精确组限将数据归类划分到相应的组别中。
(4)等级次数。依次将数据等级到各个相应的组别内,一般用画线计数或写“正”字的方法。
(5)计算次数。根据登记的结果计算各组的次数,计算各组次数的总和即总次数。另外,要核对各组次数总和与数据的总个数是否相等。
8. 什么是二元线性标准回归方程?
【答案】二元线性回归方程是指y
对用公式表示
对与
位,所引起y 改变
个单位。
当两个自变量的单位不同,不能直接比较它们在估计y 时的贡献。若要进行这种比较,需要将原始数据分别转换成标准分数,以标准分数建立的回归方程就叫做标准回归方程。一般的
(N 与的线性回归方程。 与的共同估计值,为常数项,与表示当固定不变时,是y 每变化一个单式中; K 为个单位;表示当的偏回归系数。在二元线性标准回归中,固定不变时,每变化一个单位时,所引起y 改变
形式为:标准分数的估计值, 和其中表示因变量y 的标准分数的估计值。和分别表示以叫标准偏回归系数。
9. 假设两变量为线性关系,计算下列各种情况的相关时,应用什么方法?
(1)两列变量是等距或等比的数据且均为正态分布;
(2)两列变量是等距或等比的数据但不为正态分布;
(3)—变量为正态等距变量,另一列变量也为正态变量,但人为分为两类;
(4)一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类;
(5)—变量为正态等距变量,另一列变量为二分名义变量;
(6)两变量均以等级表示。
【答案】
(1)积差相关法
(2)斯皮尔曼等级相关法
(3)二列相关法
(4)肯德尔W 系数
(5)点二列相关法
(6)肯德尔等级相关法。
10.度量离中趋势的差异量数有哪些? 为什么要度量离中趋势?
【答案】(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。
(2)度量离中趋势的必要性
在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。因此,只用集中量数不可能真实地反映出它们的分布情形。为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
11.一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?为什么?举例说明。
【答案】不能说明两水平的均数间没有差异。
(1)相关关系是指两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定两类现象之间哪个是因,哪个是果。相关的情况可以有三种:一种是两列变量变动方向相同,即一种变量变动时,另一种变量也同时发生或大或小与前一种变量同方向的变动,称为正相关。如身高与体重的关系。第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列