2018年宁波大学教师教育学院312心理学专业基础综合之现代心理与教育统计学考研核心题库
● 摘要
一、概念题
1. 频率
【答案】频率(frequency )①亦称“相对频数”。某随机事件A , 在N 次试验中出现的次数n 与试验总次数N 的比值。亦称事件A 发生的频率。记为其值介于0〜1之间。事件的频率越大,说明它出现的可能性越大;反之则越小。一个事件的频率不是一个固定的数值,与总次数N 有关,且即使再重复N 次试验,次数n 也可能不同。但在大量重复试验中频率具有稳定性,即当试验次数N 无限增大时,频率F 会在某个固定值上下波动,而且偏差越来越小。②简谐振动基本物理量。物体每秒振动的次数。单位是赫兹(Hz )。在数学关系上频率是物体振动周期的倒数。
2. 逐步回归
【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。
3. 个体
【答案】个体(individual )亦称“单位”、“样品”,统计学术语指总体中的每一个单位、样品或成员。是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。在心理学研宄中,个体根据研宄目的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。
4. 四分差
【答案】四分差又称四分位差,是差异量数的一种。计算公式:
位数,第三个四分第一个四分位数。在次数分配上第一个四分位数与第三个四分位数之间包含着全体项数的一半。次数分配越集中,离中趋势越小,则这二者的距离也越小。根据这两个四分位数的关系,观测次数分配的离散程度也可以得到相当高的准确性。因此,四分差可以说明某系列数据中间部分的离散程度,并可避免两极端值的影响。四分差通常与中数联系起来共同应用,不适合进
一步代数运算,反应不够灵敏。
二、简答题
5. 独立样本和相关样本之间的差别是什么?
【答案】相关样本是指两个样本的数据之间存在一一对应的关系。而独立样本是指两个样本数据相互独立,不存在一一对应关系。
在显著性检验中,相关样本的t 检验一般不需要事先进行方差齐性检验。因为相关样本是成对数据,即两组数据存在对应关系,这样可以求出对应数据的差,使对两组数据均值差的显著性检验转化为对d 的显著性检验。而独立样本的数据不是成对的,即使两组数据的样本数相同,两组数据也不存在一一对应关系,因而不可能有对应值的差d ,只能以两个样本方差共同对总体方差进行估计(即求联合方差),必须以两组数据的方差相等为前提。
统计分析中,在考虑是参数还是非参数检验后,需要考虑是独立样本还是相关样本。这样涉及选择不同的检验方法。
6. 简述使用积差相关系数的条件。
【答案】积差相关又较积矩相关,是求直线相关的基本方法。积差相关系数适合的情况如下:
(1)两列数据都是测量数据,而且两列变量各自总体的分布是正态的,即正态双变量。为了判断计算相关的两列变量其总体是否为正态分布,一般要根据已有的研究资料进行查询。如果没有资料查询,研究者应取较大样本分别对两变量作正态性检验。这里只要求保证双变量总体为正态分布,而对要计算相关系数的两样本的观测数据并不一定要求正态分布。
(2)两列变量之间的关系应是直线性的。如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否直线式,可以作相关散布图进行线性分析。相关散布图是以两列变量中的一列变量为横坐标,以另一变量为纵坐标,画散点图。如果呈椭圆形则说明两列变量
是线性相关的,如果散点是弯月状(无论弯曲度大小或方向),说明两变量之间呈非线性关系。
(3)实际测验中,计算信度涉及的积差相关时,分半的两部分测验须满足在平均数、标准差、分布形态、测题间相关、内容、形式和题数都相似的假设条件。
另外,积差相关要求成对的数据,即若干个体中每个个体都有两种不同的观测值。任意两个个体之间的观测值不能求相关。每对数据与其他对数据相互独立。计算相关的成对数据的数目不少于30对,否则数据太而缺乏代表性。
7. 简述编制分组次数分布表的步骤。
【答案】(1)求全距。全距指最大数和最小数两个数据值之间的差距。从被分组的数据中找出最大数和最小数,二者相减所得差数就是全距。
(2)决定组距与组数。组距是指任意一组的起点和终点之间的距离,用符合i 表示。决定组距的大小需要以全距为参考。全距大,则组距可以大一些;全距小,则组距可以小一些。
组数的多少根据组距的多少来定。如果数据个数在100以上,习惯上一般分10〜20组,但经常取12〜16组。数据个数较少时,一般分为7〜9组。如果数据的总体分为正态,那么可以用下面的经验公式计算组数(K ),这样可使分组满足渐进最优关系。
为数据个数,K 取近似整数)。
(3)列出分组区间。分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限有表述组限和精确组限两种。在列出分组区间时要注意:最高组区间应包含最大的数据,最小组应包含最小的数据;最大组或最小组最好是组距i 的倍数;各分组区间一般在纵坐标上按照顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面;等级次数时,要按照精确组限将数据归类划分到相应的组别中。
(4)等级次数。依次将数据等级到各个相应的组别内,一般用画线计数或写“正”字的方法。
(5)计算次数。根据登记的结果计算各组的次数,计算各组次数的总和即总次数。另外,要核对各组次数总和与数据的总个数是否相等。
8. 欲考察甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?
【答案】应该用肯德尔W 系数。
肯德尔W 系数又称肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量
(N
三、计算题
9. 计数数据的合成方法有哪些?
【答案】计数数据的合成方法有:
(1)两格表及四格表数据的合并
①简单合并;②相加;③即I 值相加法;④加权法;⑤分表理论次数合并法。 (2)R ×C 表数据的合并
①简单合并法;②分表理论次数合并法。
10.在一次预试中,得知某校150名学生的成绩
同,试估计正式测验的平均成绩是多少?
【答案】n>30为大样本,样本平均数的抽样分布为渐进正态分布,标准误为:
则总体平均数的95%的置信区间为
代入数据,得
所以,估计正式测验的平均成绩在 之间,估计正确的概率为0.95, 错误概率为5%。
,如果正式测验与预试的题目相