2018年第二军医大学北京军区总医院312心理学专业基础综合之现代心理与教育统计学考研核心题库
● 摘要
一、概念题
1. 逐步回归
【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。
2. 随机变量
【答案】随机变量(random variable)是在样本空间的全部事件集上的一个实值函数。通常随机变量用大写字母x ,y , z 等表示,或者希腊字母,…等表示。分离散型随机变量和连续型随机变量两类。离散型随机变量是指所有可能的取值个数是有限的或至多可列的随机变量。如随机抽取任一学生观察其性别,其样本空间只有两个男性和女性样本点,
即
随机变量X 只取两个值:即当某学生
是男生时,x 取1; 当学生是女生时,x 取0。连续型随机变量是指可能在一个连续区间内或整个实数范围内取值的随机变量。如,在12岁的学生总体中,随机抽一个观测其身高y 。此随机试验的样本空间
机现象。
3. 标准分数
【答案】标准分数指以标准差为单位的一种差异量数,又称Z 分数或基分数。它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:
数据的标准分数
,为原始数据的值,式中,Z 为某原始为该组数据的平均数,为该组数据的标准差。标准分是大于0的实数集。随机变量y 可在一个连续区间内取值。随机变量的引进使概率论能使用精密的数学工具(如微积分、代数、实变函数、测度论等)来处理和分析随数的平均数为0,标准差为1。标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。其作用除了能够表明原数据在其分布中的位置外,还能对未来不能直接比较的各种不同单位的数据进行比较。如比较各个学生的成绩在班级成绩中的位置或比较某个学生在两种或多种测验中所得分数的优劣。
4. 古典概率
【答案】古典概率也叫先验概率,是指在特殊情况下直接计算的比值。计算方法是事件A 发生的概率等于A 包含的基本事件数M 与基本事件总数N 之比。古典概率是最简单的随机现象的概率计算,建立在这样几个特定条件上的,即:事件的互斥性、事件的等概率性以及事件组的完备性。
二、简答题
5. 如何区分点二列相关与二列相关?
【答案】(1)点二列相关法(point-biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个为“二分”称名变量(二分型数据)之间相关程度的统计方法。
二列相关法(biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个也是连续变量不过被按照某种标准人为的划分的二分变量之间相关程度的统计方法。
(2)点二列相关与二列相关的区别
二列相关不太常用,但有些数据只适用于这种方法。在测验中,二列相关常用于对项目区分度指标的确定。有时,某一题目实际获得的测验分数是连续性测量数据,这些分数的分布为正态,当人为地根据一定标准将其得分划分为对与错、通过与不通过两个类别时,计算该题目的区分度就要使用二列相关。如果题目的类型属于错与对这样的是非类客观选择题,计算该题目的区分度就应该选用点二列相关。二者之间的主要区别是二分变量是否为正态分布。总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这时,不管观测数据代表的是一个真正的二分变量,还是一个基于正态分布的人为二分变量,这时就用点二列相关。当确认数据分布形态为正态分布时,都应选用二列相关。只要有任何疑问,选用点二列相关总是较好的选择。在实际的研究当中,二列相关很少使用。
6. 简述编制分组次数分布表的步骤。
【答案】(1)求全距。全距指最大数和最小数两个数据值之间的差距。从被分组的数据中找出最大数和最小数,二者相减所得差数就是全距。
(2)决定组距与组数。组距是指任意一组的起点和终点之间的距离,用符合i 表示。决定组距的大小需要以全距为参考。全距大,则组距可以大一些;全距小,则组距可以小一些。
组数的多少根据组距的多少来定。如果数据个数在100以上,习惯上一般分10〜20组,但经常取12〜16组。数据个数较少时,一般分为7〜9组。如果数据的总体分为正态,那么可以用下面的经验公式计算组数(K ),这样可使分组满足渐进最优关系。
为数据个数,K 取近似整数)。
(3)列出分组区间。分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限有表述组限和精确组限两种。在列出分组区间时要注意:最高组区间应包含最大的数据,最小组应包含最小的数据;最大组或最小组最好是组距i 的倍
(N
数;各分组区间一般在纵坐标上按照顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面;等级次数时,要按照精确组限将数据归类划分到相应的组别中。
(4)等级次数。依次将数据等级到各个相应的组别内,一般用画线计数或写“正”字的方法。
(5)计算次数。根据登记的结果计算各组的次数,计算各组次数的总和即总次数。另外,要核对各组次数总和与数据的总个数是否相等。
7. 结合所学心理学知识,谈谈你对心理统计思想的初步理解。
【答案】在心理发展过程中,个理论学派观点层出不穷,但是他们都有一个共同的特点,并不是单纯的从唯心角度出发,而是客观的用现象、行为和数据来说明心理的各种规律,但是在研究过程中,发现心理的数据有时具有随机性和变异性,但有时又具有规律性,为了研究变异性和规律性,心理学就利用部分数据来推测总体数据的特征,为了更科学的推测和分析,就形成了心理统计思想,并将统计学渗透到心理学的各个分支。
8. 简述最小二乘法。
【答案】最小二乘法是建立精确的回归方程经常采用的方法,其基本过程如下: 设
若
图像“很象”
一条直线(不是直线),我们的问题是确定一条直线使得它能“最好”地反映出这组数据的变化。对个别观察值来说,它可能是正的,也可能是负的。为了不使它们相加彼此抵消,故“最好”应该是
确的回归方程:
最小,即这时误差的平方和最小,这时可以求得比较精是直角平面坐标系下给出的一组数据, 我们也可以把这组数据看作是一个离散的函数。根据观察,如果这组数据
三、计算题
9. 在一项双生子研究报告中,17对同卵双生子智商的相关系数为0.85, 24对异卵双生子智商的相关系数是0.76,问这两个相关系数是否存在显著差异?
【答案】两个相关系数由两组彼此独立的被试获得。问题为是否有显著差异则用双侧检验。 (1)提出假设即两个相关系数没有显著差异
即两个相关系数有显著差异
(2)选择检验的统计量并计算其值
当时,当,时,
(3)确定显著性水平及临界值
相关内容
相关标签