当前位置:问答库>考研试题

2017年首都师范大学教育学院347心理学专业综合[专业硕士]之现代心理与教育统计学考研仿真模拟题

  摘要

一、概念题

1. 二列相关

【答案】二列相关是一种两列变量的质量相关。适用的资料是两列均属于正态分布,但其中一列变量是等距或等比的测量数据,另一列变量虽然也呈正态分布,但它被人为地划分为两类,例如:健康与不健康的划分。这种相关适用于对项目区分度指标的确定。

2. 统计量

,统计学术语,指不含未知参数的样本的函数。设有一总体X

,【答案】统计量(statistic )

是取自x 的一个随机样本,

数,则称

统计量,是一个统计量。如,样本均值是不包含任何未知参数的函是一个也是一个统计量。在各种不同的统计分析或推断中,

,若数学期望y 未知,可并不直接使用随机样本,而是将随机样本“加工”为统计量。在解决不同问题时有不同的统计量,统计量是直接用来进行分析或推断的重要工具。如正态总体

用样本均值X 去估计;在两个总体的均值差异显著性检验时,要运用Z 统计量或t 统计量。

3. 差异系数

【答案】差异系数(,又称变异系数、相对标准差等,它是一种相对差)

异量,用CV 来表示,为标准差与平均数的百分比。在对不同样本的观测结果的离散程度进行比较时,常常遇到下述情况:两个或多个样本所测的特质不同。如何比较其离散程度?即使使用的是同一种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?这时需要运用相对差异量进行比较。差异系数的计算公式是:(S 为某样本的标准差,M 为该样本的平均数)。差异系数在心理与教育研宄中常常应用于同一对象的不同领域或同一领域的不同对象。

4. 逐步回归

【答案】逐步回归是多元回归中选择自变量,建立最优回归方程的一种方法。其基本原理和过程是:按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。每引入一个自变量都要对回归方程中每一个自变量(包括刚刚引入的那个)的作用进行显著性检验,若发现作用不显著的自变量,就要将其剔除(因为引入新的自变量后,原来方程中显著作用的自变量有可能变成不显著)。这样逐个地引进和剔除,直至没有自变量可引入也没有自变量应从方程中剔除为止,这时的回归方程一般来说是最优的。

5. 相关系数

【答案】相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。绝对值接近1.00端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。

6. 推论统计

【答案】推论统计又称推断统计,主要研宄如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。这是推论统计要研宄的内容,常用的统计方法有:假设检验

的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。

二、简答题

7. 2002年10月29日,《江南日报》发布中华英才网的调查报告,调查结果显示南京职工的人均月薪已达2690元,有人认为这一结果高估了南京人的月收入。你怎么看这个结果,试分析高估的原因。

【答案】我认为中华英才网的调查报告有可能高估了南京人的月收入。

(1)如果此调查高估了南京人的月收入,产生的原因主要是调查的过程中所选择的样本不具有代表性,也就是说选择到的样本只是一部分月薪偏高的人群,不能代表整个南京人的平均水平。从根本上说是因为没有在抽样调查中运用随机化原则。

中华英才网进行的调查存在取样偏差问题是因为被进行调查的大多数是收入偏高的知识分子阶层,而收入偏低的样本可能由于上网的机会比较少,而被抽样的可能性很小,所以通过中华英才网进行调查的样本不能有效推论整体南京人的月收入7尺平。

(2)抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。

与其他调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:

,一种是代表性误差(也称抽样误差)一种是工作误差(也称登记误差或调查误差)。但是,抽

样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,抽样调查误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。

抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其他非全面调查所不具备的特点,主要是:

①调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,

能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。

②是以抽取的全部样本单位作为一个代表团,用整个代表团来代表总体。而不是用随意挑选的个别单位代表总体。

③所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。

④抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。

基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。

但是,要使抽样调查更具有代表性,需要在其中运用随机化原则,即在抽样时,总体中每一个个体是否被抽取,并不由研究者主观决定,而是每一个个体按照概率原理被抽取的可能性相等。只有这样,才能根据对样本统计量的分析,以样本统计量来估计总体参数。

8. 判断某个变量X 的样本是否符合卡方分布的方法是什么?

【答案】判断某个变量X 的样本是否符合卡方分布可以根据卡方分布适用的条件来考虑。 卡方运用于非参数检验。适用于样本是频数分布的情况。其数据是属于点计而来的间断变量;总体分布未知;不是对总体参数的检验,而是对总体分布的假设检验。计数资料的统计检验主要用卡方检验,可以用来同时检验一个因素两项或多项分类的实际观测数据,与某理论次数分布是否相一致的问题,或有无显著差异的问题;还可用于检验两个或两个以上因素各有多项分类之间,是否有关联或是否具有独立性的问题。

卡方检验用于计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,又是一种非参数检验的方法。

9. 简述编制分组次数分布表的步骤。

【答案】(1)求全距。全距指最大数和最小数两个数据值之间的差距。从被分组的数据中找出最大数和最小数,二者相减所得差数就是全距。

(2)决定组距与组数。组距是指任意一组的起点和终点之间的距离,用符合i 表示。决定组距的大小需要以全距为参考。全距大,则组距可以大一些;全距小,则组距可以小一些。

组数的多少根据组距的多少来定。如果数据个数在100以上,习惯上一般分10〜20组,但经常取12〜16组。数据个数较少时,一般分为7〜9组。如果数据的总体分为正态,那么可以

,这样可使分组满足渐进最优关系。用下面的经验公式计算组数(K )

为数据个数,K 取近似整数)。

(3)列出分组区间。分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限有表述组限和精确组限两种。在列出分组区间时要注意:最高组区间应包含最大的数据,最小组应包含最小的数据;最大组或最小组最好是组距i 的倍数;各分组区间一般在纵坐标上按照顺序排列,数值大的分组区间排在上面,数值小的分组区

(N