● 摘要
纵向数据的研究主要是针对那些在不同的时间或地理位置以及不同的实验条件下对每个个体进行测量而得到的数据。由于在医学和社会科学的研究中,纵向数据的研究有着重要的战略地位,因此利用纵向数据来建立一个能够充分描述实际问题的模型是分析和研究问题本身的有效手段。但是由于存在实际问题的复杂性、纵向数据的特殊性以及数据所固有的误差,这就需要我们对建立的模型进行反复的诊断和治疗。在众多的模型诊断方法中,二阶局部诊断方法是一种应用范围广,准确性高,计算量小的有效方法,这对选择合适的模型有着重要的意义。本文针对纵向数据模型,采用二阶局部诊断方法构建了两个统计量来寻找数据中的影响点和离群点,具体过程如下:首先,选取统计量。考虑到多重势以及残差平方和的有效性和合理性,本文选取了这两个统计量,并推导了适合于纵向数据模型的多重势以及残差平方和的公式。其次,确定扰动方案。根据纵向数据的特点,提出两种便于合理分析数据的扰动方案,即在考虑个体本身对参数估计和模型拟合的影响同时,考虑个体的每个观测值对参数估计和模型拟合的影响。然后,分情况讨论。纵向数据模型一般分为两种,即纯序列相关的模型和包含随机效应和序列相关的模型。本文依次分析了这两种纵向数据模型,采用相应的两种扰动方案,给出了扰动曲面沿扰动方向在扰动点处的曲率,也就是二阶局部诊断法的主要诊断量。最后,实例分析。本文对美国1979年到1988年间关于个人所得税的数据进行了分析,寻找出了影响参数估计和模型拟合的影响个体和影响观测值,并与传统的删除法做了比较,检验二阶局部诊断方法的优越性。正如我们预测的一样,结果是令人满意的,同时我们的分析也引发了我们更多的思考,相信这将会促进我们未来在理论和方法上的改进。
相关内容
相关标签