● 摘要
为了满足临床诊断的需要,基于内容的图像检索(Content-Based Image Retrieval, CBIR)算法已经被广泛地应用于计算机辅助诊断(Computer Aided Diagnosis, CAD)系统中。医生在面对疑难病例时,迫切需要找到与此病例在图像内容上相似的、已确诊的病例来为最终诊断提供帮助。特别是在诊断病理学领域,用于癌症诊断的病理图像因病变类型的不同相互间的形态差异很大,且图像数量多、规模大,这使得数字病理切片检索更有临床意义。
基于内容的病理图像检索在实际应用中存在两个主要问题:病理图像的特征提取与检索策略的选择。针对这两个问题,本文提出了一种图像纹理特征和病理学特征融合的病理图像高层语义表示方法,首先提取基于分块Gabor的纹理特征和基于细胞核统计特性的病理学特征作为图像的低层特征,然后使用pLSA模型提取隐藏在低层特征中的高层语义,将二者的高层语义表示合并作为图像的最终表示。另一方面,本文提出了基于低秩稀疏矩阵分解的pLSA高层语义提取方法,通过将图像低层特征的单词表示分解为代表不同意义的两个部分分别处理来提高高层语义特征的区分能力。在获得高层语义特征之后,选取特定的相似性度量方法计算输入图像特征与库中图像的相似度,即可实现图像检索功能。最终,本文的方法被应用于大规模数字病理切片库中。本文算法在一个包含5类乳腺癌亚种的病理图像库上进行了验证,实验结果证明了本文算法的可行性和有效性。
综上所述,本文研究了病理图像特征提取与检索的相关内容,提出了一种病理图像特征描述方法,在此基础上提出了两种以pLSA模型为核心的病理图像高层语义表示方法,以及基于两种高层语义表示的病理图像检索方法。本文方法通过实验证明了其合理性和有效性,并被用于实际应用中。