● 摘要
目前网络钓鱼日益普遍,钓鱼网站取代病毒木马成为互联网第一大安全威胁,钓鱼网站的检测识别成为Web安全领域重要研究内容。本文重点研究了钓鱼网站的检测与防范机制,对钓鱼网站结构、特性、攻击手段等进行大量调研和分析,结合国内外现有的反钓鱼技术,提出基于网页链接关系的钓鱼网站检测方案以及基于网页层叠样式表相似性的检测方案并进行实现。另外,本文还在上述两种客户端检测方案的基础上提出了多用户协同检测机制,用于服务端钓鱼网站的收集分析。本论文主要工作和成果如下:(1)提出了一种基于网页链接关系的检测方案,介绍了方案的技术背景、模型设计及算法实现,对该方案的可行性、精确度进行比较分析,并使用浏览器插件进行实现。网页的可信度具有传递性,一个网页的可信度与其反向链接数目成正相关,与该网页包含的正向链接数目成负相关。该方案能结合上述特性对钓鱼网站做精确检测。(2)提出了一种层叠样式表相似度比较算法,在此算法基础上提出基于网页层叠样式表(CSS)相似性的检测方案,并用浏览器插件进行实现。本文还实现了钓鱼网站自动测试工具,能够对大量钓鱼网站数据自动化测试。钓鱼网站和真实网站会有一定的视觉相似性,而层叠样式表是网页样式显示控制的主要方式,该方案对视觉相似的钓鱼网站有很高的检测精度。测试表明,该方案误报率为0.59%,误报率为0%。(3)针对现有的钓鱼网站收集平台恶意用户非法提交的问题,提出一种多用户协同检测算法,在此基础上设计了多用户协同检测数据平台。该算法结合Beta分布的特性,根据用户投票少数服从多数、低信任用户服从多信任用户的原则进行判决。基于此算法设计的协同检测平台能够收集客户端插件提交的钓鱼网站,对恶意用户提交错误数据能识别并给予惩罚。
相关内容
相关标签