● 摘要
随着数据库技术和网络技术的飞速发展,各种政府机关及商业机构收集并存储了大量的数据信息,用于实时的业务处理以及日后的决策辅助。在诸多情况下,这些数据信息需要提供给第三方使用,比如应用系统的测试。然而,有相当一部分数据会涉及到个体隐私,如果这些数据中包含的敏感信息不加处理的发布出去,显然会侵害了数据所指向的个体隐私权益。那么,如何在信息共享的同时又保护个体隐私,已经成为数据安全的业界人士探索研究的重要课题之一。本论文首先回顾了微数据保护技术及其前身统计暴露控制技术的发展历程,分析了国内外的研究现状,并对本论文使用到的基础理论和相关技术进行了简要介绍。对论文中的关键问题,结合相关领域的研究成果,进行了总结归纳,并给出自己的观点和解决方案。根据项目背景和应用前景的分析,本论文设计并实现了一种数据隐私保护系统Deprivacy。此系统基于内部的统计引擎,提供多样的统计分析数据以协助用户做出数据处理的决策;提供了一个由多种数据转换方法构成的方法库,从属性暴露和身份暴露两个方面,有效屏蔽数据中的敏感信息;综合各种度量方法,以隐私暴露风险和数据信息损失度两种量化的评估指标,给予用户及时准确的反馈评价。最后,本论文结合一个具体的应用场景,对各种数据转换方法、评估指标以及系统总体的使用效果进行了实验分析。然后,对Deprivacy数据隐私保护系统的优缺点进行了分析评价,并对存在问题提出了若干可行的解决方案。本论文对于数据隐私保护问题的解决有借鉴意义和适用价值。