● 摘要
当前,基于Web的数据挖掘研究已涉及到经济发展和社会生活的各个层面。通过抓取网络中海量的Web资源,我们能够对与日常生活息息相关的具有高价值的数据与信息进行深入的挖掘与分析。从另一方面看,随着城市住房制度的深入改革和中国城市化进程的推进,如何推动居民顺利置业成为了社会的热点问题。因此,研究住宅价格的时空演变规律显得尤为重要,而海量公开的与住宅房产相关的Web数据也为此类研究创造了新的契机。
针对这一问题,本文深入探讨了住宅相关的Web数据的获取方法和各类时空因素对住宅价格的影响。本文主要完成了以下三个方面的研究工作:
第一,住宅相关数据抓取工具的设计与实现。本文开发了一个支持Web 2.0数据的具有深网数据爬取能力的分布式通用爬虫系统。设计并定义了通用爬虫模版脚本语言SGCTemplate,使得在通用主题下的Web 2.0网页自动化爬取成为可行。最终利用通用爬虫工具对住宅相关的Web数据进行了收集。
第二,住宅价格空间影响因素研究。以长沙市主城区和长沙县为研究区域,选择了代表区域特征、邻里特征、结构特征的16个特征变量作为影响住宅价格的因素,并在此基础上建立了Hedonic住宅价格模型。最终得出对住宅价格起到的显著影响的特征变量,并且对典型特征变量进行进一步测度研究。同时使用地理加权回归模型(GWR)得到不同特征变量相关系数的空间分布。
第三,轨道交通对住宅价格的时空影响研究。以长沙地铁2号线为例,研究了地铁开通试运行前后,轨道交通对其沿线住宅价格的影响程度。基于住宅价格分布的可视化分析,提出城市中心区域的地铁站点周边房价下降、城市外围区域的地铁站点周边房价上升的假设。最后利用假设检验方法验证了假设的有效性。
相关内容
相关标签