● 摘要
新闻聚合是站点间共享内容的一种简易方式,通过这种方式可以从海量的新闻信息中聚合最有价值、最符合用户兴趣的内容。新闻聚合能够满足用户个性化需求,从而帮助人们提高阅读效率和质量,完成资讯的价值回归。
中国地质调查局希望通过一款APP软件,能够定期从国内大型门户网站,如新华社、科技部门户网、环保部门户网等数十个媒体上,获取最新新闻信息。根据中国地质调查局的实际需求,经过需求分析和设计,最终初步实现了针对中国地质调查局的新闻聚合系统。
本论文主要工作如下:
1.系统分析了新闻聚合系统的整体需求,对整体需求基于C/S系统架构,设计了新闻聚合系统的整体架构,iPad客户端采用MVC模式进行架构设计,提高整个系统的可维护性和可扩展性。
2.建立了针对中国地质调查局的新闻聚合系统,采用Objective-C编程语言进行开发,基于iPad实现了登录、新闻封面信息展示、新闻列表展示、新闻详情展示、新闻收藏、新闻期刊下载、关键字搜索、查看往期新闻、退出系统等一系列的功能。
3.利用轻量级爬虫工具WebMagic解决了从各大门户网站爬虫定期获取最新定制新闻的难题。对爬取到的新闻数据,针对各门户网页的组成特点,采用了XPath的方法对新闻内容进行抽取,并进行本地的保存和整理,供iPad客户端获取数据并最终展示给用户。
目前该新闻聚合系统已经投入使用。通过新闻聚合系统的设计,总体上提高了中国地质调查局在新闻浏览上的效率和质量,达到了新闻聚合系统设计的目的和要求。