当前位置:问答库>论文摘要

题目:新闻聚合系统的设计与实现

关键词:新闻聚合;WebMagic;iOS技术;爬虫

  摘要


新闻聚合是站点间共享内容的一种简易方式,通过这种方式可以从海量的新闻信息中聚合最有价值、最符合用户兴趣的内容。新闻聚合能够满足用户个性化需求,从而帮助人们提高阅读效率和质量,完成资讯的价值回归。

中国地质调查局希望通过一款APP软件,能够定期从国内大型门户网站,如新华社、科技部门户网、环保部门户网等数十个媒体上,获取最新新闻信息。根据中国地质调查局的实际需求,经过需求分析和设计,最终初步实现了针对中国地质调查局的新闻聚合系统。   

本论文主要工作如下:

1.系统分析了新闻聚合系统的整体需求,对整体需求基于C/S系统架构,设计了新闻聚合系统的整体架构,iPad客户端采用MVC模式进行架构设计,提高整个系统的可维护性和可扩展性。

2.建立了针对中国地质调查局的新闻聚合系统,采用Objective-C编程语言进行开发,基于iPad实现了登录、新闻封面信息展示、新闻列表展示、新闻详情展示、新闻收藏、新闻期刊下载、关键字搜索、查看往期新闻、退出系统等一系列的功能。

3.利用轻量级爬虫工具WebMagic解决了从各大门户网站爬虫定期获取最新定制新闻的难题。对爬取到的新闻数据,针对各门户网页的组成特点,采用了XPath的方法对新闻内容进行抽取,并进行本地的保存和整理,供iPad客户端获取数据并最终展示给用户。

目前该新闻聚合系统已经投入使用。通过新闻聚合系统的设计,总体上提高了中国地质调查局在新闻浏览上的效率和质量,达到了新闻聚合系统设计的目的和要求。