当前位置:问答库>论文摘要

题目:基于Hadoop的企业级日志分析系统的设计与实现

关键词:日志分析;Hadoop;MapReduce;大数据分析;分布式计算

  摘要


随着信息技术的不断发展,企业逐步认识到日志数据分析对企业级应用的重要性,通过分析日志中的用户行为模式可以为系统优化提供依据,并防止异常行为给系统带来风险。但是随着日志分析的数据规模的逐步增大以及处理效率的要求逐渐增高,传统数据挖掘技术在数据存储和分析能力上已经难以满足海量数据分析挖掘的需求,因此采用分布式计算解决方案对于企业来讲有着较高实际意义和商业价值。

目前分布式计算方案中Hadoop集群技术有着典型的代表性,Hadoop技术核心包括分布式文件系统(HDFS)和分布式计算框架(MapReduce),它屏蔽了复杂的分布式任务调度管理机制,向应用提供了简单的接口,并且具备较强横向扩展的能力,同时能按需提供分布式存储和计算能力,适合存储、处理分析海量的日志文件。

本文基于Hadoop技术实现了一个面向企业级应用的日志分析系统,实现了日志的采集、存储、处理、展现完整的功能,并且把常用统计分析功能使用MapReduce进行了算法设计和实现。

最后进行了实验对比,结果表明,对于大规模的企业级日志分析处理,其存储能力和处理效率随着集群规模的增加有着显著的提升。