● 摘要
随着移动互联网的发展以及在线旅游市场的持续升温,本文对国内线旅游公司的移动客户端的用户行为数据进行分析并对整个用户行为分析从构思到实现提供了一套有效的方法。运用大数据对用户进行分析通常需要进行六个环节即用户分析构想、数据收集、HADOOP技术处理、中间表清洗、SQL语句提取、EXCEL加工和数据分析。
在对用户行为分析构思之后,发现用于用户行为分析的数据量十分巨大而且数据源形式比较复杂,需要用HADOOP技术进行预先处理之后存储在数据库中,再用SQL语句进行数据提取。经过处理的数据不仅形式更加简明且数据量减少了100倍以上,而且节省了数据的计算时间。
运用经过预处理和SQL语句处理的数据,经过处理对用户的活跃、转化率以及交易行为的数据分析,发现旅游类APP的用户行为呈现如下特征:酒店业务活跃用户主要集中在下午及晚上,而机票用户更为提前,集中在中午。酒店业务用户集中在当天预订,而机票用户集中在1-3天;从酒店、机票、火车票的消费金额分布来看,ios用户的消费能力要高于adr用户,机酒交叉用户的消费能力要高于各业务总用户,火酒交叉用户要低于各业务总用户;在对火车票订单的分析中,ios用户在一等座、二等座订单的占比明显高于adr,在卧铺类别中,ios用户占比低于adr用户,说明ios用户对火车票的需求更加倾向于短途旅行。
随着移动互联网的发展以及在线旅游市场的持续升温,本文对国内线旅游公司的移动客户端的用户行为数据进行分析并对整个用户行为分析从构思到实现提供了一套有效的方法。运用大数据对用户进行分析通常需要进行六个环节即用户分析构想、数据收集、HADOOP技术处理、中间表清洗、SQL语句提取、EXCEL加工和数据分析。
在对用户行为分析构思之后,发现用于用户行为分析的数据量十分巨大而且数据源形式比较复杂,需要用HADOOP技术进行预先处理之后存储在数据库中,再用SQL语句进行数据提取。经过处理的数据不仅形式更加简明且数据量减少了100倍以上,而且节省了数据的计算时间。
运用经过预处理和SQL语句处理的数据,经过处理对用户的活跃、转化率以及交易行为的数据分析,发现旅游类APP的用户行为呈现如下特征:酒店业务活跃用户主要集中在下午及晚上,而机票用户更为提前,集中在中午。酒店业务用户集中在当天预订,而机票用户集中在1-3天;从酒店、机票、火车票的消费金额分布来看,ios用户的消费能力要高于adr用户,机酒交叉用户的消费能力要高于各业务总用户,火酒交叉用户要低于各业务总用户;在对火车票订单的分析中,ios用户在一等座、二等座订单的占比明显高于adr,在卧铺类别中,ios用户占比低于adr用户,说明ios用户对火车票的需求更加倾向于短途旅行。
相关内容
相关标签