【摘 要】随着计算机信息技术的不断发展,在其中衍生出来多个方面的应用,其中大数据分析以及构建大数据服务模型已然成为当前企业发展最热门的话题之一,而数据融合问题对于企业未来的发展有着较为严重的影响。在这个信息量巨大的社会中,电信领域有着巨大的挑战。本文旨在借助分析目前电信领域用户消费习惯,结合大数据现阶段的大环境构建一个全新的用户服务模型,在Hadoop模型的帮助下完成大数据处理框架,最后实现电信领域数据融合。 【关键词】大数据;数据融合;服务模型;Hadoop模型 在互联网技术火热发展的今天,大数据呈爆发式的增长,数据已经成为一种新的资源,为这个快速发展的社会提供着巨大的价值,也为创新驱动,万众创新的时代主题提供推动力。尤其在电信领域大数据有着巨大的潜在价值,但其面对的挑战也非常大且问题类型很多,如在该领域下怎样完成用户服务模型的搭建,如何实现所有数据的有效融合等。 一、电信领域用户消费特征与用户服务模型构建 众所周知,企业想要设计一款符合大众消费者的产品,必须要抓住消费者普遍的消费心理以及消费特征。同样的电信企业也应该牢记,新信息时代下消费群众常有的习惯,而后可以结合大数据完成全新的用户服务模型的构建。所以整个电信服务系统中应该具备了消费群众的个人基本信息,可以根据不同的消费用户制定出符合他们特色的消费产品。同时记录的数据中还应该包括了用户每日流量使用情况、通话时长以及短信和通话的比例关系,种种数据也能大体的了解电信用户的消费习惯。 在所有的电信领域消费群众中,可以根据消费群众个人消费特征的不同构建出特有的服务模型,本系统对于用户的特征数据进行数据集的处理。比如数据集的总和是所有注册过的电信用户,可以用U={u1,u2,…,uN}来表示;同样电信用户的自然特征数据应该包括了消费群众的基本的个人信息(性别、年龄、收入水平以及日常生活地区等),同样也可以用数据集A={a1,a2,…,an}来代替,图中的其他特征数据信息同样可以构建数据集的形式,影响力特征对应的数据集为B={b1,b2,…,bn};生活轨迹、电信特征、品牌特征、文化特征对应的数据集依次为C、D、E、F。但是在构建这些特征数据集之间又存在交叉重合的子集,根据不同用户交叉子集的比例权重就可以看出两个消费用户具有的情景相似情况,就能做出针对性的消费产品。 二、Hdoop模型的大数据处理框架及数据融合策略 电信企业需要使用的数据主要包括了企业内部数据以及用户的外部数据。内部数据又可以分为系统下电信用户个人信息数据、消费特征以及消费习惯以及电信企业具有的业务信息数据等;外部数据主要包括了用户在使用电信产品时利用到的电子产品(手机、电脑以及平板电脑等)以及各种各样的网络社交平台。所以整个数据量非常庞大,如果采用以前的数据采样形式,需要进行许多不必要的工作,导致数据的精准度有待商榷,电信服务模型在性能上也无法满足目前消费用户的要求。为了改善这方面的不足,使用的数据存取为层次分布的方法。在Hadoop模型的帮助下,搭建出一个更有效、可完成层次计算的系统基础架构,最后还可以兼顾电信领域数据特点,完成了Hadoop模型的大数据处理框架。 1.数据采集层 数据采集层主要完成的任务是实现各个不同系统实现传输协议,并在此基础下记录电信用户在不同数据源中获得API的数据信息。上图可以看出电信用户主要在网上营业厅以及掌上营业厅完成电信产品的消费,电信企业可以借助HTTP记录下用户使用的IP地址以及访问记录;其他的内部系统一般需要向外来用户提供专门的API,系统就可以借助这些专门的API获得用户使用电信产品的数据信息;现代化常用的社交平台同样也添加了开放性的API从而可以有效的获得电信用户数据情况;互联网则有自身特有的网关采集能够及时的记录电信用户的数据。 2.数据存储层 数据存储层主要将采集层收集到的数据信息进行专门的归类,最后整理有序将其存到整个模型的层次性数据库中。数据库主要包括了牵引库以及特征库;两者分工明确,根据收集数据的信息不同,将内部系统采集到用户数据集中分布在特征库中,最后可以将收集数据进行专门的数据分析以及整合工作,形成有效的特征库以及牵引库,有利于电信企业制定针对性的消费产品,实现更便利的业务服务模型的构建,该层还附带者将系统收集到的数据存储到其他文件系统中。 3.文件存储层 文件存储层相比于数据存储层,最主要的区别是文件存储层是在HDFS的基础下,并且该层下面有三个不同的节点协同工作完成文件存储的工作,即存储控制(namenode)、数据存储(datanode)以及集群监控节点。namenode作为HDFS的管理者,负责完成不同系统的文件的命名工作,是三个节点中最为重要的,还需要在它的帮助下完成文件系統的维护工作。 三、结语 大数据时代下,数据带来了价值的同时,也给电信企业带来无限的商机。所以怎样利用好大数据这个平台,成为电信企业发展的关键所在。掌握好电信用户的消费习惯以及消费特征,有针对性的设计出符合大众用户的产品。必须用户内部环境以及网络平台外部环境两方面进行,完成电信领域数据融合。 【参考文献】 [1]王笑宇,程良伦. 云计算下的多源信息资源云体系及云服务模型研究[J]. 计算机应用研究,2014,31(03):784-788. [2]高永梅,琚春华,鲍福光. 基于大数据的电信领域用户服务模型与数据融合策略研究[J]. 电信科学,2014,30(07):62-69. [3]张春丽. 基于数字图书馆关联数据的用户服务模型与协同信息推荐模型研究[J]. 图书馆理论与实践,2017(07):89-92. [4]姜强,赵蔚,王朋娇,王丽萍. 基于大数据的个性化自适应在线学习分析模型及实现[J]. 中国电化教育,2015(01):85-92. [5]邓仲华,刘伟伟,陆颖隽. 基于云计算的大数据挖掘内涵及解决方案研究[J]. 情报理论与实践,2015,38(07):103-108.