黄毅能 吴旭东 多晓伟 基金项目:2019年江西省教育厅科学技术研究项目"数据挖掘技术在电商平台中的应用——以陶瓷餐具的电商营销为例"(项目编号:191300) 摘 要:本文通过与淘宝后台核心经营数据进行分行析,使用生意参谋工具,在数据中心进行数据对接。利用数据挖掘的若干重要分析方法,抽取核心经营数据进行分析。对两个月60天的数据进行分析,通过关联规则分析、神经网络两种算法对淘宝核心数据进行分析,建立了经营预警机制,进而为提高店铺经营提供一些参考性的建议。 关键词:数据挖掘;陶瓷餐具;电商平台 本文以淘宝电商平台陶瓷餐具店铺真实销售数据为,专门针对陶瓷餐具的销售历史原始数据进行数据挖掘分析。对数据进行检测、筛選、抽取、整理。然后,利用SPSS clementine数据挖掘软件建立样本模型、测试样本数据等一系列数据挖掘工作;其中重点运用数据挖掘中常见的算法进行建模,找出适合陶瓷餐具电商销售的算法并加以分析。如图1陶瓷餐具电商销售数据挖掘详细流程图 一、关联规则分析 (一)数据预处理 通过相关软件把淘宝店铺销售数据下载下来,先对数据进行前期的整理,然后将数据预处理,对数据离散化和抽象化处理,从而能更好的符合关联数据挖掘模型。在开展数据挖掘之前,需要将购买商品的子类目以及购买金额。商品的类目按数据表中的顺序依次映射成为英语字母A-餐具笼/架、B-碟、C-瓶/罐、D-盘、E-餐具瓷器套装、F-果盆/果盘/果篮、G-餐垫等;经过处理以后如表1所示。 (二)实验过程与分析 对顾客购买数据进行离散化处理,通过类型选择集合,数据挖掘的核心算法采用GRI关联规则算法,其中的支持度设置为50%,置信度设置为60%。数据挖掘结果如图3所示: 规则1中显示,购买餐垫和瓶/罐的客户占52%,其中购买餐垫同时有76.92%的顾客购买了瓶/罐。 规则2中显示,购买餐垫和餐具瓷器套装的客户占53%,其中购买餐垫同时有75.47%的顾客购买了餐具瓷器套装。 规则3中显示,购买餐具瓷器套装和瓶/罐的客户占52%,其中购买餐具瓷器套装的同时有71.15%购买瓶/罐。 规则4中显示,购买瓶/罐和餐具瓷器套装的客户占53%,其中购买瓶/罐的同时有69.81%购买餐具瓷器。 规则5显示,购买果盆/果盘/果篮和盘的客户占52%,其中购买果盆/果盘/果篮同时有67.31%购买盘。 二、神经网络预测 (一)神经网络算法 人工神经网络又称连接机模型,是一种无监督的学习,是现代神经学、生物学、心理学的基础上产生的一种算法模型,属于无监督学习的算法。是模拟生物神经系统处理外界事物的基本过程,是在模拟人类大脑的神经组织发展起来的计算系统。包括大规模并行、分布式处理、自组织、自学习等优点,广泛应用于模式识别、语音分析、图像识别、数字签名、计算机视觉等很多领域,取得了许多丰硕的成果。1986年由Rinehart和McClelland科学共同提出,按误差逆向传播算法训练多层前馈网络,是目前较典型的神经网络算法之一。BP网络能学习和存储大量的输入—输出模式映射关系,不需要提前知道映射关系的数学方程。学习过程使用最快下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络具有非线性映射能力、自学习和自适应能力、泛化能力、容错能力等优点,国内不少研究学者都对其进行了重点研究,运用网络解决了许多领域的问题。 BP神经网络的计算过程由正向计算过程和反向计算过程组成。正向传播过程中,输入模式从输入层到隐含层单元层逐层处理,逐步转向输出层,每一层神经元的状态只影响下一层神经元的状态。如果不能得到期望的输出结果则转入反向传播,将误差信号沿原来的连接通路返回,通过调整各层神经元的权值和阈值,把型号误差调到最小。主要包括两个步骤:第一步是网络状态初始化,第二步是前向计算过程。BP网络主要应用在以下四个方面: 1.函数逼近:输入向量和输出向量训练出对应的网络模型逼近指定的函数。 2.模式识别:用指定的输出向量于输入向量进行关联,训练特定的模型。 3.分类:把一些向量按着一定的规则进行分类。 4.数据压缩:减少输出向量的维度,方便传输和存储。 (二)实验过程 利用BP神经网络算法构建模型,对准备好的数据进行挖掘,对数据源的各个字段类型进行合适的设置。利用支付转化率、访客数、成功退款金额、作为输入项,借阅量作为输出量。如图5、图6所示。 训练样本共60条,支付转化率、访客数、成功退款金额、直通车消耗、老买家支付金额、淘宝客佣金、客单价和支付件数8个字段作为输入层,输入层包括8个神经元,隐藏层包括3个神经元,输出层包括1个神经元为支付金额。建立BP神经网络模型,预测后10天的支付金额,假设后10天的支付金额是未知的,通过比较预测值与真实值的误差,结果预测的准确率比较高为82.519%。 利用神经网络建立淘宝店铺经营预警机制。如图7所示,输入店铺核心经营数据,利用事先建立好的BP神经网络模型预测支付金额,如果预测值与实际值的误差在20%以内,则说明正常,如果误差超过了20%,则开始预警,表示淘宝店铺经营数据异常,需要认真分析查找原因,首先查询日常核心数据,找出原因后,再调整店铺商品的摆放、定价、店铺的装修以及详情页的设计等。 结束语: 本文从淘宝网店的购买记录出发,通过发掘历史数据,建立一些典型的数据挖掘分析法模型得出了一些有趣的结论。 1.使用关联规则分析,发现了一些有趣的规律即:陶瓷餐具的某些产品存在着密切的关系。算通过规律合理安排陶瓷网店中商品的上架排布,商品的定价策略等。 2.利用神经网络法预测出未来淘宝网店的销售数据,并在此基础上建立了淘宝网店的预警机制。 参考文献: [1]朱沙.电子商务中计算机WEB数据挖掘技术的应用分析[J].商场现代化,2018(23):34-35. [2]李涛,曾春秋,周武柏,等.大数据时代的数据挖掘——从应用的角度看大数据挖掘[J].大数据,2015(04):1-24. [3]李楠楠.大数据挖掘技术在电子商务企业营销中的应用研究[J].全国流通经济,2019(8):16-17. [4]方晶晶、刘佳峰.数据挖掘技术在企业服务中的应用与研究[J].电脑编程技巧与维护.2020(06):105-107.