王雪莲 陈晶晶 马玉倩 摘 要:本文基于大数据采集分析方法,采集国产美妆品牌用户的微博公开数据进行清洗并分析后,对有效文本内容分词、打标处理,利用用户画像标签体系将数据标签化,并通过数据可视化得出基于微博数据的国产美妆品牌用户画像,以用户画像分析为依据提出国产美妆品牌的营销建议。 关键词:用户画像;国产美妆品牌;微博 近些年,国民品牌以全新的方式回归大家的视野,掀起一股"国潮之风",而在这场来势汹汹的国潮之中,最受关注的便是国产美妆品牌。在理论和实践方面,本文的研究充实了国产美妆领域的研究内容,有利于了解国产美妆品牌的用户状况,并为国产美妆品牌营销者的决策提供依据。 一、国产美妆的现状 在以往认知中,国外大品牌长时间占据我国美妆市场的红海,廉价、质量差是大众对国产美妆品牌的评价,而近几年今国产美妆借助互联网的支持和边界迅速崛起,不仅表现在品牌数量的快速增多,而且国产美妆品牌市场份额快速提升,市场份额占比超过50%,用户认知和好感度提高,与之前的原有形象形成明显反差。与之前的价格决定消费时代购物习惯不同,如今更多的消费者愿意为个性化而买单,影响消费者选择产品的最重要因素成为品牌的独特的创新与差异化。重新布局的美妆市场中,国产美妆的消费群体特征也发生了改变,例如"他经济"的崛起、美妆消费理念的改变、消费群体获知或消费国产美妆产品的方式的变化。消费者需求端的消费习惯和审美变化,推动着美妆行业的不断更新发展,结合国产美妆用户特征,美妆品牌企业不仅要在技术改革的背景下创新产品工艺,同时还要重视社交媒体与消费者互动,紧追热点IP创立联名产品,在产品体验过程中结合AI技术,提升用户的全方位消费体验。 二、国产美妆品牌用户画像研究流程设计 本文在对现有用户画像建立方法的研究之上权衡考量,选取利用集搜客和python工具来帮助建立基于微博数据的国产美妆品牌用户画像。首先,在微博平台获取与国产美妆品牌内容相关的用户的数据,然后预处理获取的数据,再结合对用户的基本信息和生成内容数据的挖掘分析的结果,建立用户画像标签体系,并与数据内容相对应,最后将标签和统计数据通过合适的可视化工具进行图表展示,从而获得基于微博数据的国产美妆品牌用户画像。用户画像构建流程如图1所示。 三、国产美妆品牌用户数据采集 (一)采集对象内容 根据美妆产品的实际功能划分,可以将美妆行业分为护肤领域和彩妆领域。护肤领域主要包括大众护肤、儿童护理等,而彩妆盘、香氛、药妆、化妆工具等属于彩妆领域。根据国产美妆的发展时期可以将其划分为两类,一是早期传统品牌,二是新生代品牌。按照上述划分品牌的两种标准,选取2019年国产美妆品牌销量排行榜中的代表品牌,可以将国产美妆品牌分为四类,如表2所示。 确定采集数据所需的国产美妆品牌的代表品牌后,需要確定采集内容。首先利用微博的关键词搜索功能,可以获取以代表品牌名称为关键词的内容,包括博文内容、转发数、评论数、点赞数等以及博主名称、头像、主页链接,采集该结果。然后以博主作为国产美妆品牌的用户对其信息数据采集并分析,主要包括对用户的基本信息(名称、性别、年龄、所在地、个性标签、关注、粉丝等)的采集以及对用户主动生成的内容(用户主动创作的微博原文、转发微博等)的采集。 (二)数据采集结果 利用集搜客平台对微博数据进行采集,首先通过关键词搜索结果采集,获取以"佰草集、一叶子、玛丽黛佳、完美日记"为关键词的搜索结果内容,采集关键词下的搜索内容的前50页,利用采集获得的博主主页链接,采集博主的个人基本信息,经过清洗过程,筛选提出不符合要求的博主后,视为国产美妆代表品牌用户。对这些用户的主动生成文本内容进行采集,分别采集每位用户的博主主页前5页内容作为原始数据,经过数据清洗过程,筛选提出与构建用户画像无关的内容,以剩余的微博内容作为分析的基础数据。 (三)数据清洗处理 数据采集的结果并不能直接用于下一步数据采集或者数据分析,主要是因为采集到的博主基本信息存在缺失、重复等问题,故对采集到的数据首先进行预处理,剔除重复、确实关键内容的数据所在行,以及不符合用户基本信息的规则的用户。之后,由于每个用户的微博发布和转发的内容较多,因此再对用户生成内容的文本进行清洗,常用的清洗方法包括数据数值化、标准化、数据降维等,主要是根据文本清洗规则筛选去除不符合要求的内容以免影响整体数据的准确性,再通过随机抽取样本进行检测,若合格率达到90%以上则不再继续清洗。具体要求如表3所示。 通过清洗获得国产美妆品牌用户的合格有效的用户基本信息后,还需要采集用户主动生成内容即微博内容后进行文本分析,勾画用户画像,但由于微博内容存在数据无效等问题,故通过机器学习和人工筛选的方法按照用户生成内容清洗要求进行修改或剔除,具体要求如表4所示。 本文主要依据清洗规则,利用Python和Excel工具和手工操作对采集到的2912位用户基本信息和86342条微博文本数据进行清洗后,得到1323位用户基本信息和26453条微博文本数据,并且随机抽取200条数据后,符合数据清洗规则的数据达到90%,因此认为清洗后的数据符合继续分析的要求。 四、国产美妆品牌用户数据分析 (一)建立用户基本信息数据标签 微博平台在用户注册和使用过程中会提示用户完善个人基本信息,包括昵称、个人简介、性别、所在地、生日、星座、QQ邮箱等,除必要设置的昵称外,大多数人会完善性别、所在地、生日、星座等基本信息,故选择该四项作为用户基本信息的标签,建立用户基本信息数据标签体系。 (二)建立用户生成内容数据标签 本文借助结巴分词工具,对采集到的1323位用户基本信息和26453条微博数据进行分词处理,并统计所有文本中重复的词组的重复次数,获得高频词的词频统计,输出频率较高的前40个关键词及词频数并构建关键词网络关系图,从中可以看出用户生成内容的文本中出现频率较高的名词关键词所属领域较为广泛,并且相互之间存在紧密联系,所属领域包括娱乐明星、产品品牌、兴趣爱好、行为习惯、关注热点等多个,故对关键词进行分类汇总,选取合适的关键词作为标签,并依据不同领域及主题构建事实标签体系。依据构建好的用户生成内容事实标签体系,以及作为标签词的关键词库,利用集搜客的文本分析分词分类检索工具,对采集到的所有文本信息进行打标处理,使得每一条文本数据都对应着一个或多个标签,提取相同标签统计分析,选择合适的可视化图标对统计结果进行展示。 五、国产美妆品牌用户数据可视化 分别对采集到的有关"佰草集、一叶子、玛丽黛佳、完美日记"的微博用户的数据信息进行分析,按照用户基本信息、用户兴趣和关注、用户行为习惯三大方面内容对国产美妆代表品牌的用户数据进行数据清洗、标签化处理、可视化展示后,得到不同的代表品牌用户画像,如图5—图8所示。佰草集的用户主要是女性白领人群,身兼家庭和工作两大重任,压力较大更加关注自然健康护肤和生活。 一叶子的用户主要是职场女性新人,进入职场时间不长,在学校和社会的生活环境转换过程中,由于生活作息不规律,所以更加关注某些特定问题的护肤解决,日常忙于工作,喜欢关注直播,偏爱网上购物,乐于交友和分享购物体验。 玛丽黛佳的用户主要是熟练化妆的女性,工作需要化妆,且妆龄较长,对自己的皮肤特点、产品特色有较多了解,追逐潮流的同时敢于自我创新。 完美日记的用户主要是化妆新手,男女性均有,但女性较多,接触彩妆产品时间不长,化妆技巧掌握不多,更依赖化妆教程和简单通用的彩妆产品。用户年龄不大,个性标签95后。 六、国产美妆品牌营销建议 分析国产美妆品牌的用户画像可知,國产美妆品牌营销对象重点,应为女性同时要兼顾某些男性需求,同时选择合适的IP跨界营销推出联合产品,能较快地拓展用户,并在产品体验中结合AI技术,全方位提升用户的消费体验。国产美妆品牌的产品设计、营销渠道、价格界定等多方面应当依据品牌理念和宗旨的同时,结合目标用户的特点来设计推广。 以"佰草集"为代表品牌的早期国产护肤品牌,用户普遍年龄偏高,肤质较差,较为关注产品的品质成分,用户的生活习惯主要集中在线下购买、软技能能力的提升等,偏爱文艺活动例如沙龙分享等。品牌商在营销时要着重宣传产品的成分质量、原生态产品原料、精细萃取加工技术、良好可观的护肤效果等,通过广告、视频、图片等多重形式结合,结合较为大众的渠道,让客户直观感受到产品的护肤功效,吸引消费者体验。 以"一叶子"为代表的新生代国产护肤品牌,用户主要是青年,存在明显的肤质问题,品牌商在营销时要着重宣传产品的天然原料和肤质问题解决效果,利用目前较为活跃的明星作为代言人,增加产品曝光度,通过短视频、小广告等多种方式出现在微博、小红书等新兴活跃的娱乐社交平台,吸引消费者的注意力。 以"玛丽黛佳"为代表的力量型国产彩妆品牌,用户具有较长时间的彩妆使用时间,有明确的产品类型购买偏好,对产品的设计、质量要求较高,用户的职业呈现出明显的美妆的需求,主要是明星、网红、模特、主持等,会活跃出现在公众面前,对于时尚等方面有独特的见解。品牌商在营销时要着重宣传品牌的价值观、产品设计的独特性等,营销渠道主要是品牌旗舰店、超话等成熟渠道,设计与热点事件相关的活动,结合抖音、微博等渠道扩大产品影响。 以"完美日记"为代表的新锐国产彩妆品牌,用户接触彩妆时间短,对彩妆了解较少,期待产品设计的简单和效果的明显,用户主要是在校学生等,主要活跃场所是学校,线上社交平台较为活跃,具有较大的朋友圈网络。品牌商在营销时着重突出产品使用的简单教程、真实效果展示,主要渠道是通过主播直播时的使用推荐、小红书分享体验推荐等,从主播的使用到"种草""拔草"的过程中逐渐利用社交网络扩大影响范围,提升产品的知名度等。 结束语: 分析国产美妆品牌的用户画像可以得知,品牌商结合自身特点的同时合理选择合适的热门IP跨界营销推出联合产品,能较快地拓展新用户,营销方式不局限于广告等传统方式,更要结合目标用户的行为特点,利用直播、抖音、小红书等新渠道在品牌商营销推广的同时,借助用户的真实体验和分享获取更多用户。 参考文献: [1]刘星辰.基于文本挖掘的用户画像系统的设计与实现[D].北京邮电大学,2018. [2]张昊.基于文本情感分析的电商在线评论数据挖掘[J].现代经济信息,2019(17): 340. [3]欧阳秀平,廖娟,冯烨,刘卉芳.基于运营商大数据的游戏用户画像构建研究[J]. 邮电设计技术,2019(09):40-44. [4]翟剑锋.基于 BERT 的用户画像[J].电子技术与软件工程,2019(24):253-255. 作者简介:王雪莲(1979-)女,汉族,河北工业大学经济管理学院,副教授,博士。研究方向:消费者行为研究。