在很多时候,特别是在电商界,关于站内搜索的文档或者书籍可以说是寥寥无几,一般的电商搜索规则或者构建思路都是各加的技术机密,除了技术算法或者产品员工跳槽,外界很少能够窥其一二。当然今天所描述的这些纯粹是一个经验分享,不涉及某某机密技术,都是能够在日常生活中或者书籍里能够找到的,旨在向大家描述怎么构建一个电商站内搜索体系。 本文将从算法,运营,产品,数据分析等多个方面来进行讲解,期间会穿插多个个人方法论(不一定适合你,仅供参考,可以不采纳)。 说到体系搭建其实和房屋搭建差不多的流程,工程图-地基-墙面-龙骨-封装-水电气走线-(软装+硬装),那么在站内搜索体系搭建上也同样遵循着类似的流程。首先我们需要知道整体规划,该从哪些方面入手来组建站内搜索体系,无规矩不成方圆,那么先从这个规划方案说起,从而拉开整个搭建过程的序幕 在规划方面需要明确几个点:用户的语言类型,当然国内电商不需要过分考虑汉语之外的其他语言,但是如果是对外外贸电商则需要尽可能贴近当地语言文化,除了通用的英语是标配,还有更多的语言亟待我们去了解,在站内搜索领域还不是特别发达。 从语系来讲,音型文字和相型文字的分支结构是不一样的,音型文字有拼音字母组成,比如英语,俄语,法语,阿拉伯语等,在这些语言中由于不同的地理环境和文化的差异,同一种语言可能会产生多个版本的方言,和汉语一样。但是汉语的好处就在于无论在什么地方,文字的描述是统一的,所以有别于音型文字的不同音,文字也会相应的不同。那么对应同意不同音且不同形的语言,做好语义归一或者说做好同义词词库尤为重要。 好了这些都是题外话,言归正传,搜索体系的搭建的若干个流程我们需要同步进行,不过我们还是将其归纳在一个章节里面说说: 索引工具的选择:目前现有的索引工具平台有solar和es两种,一般来讲es在国内发展的比较成熟,在索引更新时分为增量索引和全量索引。这里我就不在展开讲了,具体可以度娘或者CSDN查询。 干预后台的搭建:所谓干预后台就是指人为干预搜索结果的工具后台,一般在搜索体系建立的初期,干预后台能够执行很多前期算法无法解决的问题,商品排序,联想词,近义词,词链直达,热搜,筛选项干预,类目预测,减词等一系列增删改查的相关功能。 索引规则的确认:意思就是在搜索时,符合哪些条件的商品能够被搜索到,比如关键字与商品标题,所在的类目名称,商品参数属性,tag等。 排序算法的确认:意思就是说,确认了索引规则就是什么样的商品能被搜索到,排序则是通过一定的规则将搜索到的商品池子进行排序,目前分为两部分,一部分是大范围的排序即类目预测,一部分是小范围的排序即在预测的类目下进行排序,这两点我们会接下来细说,其中涉及算法层面的理论知识也一并将其科普给大家。 类目建设:但凡电商都有自己的商品分类,我们也称之为类目或者列表,搜索也是按照商品所在的类目与一级一级的层级关系去查找和检索,一个好的目录不在于精细而是在于层级结构逻辑分明,能方便用户认知与查找同时也方便搜索引擎遍历与检索。 无少结果处理规则:当一个用户搜索一个关键词时,出现无结果或者少结果时,采用什么方式引导用户进一步点击的规则(比如用户呈现,商品陈列等),会在后面的章节详细说一说。 以上为搭建一个搜索体系的龙骨,其中有一些点如果描述起来篇幅较长,细节也较多,在处理上也有一些细微的差异,接着我们说一说 "水电气走线和软硬装潢"。 在龙骨铺设完毕之后,我们需要考虑到考核的问题,即用什么去监测搜索准确性与适用性,这个时候需要构建搜索的数据监测体系,我们叫数据埋点。搜索的流量导向方式是典型的漏斗形,因此需要按照使用者正常的搜索习惯对各个层级,首页,类目,搜索框,搜索结果页,筛选器,详情页,购物车,订单等页面进行全面的数据埋点,能够追踪用户在使用搜索是的来路去向以及在详情页的停留时间,加入购车或者形成订单的数据等等。以此来全程监测 搜索的效果。 词阵列: 在搜索体系的装修方面,核心思想是锦上添花,使用户能够更加便捷准确的找到想要的商品,其中联想词或者叫建议词、热词、历史搜索词、搜索框底纹词或者叫默认词,以及其他坑位的推荐关键词。这些功能起到的是搜索引流的作用,同时也是简化用户搜索行为提升便捷性的方式。其主要的功能由算法与运营共同管控以提升其转化率。在搜索整个链路中必须要始终保持用户能触手可及想要的关键词呈现给消费者让其点击进入详情页。 纠错与改写:纠错就不再多说,大家都懂,改写的意思就是原本用户输入的是关键词a由于某种原因将其改为关键词b进行搜索,期间用户无感知。至于这里面的原因不展开说,我会专门开辟一张进行讲解 高级筛选项:即用户在搜索关键词时,系统提取参数商品的信息聚合后,提供给消费者筛选的选项,这其中呈现样式有多重多样,逻辑也有多种,每家电商都可以从其前端显示猜个八九不离十。但是其使用率并不是衡量搜索准确性的指标,有时候是相反。 搜索结果页产品卡呈现样式:一看就懂,不需要我解释什么,不同的产品卡样式会给消费者不同的观感,因此也是影响点击率的一个方式。 运营规则与算法:这应该是花费篇幅最多的一个环节,这里先简要的介绍一下,搜索的运营规则是在搜索整体框架搭建完成前需要制定好的,由专门的搜索运营进行管控对接类目运营或者商家运营,为他们更加了解站内搜索制作教程与方法论,为后期的付费搜索打基础。 算法是在搜索整体框架搭建好之后不断迭代的动力源泉,在词阵列的展示与搜索结果商品的排序上都有着重要作用,关于算法的相关运用我会援引CSDN的相关文章给大家做一个科普的讲解,特别是在类目预测,与商品精细个性化排序上的一些见解。 以上差不多齐活了,整个搜索的框架草图已经描绘的差不多了,接着就是其中的细节讲解了,我将分成多个篇幅来一一道来,尽量白话。