搜索的目标是让用户找到合适的好商品,让优质商户的优质商品能够浮现。前面几篇讲到的搜索规则,在理想情况下是能够实现这个目标。可是现实总是充满各种挑战,其中最大的挑战就来自于搜索作弊。 作弊和SEO只是一线之差。合法利用规则是SEO,用欺骗钻漏洞就是作弊;SEO符合用户、平台和商户的利益,作弊则是伤害用户的利益让自己获利。作弊的危害是很严重的,用户搜商品,如果发现排在前面的都是通过刷销量等方式作弊的商品,对平台就会丧失信任,最轻也是没有找到合适的商品,失望而归,没有达成成交。而作弊这种风气一起来,对整个诚信经营氛围的破坏是极其严重的,更多商户不把心思花在商品和用户上,而想着各种办法去钻漏洞,好的商户也会对这个平台感到失望。 什么是搜索作弊? 搜索作弊是指为了获取良好的商品搜索排名,采用一些欺骗搜索引擎(搜索引擎暂时的算法、规则漏洞)的方法来实现目标商品的排名的行为。 具体搜索作弊的种类认定:http://guize.paipai.com/v2/detail_news_2616.shtml 如何打击搜索作弊? 反作弊的方法,一般是我们很少说。原因很简单,正所谓道高一尺,魔高一丈,无论规则或者技术多么完美,只要有足够的利益,坏人总是可以找到漏洞然后绕过我们的规则进行作弊。我们把方法透露了,坏人就更容易作弊了。所以,各位看官如果是想看具体的规则、技术或者算法之类的恐怕要失望了。在这里,我也只是讲我个人对于反搜索作弊的思路上的理解,而很少涉及到具体规则、技术或者算法的内容。 商户为什么要作弊? 打击搜索作弊,可能很多人一下子想到的就是从严打击,抓到作弊就严厉处罚。从严处理固然是一种威慑不法分子的方法,但并不系统,无法全面有效地打击搜索作弊。要打击搜索作弊,首先要了解商户的动机,为什么要作弊?原因也很简单,利益!正常经营获利有限,通过作弊走捷径获超额的利润,就不引用马克思关于资本家铤而走险的名言了,总而言之利益是趋使商户作弊的根本动力。 利润的构成 那么我们来看看,利润的构成: 利润=收入–成本 我们再把成本细分一下: 利润=收入–(直接成本+预期损失) 预期损失是因为作弊可能被惩罚而受到的损失。因为作弊不一定会被抓到,视乎平台的规则和算法,这是有一定概率的,所以公式可以再细化一下: 利润=收入–(直接成本+平台惩罚概率*惩罚力度) 通过这个公式我们就会发现,我们一开始说到的从严惩罚,它只是提高了惩罚的力度,而只要最后还是有利润,商户还是会继续作弊。这个是和我们过去的打击经验相符的,在2012年我们对作弊的打击只有下架、删除,相对来说是严厉的,下架意味着商品不能销售了,而删除,卖家的商品就没有了,销售纪录和评价这些信息也都没有了。而2013年我们增加了搜索降权和搜索屏蔽两种处罚手段,相对来说,这两种处罚手段更加柔和,不会引起商户的剧烈反弹,反而打击效果更好了,这是因为我们在其他几个方面上的动作。 收入:没有收入,就没有作弊 对商户而言,没有收入,作弊就没有任何意义。在这一块上,我们会从各个方面考虑去减小卖家作弊的收入。 之前有一段时间,CPS广告非常盛行。这种作弊很简单,就是商户发布了很低价的商品争取"按价格排序"时靠前和吸引点击,进去之后发现要跳转到另外一家正常店铺购买。如果用户购买了,那作弊的商户就可以通过销售提成,按成交付费(CPS)获得收入。这种作弊的打击就是通过限制收入实现的,我们联合营收中心将这一类链接来源的CPS广告都扣除了收入,他这样子做是根本收不到钱的。没有收入,这一类广告链接渐渐就少了。 搜索作弊行为:广告商品 定义:指卖家以宣传业务为目的,发布无实际商品或商品描述不详、仅提供卖家联系方式以及非本店铺商品信息的商品的行为(住宅类除外)。 规则详情:http://guize.paipai.com/v2/detail_news_2616.shtml 再说说虚假交易的作弊形式。销量是搜索排序中很大的一个影响因子,因此有很多卖家会去刷销量。之前我们统计销量的周期是90天,只有90天销量这个因子。那么对作弊卖家来说,销一笔销量的影响力就是90天,这段时间内它都可以获益。后来我们以综合销量取代了90天销量,更看重近30天销量和近7天销量,这样一方面加快了我们搜索里面商品的轮转,应季销量增长快的商品更快地浮现,从客观上也降低了刷销量的收益,刷一笔销量的影响程度降低了,以前可以一直受益90天,现在更多受益的是7天,30天、90天的受益小了。当然打击虚假交易必须多管其下,这里只是从收入这个角度上的小小调整措施。 搜索作弊行为:虚假交易 定义:指卖家通过不正常手段提高订单或商品成交量的行为。 详细规则请参考:http://guize.paipai.com/v2/detail_news_2457.shtml 再举一个案例,前面说到搜索降权和搜索屏蔽,这两种手段用于打击一些对搜索危害不太严重的作弊,比如"标题滥用关键词"。标题滥用关键词无非是想利用搜索量大的关键词获得更大的搜索曝光。搜索降权和搜索屏蔽与其说是处罚手段,不如说是剥夺收入的手段。比如一个商品标题同时出现"耐克"和"阿迪达斯"两个关键词,那么我们系统发现了自动将这样的商品降权,基本上作弊商品就得不到曝光了,任何搜索他们都是排在最后一页的,不会影响到我们正常的搜索体验。 搜索作弊行为:标题滥用关键词定义:指卖家为使发布的商品引人注目,或为使所发布的商品有更多搜索曝光,而在商品标题中滥用品牌名称或使用与本商品无关的品牌或其他字眼,使得消费者无法准确地找到实际所需商品的行为。 详细规则请参考:http://guize.paipai.com/v2/detail_news_2616.shtml#6 成本:道高一尺,魔高一丈,但是道高一丈,魔高两丈就要付出更多的代价 作弊是需要成本的。这个成本不仅仅是指金钱成本,其实还有时间和精力。 搜索上做了很多调整来提高卖家作弊的成本。比如前面说到刷销量的例子,最开始无论是淘宝还是拍拍,销量的计算都是用"件数",但是慢慢大家都会发现,"件数"太容易刷了,一个用户一下买个几百件,销量就上去了。这样的成本太低。后来,就将"件数"改为了"财付通付款笔数",这样刷销量的成本相对来说就提高了,要获得较高的排名,要刷很多笔订单。目前,淘宝把成本抬得更高,"付款笔数"又改为了"付款人数",而且是确认收货之后才进行计算,避免卖家提前获得刷单的收益。 通过系统提高抓作弊的覆盖面和有效性,也能大幅地提升卖家作弊的成本。它通过两方面来提高作弊成本,一是对于普通卖家,被抓到的概率增加了,它的损失也加大,成本提升了;二是精明的卖家,要想避免被系统抓到,就必须殚精竭虑想更隐蔽的办法,而这很可能提升了直接的作弊成本。据说天猫现在刷一单已经去到了十几块钱的水平,这已经比以前要高很多了,卖家作弊的时候就要想一想,刷单的成本能不能挣回来,是不是把这些钱拿去做合法的广告更合算。 我们讨论通过什么机制去抓作弊的时候,讲到一些具体的方法,然后总会有人说这里有漏洞,卖家通过一个什么方法就可以绕开。我觉得这很正常,没有什么手段是完美的。综合我们的抓作弊的成本来算,能够有效提高卖家作弊成本的办法就是好办法。卖家要研究我们的反作弊规则需要付出时间精力,需要花更多钱去绕开,这样一部分付不起成本的卖家就不会去做了。 有很多这样的例子。敏感的虚假交易问题不谈,咱们讲讲打击重复铺货的问题。之前C店卖家商品发布限制不严,卖家会通过一样的商品重复陈列来获得更多的曝光和流量。怎么抓重复铺货呢?当然,图片、类目、标题、属性都可以判断两个商品是否同一个商品。这些都做当然好,但是受制于性能、技术,我们能做的有限,所以可以简单地通过标题来做判断。当然,这个太容易绕开了,改一下标题就抓不到了。这样问题就来了,改标题其实也不是一件那么轻松的事,尤其是一些通过分销拿到商品数据包的C店垃圾卖家,他们只是批量地传几万商品,让他们一个个改几万个商品标题也是要付出成本的。通过标题判断重复铺货,至少可以打击这样一些卖家。 搜索作弊行为:重复铺货 定义:是指同一卖家在平台一个店铺或多个店铺发布重复商品的行为。 重复铺货认定和处罚规则:http://guize.paipai.com/v2/detail_news_2444.shtml 各类目关于重复铺货的补充说明:http://guize.paipai.com/v2/detail_news_2460.shtml 正所谓道高一尺,魔高一丈。但是道高一丈,魔高两丈就要付出更多的代价。这个代价高到魔都觉得不值得的时候,我们就赢了。 机会成本 卖家怎么判断值不值得?这就是经济学里面常讲的机会成本。卖家把作弊的时间精力和金钱,放到合法经营上,比如日常促销或者是广告投放,如果能获得更多的收益,卖家就会选择合法经营。 所以,我们的目标不是想让上面公式中的利润变为0,而是让这个投资回报率低于日常经营的平均回报率。所以,从这种角度来说,商户正常经营能不能赚到钱也是和平台作弊程度是相关的。 多管齐下 打击作弊不是一棍子就能打死的,通常来说要多管齐下。我们回顾一下公式: