快生活 - 生活常识大全

搜狗是怎么在大数据时代中新词收录微创新的


  进入在中国不到3个月的美国VR公司Oculus发现,通过搜狗输入法输入公司的英文名称,就可以在搜狗输入法的中文键盘内跃然而出,而不在需要进行中英文键盘的切换。据说,这令Oculus公司很吃惊。
  其实这是搜狗输入法的微创新——"新词收录"所产生的效果。搜狗输入法现在通过算法来判断是否收录一个新词进入词库,它是从这个新词爆发的广度和深度去判断和计算的:广度就是有多少人开始输入这个完整的单次,深度是用户输入这一新词的频率是多少。
  这个基于搜狗输入法样本量足够大的情况之下,这种通过深度广度标准收录新词的方式具备了相当大的客观性和准确性——因此,换个角度思考,不论是中资还是外资企业,看看名字何时被完整收入词库,也是拿来判断其推广营销或者业务是否成功的一个标准。
  微创新产生的经济效益
  被收录入搜狗输入法后,一个新词,尤其外文词汇,第一个好处其实是为用户节省了大量的时间,也提高了沟通效率。如果这个词汇在搜狗输入法中被输入的深度广度足够,一旦键入缩写,与之相关的词汇就能自动被列出,输入速度和方便程度都能被极大提高。
  这就是输入法上的微创新,不要小看这类功能设置上给用户带来的一点点便利——它背后有坚实的技术基础。搜狗输入法的这类微创新非常类似2004年夏天由谷歌一个工程师凯文-吉布斯发明的"Google Suggest"搜索建议模型,用户查找天气预报(weather forecast)时,只要输入we,谷歌就自动推测搜索结果,并给一个下拉列表,让用户不用全部输入就能点击完整的查询请求。现在这类创新模式已经改变了全球几十亿人的使用习惯,每次搜索过程都能够为用户节省几十秒时间,全球的谷歌用户每天能够因此节省几千万个小时。
  同理,搜狗输入法的使用频次可比谷歌搜索频次高很多,通过通过新词收录这个微创新,7亿用户平均每天就可以节省高达百万个小时,大幅度提高了线上沟通的效率,也节省了大量用户的时间——这两者相加,就是微创新的经济效益。
  新词录入也是市场推广的微创新
  人们对于新事物的认知需要时间,无论公司、平日很少涉及的概念或者词汇。传统的推广模式,是需要投放大量广告不断刷存在感才可让用户对新事物产生印象,让提及率得到提高。这样的模式需要大量的广告创意支撑,并且伴随多种渠道的广告投放,自然要花很多钱——但效果如何却未可知。
  所以很多中国本土品牌会处心积虑想出不少谐音和容易记的名字与广告词,外国公司则必须选择本地化的道路,但这仍旧需要金钱和时间的积累。
  但如果一个广告营销人,能够微创新地把搜狗输入法新词当做一个推广模式的话,那么其实用户只需要对前几次字母或者大概的名称有印象,则品牌词的全称就会在输入法上跃然而出,立即呈现,一次又一次在用户输入界面上刷新"存在感。"
  未来的创新将依赖大数据进行
  搜狗的这种不断从用户使用行为和频次中进行微创新的做法,是符合大数据时代的趋势的。
  事实上,早在过去的十几年里,微软都在依靠自身的力量去对Word系统里的查找拼写错误功能来进行维护,他们会依靠不断更新的字典去改进Word的拼写——如果Word系统不及时根据字典更新,就会将用户的一些词汇判断为拼写错误。过去,微软为此每年要花费数百万美元。
  但是让我们来看看谷歌在互联网环境下是怎么做的,谷歌靠每天处理的几十亿查询中输入搜索框里的错误拼写,给用户提供了一个巧妙的反馈系统。当用户拼错字的时候,谷歌会显示出:"你要找的是不是流行病学"这样的反馈,让用户重新点击,明确自己要查询的内容,这样的做法比方便用户更有意义,因为随着这个系统的不断完善,即使用户输入不精确的内容也能获得正确结果。
  就这样,通过大数据、交互和算法,谷歌获得了一个免费的拼写检查。
  而搜狗现在在输入法上的创新,例如细胞词库,也是基于以上这几个原则与基础。细胞词库是搜狗首创的、开放共享、可在线升级的细分化词库的功能,它可以根据用户的输入习惯满足对方的个性化和极细类别词汇的输入,而这些词是源于搜狗搜索引擎不断更迭的热门关键词——真正的聪明的公司总是能够利用交互产生的这些数据以改善现有的服务或开发新服务。
  正如《大数据时代》一书中所说,数据利用可以非常巧妙,微小的交互、反馈就像碎屑,但如果能够被收集在一起,"就能锻造成一块闪亮的金元宝"。
  版权:本作品由作者首发于经理人分享(managershare.com)。若非授权,转发时切勿删除版权信息,否则追究相应责任。
网站目录投稿:语阳