谷歌搜索和百度智能对比谷歌有点可怕

　　近日，各家媒体纷纷报道，谷歌回到中国了，对此，李彦宏表示对百度的技术非常有信心，并自认为在中国，凭借技术和创新方面可以打败谷歌，并不担心谷歌入华。结果，转天就被一些不甘寂寞的小伙伴打脸…
　　在HUPU步行街上面看到有网友做的百度和谷歌图片搜索的对比很有趣，自己也亲自试一下，百度上搜索＂ 滑嫩＂、＂ 鲜嫩＂ 等全是美女图片(哇~!被百度暴露了…捂脸…)，而谷歌上搜索这些内容，出现的则是一些美食等。emmm…
　　被爆料后，百度程序猿们加班加点，总算是把大家揪出来的敏感词汇处理了。
　　可是，今天发生的一件事，让我意识到，不仅仅是搜索算法，谷歌在另外一个方面早就超过了百度…
　　今天用百度搜索了一个QQ 号，图片搜索空空如也，什么结果也没有。
　　不死心的我又用Google搜索了一下，结果…
　　你可能会问，Google搜索出来的是些什么东西，完全看不懂啊~!我来告诉大家，我搜索的这个QQ是同事在office上注册用的用户名，哇!有些东西虽然年代久远，但是不难看出，应该是与他相关联的!
　　也就是说，Google 现在已经开始对互联网上的图片文本做了识别提取，并建立索引!
　　在我们的印象中，搜索引擎一般会基于图片旁边的文字描述给图片打标签，或者利用神经网络识别图片上的物体，并不会扫描读取图片上的文本内容。
　　用神经网络给图片分类
　　所以很多时候你搜索图片上的文本，搜索引擎不会给你返回正确结果。
　　不知道什么时候，谷歌已经偷偷给自己的搜索引擎升了个级!?
　　小哥又借用了一个小伙伴的身份证前几位，分别在百度和谷歌上搜索＂ 3709831986 ＂，百度依然什么也搜不出来，而谷歌返回了一堆结果。
　　这些图片上大部分都有3709831986这几个数字，有一些保险单的内容，有营业执照，火车票…只要与这串数字有关的信息都给你展示出来了…佩服…
　　大家也可以试试自己的身份信息能不能被搜到
　　给，这是哥三十年的膝盖，请收下…
　　不过让我好奇的是，谷歌搜索引擎是什么时候开始识别图片文本的?
　　谷歌没有给出过官方消息，相关的讨论也寥寥无几，2016 年的时候谷歌的大佬还否认过谷歌在识别图片文本。
　　不过在去年7 月的时候，有一个博客主已经发现，所以至少去年谷歌就已经偷偷升了级~
　　其实，谷歌很早就积累了图片的文本识别相关技术—— OCR ( 光学字符识别)。
　　这个技术本身并不难，最早谷歌将OCR 应用在书籍扫描转换文本上，这样只要你搜索书中的一句话，它就能推给你正确的书籍。
　　现在这个技术应用也越来越广泛，许多手机APP都可以支持。
　　现在，谷歌已经将这项技术应用在互联网的所有图片上。
　　之所以感到惊讶，是因为我们每天要产生大量图片，光在Facebook 和Instagram 上每天就产生近4 亿张图片，微博上每天产生1.5 亿张图片，保守估计互联网上每天要多出8 亿图片。
　　而谷歌对每张图片都进行OCR 算法处理，获取里面的文本信息，这是一项海量的工程，消耗太大了。但谷歌还是做到了，不得不感叹谷歌的强大。
　　正因如此，大大提高了我们使用搜索引擎的效率，更容易找到自己想要的结果~
　　不过在以前，正是因为我们默认搜索不出图片上的文本，才会放心的把一些资料保存成图片放到网上。
　　现在随着这项技术的成熟，恐怕图片也不再保险…谁能想到一个身份证号，就把身份证图片都搜出来了呢?
　　如何兼顾技术和隐私，恐怕未来需要谷歌好好处理一下~
　　————————我是分割线———————
　　图文来源：ZAKER新闻(部分、侵删)
　　参考资料：
　　1.《用谷歌和百度同时搜索＂鲜嫩、滑嫩、胸膜＂等词后…李彦宏赢了》，北美留学生日报
　　2.《 Google: No, We Don＂t Understand Text In Images 》，Barry Schwartz
　　3.《 How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read 》，Bernard Marr
　　4.《Does Google Read Text in Images? NEW Evidence Says Yes!》，Steve Toth
　　5.《互联网上一天产生的流量，到底有多少?》，财经头条
　　iiiiiiiiii
　　＂ 吓得我赶紧把网盘里的图片都删了… ＂
网站目录投稿：雨琴