快生活 - 生活常识大全

警惕一些能限制蜘蛛爬行的网站陷阱


  事出必有因,蜘蛛只是一个机器人,它由程序代码构成,必须遵循其规定去爬行网站,如果网站存在一些网站陷阱,则会让蜘蛛爬行变得不顺畅,从而引致一系列的问题。到底哪些网站陷阱成为了蜘蛛爬行的绊脚石?
  陷阱一:网站地图不正确
  网站地图是一个非常有用的网站工具,对于用户和蜘蛛来说,一副完整、正确的网站地图都能很好地识别整个网站的架构,从而更好地浏览和爬行网站。由于一些站长对于代码的不熟悉,以及对网站的架构不熟悉,就随便选了一个权威性不好的工具来制作了一副不完整或不正确的网站地图,最后的结果就是让蜘蛛爬行时陷入其中,最终"迷路"了。
  选择一个权威性好的工具来制作网站地图,比如站长工具、百度站长平台工具等,如果自己对网站比较熟悉,最好能够自己手工制作,并亲身多次测试,保证好网站地图的正确性和完整性。
  陷阱二:网站的死链接数量巨大
  所谓的死链接就是就是返回代码为404的错误页面链接,这类链接通常产生于网站改版后、或者网站更换域名后。死链接的存在对于用户体验和蜘蛛爬行来说都是非常不好的。死链接无疑就是阻挡着蜘蛛的爬行,当蜘蛛接二连三地碰到这些不该出现的死链接时,就会产生对网站的不信任,最终会放弃爬行网站。
  (1)提交死链接。利用百度站长平台的"死链提交"工具来提交网站死链,具体说明请参考百度站长工具。
  (2)对死链接进行重定向或者删除,如果死链接的位置不是很重要,可以把其重定向到首页,如果位置比较重要,数量也比较多,就可以选择删除死链接,可以使用工具来删除。
  陷阱三:网址包含参数过多
  尽管百度优化指南官方表明,目前百度搜索机器人也能像谷歌机器人一样收录动态参数网站,但是静态化url的网站永远要比动态化url收录更有优势。因此,如果你的网站像下面的网址一样,那就可能会导致蜘蛛爬行不顺畅了:
  在选择做站程序前,一定要考虑该程序是否支持网站url静态化,并且在日后维护中也要注意网站url是否真正做到静态化,尽量舍弃包含参数的动态网址的做法。
  陷阱四:网站过多锚文本
  网站锚文本过多,造成内链链轮。外部链轮相信大家都会认识,但是其实内部链接也是可以产生链轮的。很多站长为了提升关键词排名,不惜使用过多的锚文本,然后造成页面之间的链接轮回效应,最后也让蜘蛛走进了无底洞,无法走出来了。
  清除过往的,带有链接交叉性的锚文本,并且尽量做到需要时才添加锚文本,滥用锚文本只会让百度蜘蛛更一步不认可你的网站。
  百度搜索引擎蜘蛛永远只是一个程序机器人,它的智力永远比不上我们,但是我们还是应该尊重它,为它提供一个爬行顺畅的网站环境,这样才能确保我们的网站能够持续、健康地发展下去。
网站目录投稿:觅雪