网站地图    收藏   

主页 > 前端 > 网站SEO >

小菜鸟带你深入了解百度蜘蛛 - 搜索优化 - 自学

来源:自学PHP网    时间:2015-04-15 10:59 作者: 阅读:

[导读] 什么是百度蜘蛛? 百度蜘蛛,英文名是Baiduspider是百度搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在百度搜索引擎中搜...

  什么是百度蜘蛛?

  百度蜘蛛,英文名是“Baiduspider”是百度搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。 --来自百度百科

  每个朋友都希望自己的站在百度上有好的排名,而网站的收录和排名和百度蜘蛛有很大的关联,大家知道百度蜘蛛是怎么工作的么?(所谓知己知彼,百战不殆)下面我们就一起来了解下吧?

2305286_222437023_2.jpg

  蜘蛛的工作流程

  其实,百度蜘蛛每天的工作很简单,它主要就是负责抓取互联网中的内容,然后建立索引,然后在进一步的建立 排名。有些朋友可能要问,我的站蜘蛛每天访问几百次,几千次,可是他为什么就是不收录?其实蜘蛛抓取回来的东西都是先存放在一个临时数据库内的,然后在通 过一系列的算法过滤掉一些垃圾页面和内容,剩下来的才是百度真正收录的。

  那么百度会过滤掉一些什么样的页面和内容呢?1:一些使用了自动跳转功能的页面,这样的页面百度会认为是作弊的,果断会在过滤是被过滤掉。2:一个 页面中所包含的链接不要太多,这样也会导致百度不能正常收录,具体不能超过多少,百度也没有明文规定,只能靠大家琢磨了。3:对于互联网上已经满天飞的信 息,百度可能不会收录,除非你的网站权重非常高,就算你采集也要采集一些新鲜的东西。(建议大家最好还是每天写点原创的,每天也不用写太多,一两篇就可以 了)4;违返我天朝法律的内容百度也会过滤掉(这一点不用多说 都懂)5:网站结构复杂,有的网站内容都放在好几层目录下面,这样百度可能就不会抓取到最后的内容页了,还是那句话除非你的权重特别高,这样你的目录就算 再深百度也会去抓取,一般情况下我们做站目录在一到两层就好了,否则就有可能影响蜘蛛的抓取。

  蜘蛛真的很厉害?

  看了上面的,你是不是觉得蜘蛛太厉害了,是不是不知道该怎么办了,不要怕其实蜘蛛只是一个事先写好的程序而已, 有很多东西都是它不能够识别的,目前的百度蜘蛛还只能够识别文本信息,至于图片,flash,视频等内容蜘蛛都无法识别,使用flash建设的网站百度可 能不会收录。所有大家在建设网站的时候尽量要少用图片,flash,等内容,如果必须要使用到,建议大家给图片加上 alt 标签,让蜘蛛明白这张图片是干什么用的。有些朋友就利用蜘蛛这一点的不足,在图片的alt标签内大量堆砌关键字,从而达到排名的效果。

  机器永远都是机器,蜘蛛只是按照一种格式,每天在互联网中游荡,发现一些喜欢的东西就会收藏起来。为什么说蜘蛛永远都是一个机器呢?蜘蛛对于一些它没有见 过的东西和热点新闻非常的敏感,所以各位站长们都在想尽办法去做原创,有些站长不会写原创文章,那怎么办呢?这个时候出现了伪原创,就是将一篇文章放到工 具里点一下就成了原创的文章,其实就是给内容换成了同义词(这就体现了我国文化博大精深),这样一来,等蜘蛛过来一看,就会认为这是一篇原创的文章,毕竟 蜘蛛不是人,它没有思维,更不可能了解汉字的魅力。

  后言:

  蜘蛛就是一个别人写好的程序,有很多地方都不够完善,我们只需要要了解蜘蛛的习性,投其所好,相信会带来不错的效果。

  本文由很有笑:http://www.henyouxiao.com 编辑撰写 (转载请保留链接 谢谢)

自学PHP网专注网站建设学习,PHP程序学习,平面设计学习,以及操作系统学习

京ICP备14009008号-1@版权所有www.zixuephp.com

网站声明:本站所有视频,教程都由网友上传,站长收集和分享给大家学习使用,如由牵扯版权问题请联系站长邮箱904561283@qq.com

添加评论