一些网站设计技术对搜索引擎说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。
常见的蜘蛛陷阱分为以下的几种:
常见一:JavaScript链接
示例:<a href="javascript:window.location.href='2';" target="_blank">米趋</a>
常见二:在网页里穿插FLASH
示例: flashObject('index.swf')
常见三:Sesssion ID
示例:百度推广官方网站
http://fengchao.baidu.com/nirvana/main.html? userid=2473126#/manage/plan~_r=iwqk6gnq1y
http://fengchao.baidu.com/nirvana/main.html? userid=2473126#/manage/plan~_r=3br2o0us12
其中,红色字体为Sesssion ID值
常见四:框架结构(iframe)
示例: 百度MP3音乐盒
/* NOTE: remove when alb release
*#girliframe{width:340px; height:500px;border:0;} **/
红色代码为百度音乐盒调用框架结构
常见五:动态RUL、参数过多RUL
示
例:
http://list.tmall.com/search_product.htm?spm=3.54626.101437.97&navlog=1&nav=spu-cat-qp&style=g&sort=s&
q=%BF%C6%B1%A6&n=40&s=0&cat=50030199&is=cate#J_crumbs
此URL中,动态参数过多,不利于搜索引擎蜘蛛抓取
常见六:社区等需要登陆的页面
蜘蛛和人一样如果需要访问一些没有权限的页面的话,一样需要登陆进去,但是蜘蛛不会和人一样申请账号来登陆,所以抓取不到没有权限的页面。
结论:在做SEO的时候尽量避免以上的一些不利于搜索引擎抓取的代码及结构,让搜索引擎更容易的看懂你的网站!
最好的站内结构可以及时的来应对百度频繁的算法。