百度网盘超级会员官方超低价

 找回密码
 注册会员
查看: 1189|回复: 8
收起左侧

最新最准确各大搜索引擎蜘蛛名称大全

[复制链接]
发表于 2020-11-3 20:39:39 | 显示全部楼层 |阅读模式
最新最准确各大搜索引擎蜘蛛名称大全
1、百度蜘蛛:Baiduspider

网上的资料百度蜘蛛名称有BaiduSpider、baiduspider等,都洗洗睡吧,那是旧黄历了。百度蜘蛛最新名称为Baiduspider。日志中还发现了Baiduspider-image这个百度旗下蜘蛛,查了下资料(其实直接看名字就可以了……),是抓取图片的蜘蛛。
常见百度旗下同类型蜘蛛还有下面这些:Baiduspider-mobile(抓取wap)、Baiduspider-image(抓取图片)、Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)。
注:以上百度蜘蛛目前常见的是Baiduspider和Baiduspider-image两种。

2、谷歌蜘蛛:Googlebot

这个争议较少,但也有说是GoogleBot的。谷歌蜘蛛最新名称为“compatible; Googlebot/2.1;”。还发现了Googlebot-Mobile,看名字是抓取wap内容的。

3、360蜘蛛:360Spider,它是一个很“勤奋抓爬”的蜘蛛。

4、SOSO蜘蛛:Sosospider,也可为它颁一个“勤奋抓爬”奖的蜘蛛。

5、雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!

名称中带“Slurp”和空格,名称有空格robots里名称可以使用“Slurp”或者“Yahoo”单词描述,不知道有效无效。

6、有道蜘蛛:YoudaoBot,YodaoBot(两个名字都有,中文拼音少了个U字母读音差别很大嘎,这都会少?)

7、搜狗蜘蛛:Sogou News Spider

搜狗蜘蛛还包括如下这些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,
(参考一些网站的robots文件,搜狗蜘蛛名称可以用Sogou概括,无法验证不知道有没有效)
看看最权威的百度的robots.txt ,http://www.baidu.com/robots.txt 就为Sogou搜狗蜘蛛费了不少字节,占了一大块领地。
“Sogou web spider;Sogou inst spider;Sogou spider2;Sogou blog;Sogou News Spider;Sogou Orion spider”目前6个,名称都带空格。
线上常见"Sogou web spider/4.0" ;"Sogou News Spider/4.0" ;"Sogou inst spider/4.0" 可以为它颁个“占名为王”奖。

8、MSN蜘蛛:msnbot,msnbot-media(只见到msnbot-media在狂爬……)

9、必应蜘蛛:bingbot

线上(compatible; bingbot/2.0;)

10、一搜蜘蛛:YisouSpider

11、Alexa蜘蛛:ia_archiver

12、宜sou蜘蛛:EasouSpider

13、即刻蜘蛛:JikeSpider

14、一淘网蜘蛛:EtaoSpider

"Mozilla/5.0 (compatible; EtaoSpider/1.0; http://省略/EtaoSpider)"
根据上述蜘蛛中选择几个常用的允许抓取,其余的都可以通过robots屏蔽抓取。如果你暂时空间流量还足够使用,等流量紧张了就保留几个常用的屏蔽掉其它蜘蛛以节省流量。至于那些蜘蛛抓取对网站能带来有利用的价值,网站的管理者眼睛是雪亮的。
另外还发现了如 YandexBot、AhrefsBot和ezooms.bot这些蜘蛛,据说这些蜘蛛国外噶,对中文网站用处很小。那不如就节省下资源。

   我们可以归纳总结为如下:

   百度 baidu.com----Baiduspider

  http://www.baidu.com/search/spider.htm

  谷歌 google.com----Googlebot

  http://www.google.com/bot.html 中文版请打开以下页面

  http://www.google.cn/support/webmasters/bin/topic.py?topic=8843

  雅虎 yahoo.com----Yahoo

  http://misc.yahoo.com.cn/help.html 打开后跳转到以下页面

  http://help.cn.yahoo.com/property.html?product=websearch

  有道 yodao.com----YodaoBot

  http://www.yodao.com/help/webmaster/spider/

  搜搜 soso.com----Sosospider/Sosoimagespider(网页蜘蛛/图片蜘蛛)

  http://help.soso.com/webspider.htm

  http://help.soso.com/soso-image-spider.htm

  搜狗 sogou.com----sogou

  http://www.sogou.com/docs/help/webmasters.htm#07

  微软 msn.com----msnbot

  http://search.msn.com/msnbot.htm 打开后跳转到以下页面

  http://help.live.com/help.aspx?m ... oject=wl_webmasters

  以下是几只收获(抓取页面)不劳动(不来流量)的蜘蛛 可以考虑禁了它们爬行 省空间流量

  国外搜索引擎

  gigablast.com----Gigabot

  http://www.gigablast.com/spider.html

  国外搜索引擎

  webalta.net----WebAlta

发表于 2021-4-9 11:36:47 | 显示全部楼层
编程入门
发表于 2021-4-9 15:20:52 | 显示全部楼层
xue.itjishu.cn学优IT论坛这个域名好记
发表于 2021-4-9 20:36:05 | 显示全部楼层
好资料
发表于 2021-4-10 20:03:12 | 显示全部楼层
java编程
发表于 2021-4-13 10:48:28 | 显示全部楼层
感谢楼主的好资料
发表于 2021-4-14 16:41:09 | 显示全部楼层
作为新手就是要好好看看
发表于 2021-4-15 08:38:41 | 显示全部楼层
IT教程网
发表于 2021-4-29 13:59:49 | 显示全部楼层
辛苦拉楼主

升级VIP| sitemap.xml| 学IT技术|学优IT技术网|学优IT论坛

GMT+8, 2024-4-27 16:37

Powered by xue.itjishu.cn

Copyright © 2012-2023, itjishu.cn.

快速回复 返回顶部 返回列表