很多SEO从业人员在第一次接触这个行业时,经常会问——百度spider是什么?我们可以了解到百度蜘蛛是用来抓取网站链接IP的,小编经常听到百度蜘蛛来的太频繁,服务器就会被抓爆,如果你不能识别百度蜘蛛,你怎么知道百度蜘蛛被抓爆了呢?也有百度蜘蛛不来的情况,有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但无法识别百度的IP。
那么如何识别正确的百度spider呢?来来回回,只要做两点,就能正确识别百度蜘蛛
一、查看UA,如果UA都不对,可以直接判断非百度搜索的蜘蛛,目前对外公布过的UA是:
移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
新增渲染UA:
移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1(compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
PC UA:Mozilla/5.0(compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
第二,通过DNS反检查IP,站长可以判断蜘蛛是否来自百度搜索引擎。根据不同的平台验证方法,例如,Linux/Windows/OS平台下的验证方法如下:
(1)在Linux平台下,可以使用host IP命令对IP进行解密,以确定它是否来自Baiduspider。Baiduspider的主机名的格式为*。Baidu.com或*。Baidu.jp,而非- *。Baidu.com或*。jp是一个模仿。
(2)在Windows平台或IBM OS/2平台上,可以使用nslookup IP命令解解码IP,以确定它是否从Baiduspider获取。打开命令处理器并输入nslookup xxx。XXX。XXX。XXX。XXX (IP地址),可以解析IP来确定它是否来自于抓取的Baiduspider。Baiduspider的主机名的格式为*。
(3)在MAC OS平台上,可以使用dig命令反转IP,判断IP是否来自Baiduspider
(3)、 在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。