搜索引擎常用User-Agent汇总
User-Agent (简称UA)是 http 协议的一个请求头(header),用来让服务端识别发起请求的用户软件信息,包含有应用类型、操作系统、软件提供商、版本号等。
User-Agent中文翻译为用户代理,最常见的网页浏览器就是一个“帮助用户获取、渲染网页内容并与之交互”的用户代理;电子邮件阅读器也可以称作邮件代理。
对于搜索引擎来说,搜索引擎的爬虫,就是帮助搜索引擎获取、理解网页内容的用户代理。
关于User-Agent 的相关的规范可以看:RFC 7231, section 5.5.3: User-Agent,RFC 2616, section 14.43: User-Agent。
在SEO中,UA经常被用在服务端识别网络爬虫类型,本文详细讲解各个爬虫的 UA特征。
Baiduspider
百度曾经是排名第二的搜索引擎,在 Google 还没退出中国之前,中文搜索质量很高,即使让用户选择,大多数也会优先选择百度,但后面几年的事大家都知道了,用户体验越来越差,个人感觉现在 bing 的中文搜索质量都比百度好了,从我们统计的爬虫数据来看,google 和 bing 是最勤劳的,而且收录频率和数量较好,百度搜索速度较差,响应时间久。
百度搜索引擎爬虫,相关信息:BaiduSpider,和 GoogleBot 一样根据功能分很多种,我们也只需通过 baiduspider
字段判断即可。
产品名称 | 对应user-agent |
---|---|
网页搜索 | Baiduspider |
移动搜索 | Baiduspider |
图片搜索 | Baiduspider-image |
视频搜索 | Baiduspider-video |
新闻搜索 | Baiduspider-news |
百度搜藏 | Baiduspider-favo |
百度联盟 | Baiduspider-cpro |
商务搜索 | Baiduspider-ads |
Googlebot
谷歌搜索引擎,是目前市场占有率最高的搜索引擎,达到了 92.71%(数据来源:2021年8月,全球&中国搜索引擎市场份额排行榜),爬虫UA 为 Googlebot,通常有更细致的区分,比如新闻爬虫、广告爬虫、PC 网页爬虫,移动端爬虫,可以从详细的 UA 信息中看到,作为网站内容提供方,一般我们只需要判断 UA 中是否带有 googlebot
字段就可以了。
完整的 UA 列表可以看:Google 抓取工具(用户代理)概览,搜索控制台:Search Console
谷歌的爬虫是效率最高的,一般网页一有新内容,很快就可被收录。
搜狗Sogou爬虫
Sogou PC UA
Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou inst spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou spider (+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou 移动 UA
Sogou wap spider(+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou 新闻 UA
Sogou News Spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou 图片 UA
Sogou Pic Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou 视频 UA
Sogou Video Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Sogou 未知 UA
Sogou Push Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
360搜索
360搜索,是周鸿祎的北京奇虎科技有限公司开发的一款搜寻引擎,主打“安全、精准、可信赖”。 360搜索于2012年8月16日上线, 9月启用独立域名so.com。“奇虎”称,其中“S”代表Safe,“O”代表Open。
360搜索User agent:
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider
必应爬虫 User agent
Bing.com 是一款微软公司推出的用以取代 Live Search 的搜索引擎。简体中文版 bing 于 2009 年 6 月 1 日正式对外开放访问。中文名称被定为“必应”,有“有求必应”的寓意。
近年来bing的搜索质量不断提升,用户体验也越来越好,国际市场占有率在 2.73%,国际排名第二。
必应爬虫User agent:
Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534+ (KHTML, like Gecko) BingPreview/1.0bMozilla/5.0 (Linux; Android 8.0.0; MHA-AL00 Build/HUAWEIMHA-AL00; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/68.0.3440.91 Mobile Safari/537.36 BingWeb/6.9.6
Mozilla/5.0 (Linux; Android 8.0.0; MI 6 Build/OPR1.170623.027; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/70.0.3538.110 Mobile Safari/537.36 BingWeb/6.9.6
Mozilla/5.0 (Linux; Android 8.0.0; ONEPLUS A3010 Build/OPR1.170623.032; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/67.0.3396.87 Mobile Safari/537.36 BingWeb/6.9.0Mozilla/5.0 (iPhone; CPU iPhone OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)
Mozilla/5.0 (iPhone; CPU iPhone OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53 BingPreview/1.0b
字节跳动 User agent
字节一直想在搜索上分一杯羹,无论是推出头条搜索,还是收购互动百科并改名为秒懂百科,以及曾经花重金投入的悟空问答,字节都是希望自己能过在搜索流量分发领域,找到属于自己的新增长点。
字节跳动 User agent:
统一的User agent标志为:“Bytespider”,具体的User agent为:
Mozilla/5.0 (compatible; Bytespider;[https://zhanzhang.toutiao.com/] AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.0.0 Safari/537.36
Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; Bytespider; [https://zhanzhang.toutiao.com/]
Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2 like Mac OS X) AppleWebKit/537.36 (KHTML, like Gecko) Version/7.0 Mobile Safari/537.36 (compatible; Bytespider; [https://zhanzhang.toutiao.com/]
Applebot
这是苹果的爬虫UA,详细信息可以看:关于 Applebot,苹果的爬虫主要用在 Siri 还有产品建议上。
Apple User agent:
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5
(KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Applebot/0.1)
在SEO的过程中,准确识别User-Agent,可以:
- 维护站点信息安全;
- 保障抓取效率最大化;
- 优化服务器负载;
同时,通过对日志中User-Agent分析,还可以帮助我们评估不同搜索引擎对站点的访问频次、深度、抓取效率,以便我们有针对性的做出与之相对应的优化策略。
评论
发表评论