搜索引擎常用User-Agent汇总

User-Agent (简称UA)是 http 协议的一个请求头(header),用来让服务端识别发起请求的用户软件信息,包含有应用类型、操作系统、软件提供商、版本号等。

User-Agent中文翻译为用户代理,最常见的网页浏览器就是一个“帮助用户获取、渲染网页内容并与之交互”的用户代理;电子邮件阅读器也可以称作邮件代理

对于搜索引擎来说,搜索引擎的爬虫,就是帮助搜索引擎获取、理解网页内容的用户代理。

关于User-Agent 的相关的规范可以看:RFC 7231, section 5.5.3: User-AgentRFC 2616, section 14.43: User-Agent

在SEO中,UA经常被用在服务端识别网络爬虫类型,本文详细讲解各个爬虫的 UA特征。

Baiduspider

百度曾经是排名第二的搜索引擎,在 Google 还没退出中国之前,中文搜索质量很高,即使让用户选择,大多数也会优先选择百度,但后面几年的事大家都知道了,用户体验越来越差,个人感觉现在 bing 的中文搜索质量都比百度好了,从我们统计的爬虫数据来看,google 和 bing 是最勤劳的,而且收录频率和数量较好,百度搜索速度较差,响应时间久。

百度搜索引擎爬虫,相关信息:BaiduSpider,和 GoogleBot 一样根据功能分很多种,我们也只需通过 baiduspider 字段判断即可。

产品名称对应user-agent
网页搜索Baiduspider
移动搜索Baiduspider
图片搜索Baiduspider-image
视频搜索Baiduspider-video
新闻搜索Baiduspider-news
百度搜藏Baiduspider-favo
百度联盟Baiduspider-cpro
商务搜索Baiduspider-ads

Googlebot

谷歌搜索引擎,是目前市场占有率最高的搜索引擎,达到了 92.71%(数据来源:2021年8月,全球&中国搜索引擎市场份额排行榜),爬虫UA 为 Googlebot,通常有更细致的区分,比如新闻爬虫、广告爬虫、PC 网页爬虫,移动端爬虫,可以从详细的 UA 信息中看到,作为网站内容提供方,一般我们只需要判断 UA 中是否带有 googlebot 字段就可以了。

完整的 UA 列表可以看:Google 抓取工具(用户代理)概览,搜索控制台:Search Console

谷歌的爬虫是效率最高的,一般网页一有新内容,很快就可被收录。

搜狗Sogou爬虫

Sogou PC UA

Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou inst spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou spider (+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou 移动 UA

Sogou wap spider(+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou 新闻 UA

Sogou News Spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou 图片 UA

Sogou Pic Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou 视频 UA

Sogou Video Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

Sogou 未知 UA

Sogou Push Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

360搜索

360搜索,是周鸿祎的北京奇虎科技有限公司开发的一款搜寻引擎,主打“安全、精准、可信赖”。 360搜索于2012年8月16日上线, 9月启用独立域名so.com。“奇虎”称,其中“S”代表Safe,“O”代表Open。

360搜索User agent:

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider

必应爬虫 User agent

Bing.com 是一款微软公司推出的用以取代 Live Search 的搜索引擎。简体中文版 bing 于 2009 年 6 月 1 日正式对外开放访问。中文名称被定为“必应”,有“有求必应”的寓意。

近年来bing的搜索质量不断提升,用户体验也越来越好,国际市场占有率在 2.73%,国际排名第二。

必应爬虫User agent:

Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534+ (KHTML, like Gecko) BingPreview/1.0b

Mozilla/5.0 (Linux; Android 8.0.0; MHA-AL00 Build/HUAWEIMHA-AL00; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/68.0.3440.91 Mobile Safari/537.36 BingWeb/6.9.6
Mozilla/5.0 (Linux; Android 8.0.0; MI 6 Build/OPR1.170623.027; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/70.0.3538.110 Mobile Safari/537.36 BingWeb/6.9.6
Mozilla/5.0 (Linux; Android 8.0.0; ONEPLUS A3010 Build/OPR1.170623.032; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/67.0.3396.87 Mobile Safari/537.36 BingWeb/6.9.0

Mozilla/5.0 (iPhone; CPU iPhone OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)
Mozilla/5.0 (iPhone; CPU iPhone OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53 BingPreview/1.0b

字节跳动 User agent

字节一直想在搜索上分一杯羹,无论是推出头条搜索,还是收购互动百科并改名为秒懂百科,以及曾经花重金投入的悟空问答,字节都是希望自己能过在搜索流量分发领域,找到属于自己的新增长点。

字节跳动 User agent:

统一的User agent标志为:“Bytespider”,具体的User agent为:

Mozilla/5.0 (compatible; Bytespider;[https://zhanzhang.toutiao.com/] AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.0.0 Safari/537.36

Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; Bytespider; [https://zhanzhang.toutiao.com/]

Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2 like Mac OS X) AppleWebKit/537.36 (KHTML, like Gecko) Version/7.0 Mobile Safari/537.36 (compatible; Bytespider; [https://zhanzhang.toutiao.com/]

Applebot

这是苹果的爬虫UA,详细信息可以看:关于 Applebot,苹果的爬虫主要用在 Siri 还有产品建议上。

Apple User agent:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5
(KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Applebot/0.1)

在SEO的过程中,准确识别User-Agent,可以:

  • 维护站点信息安全;
  • 保障抓取效率最大化;
  • 优化服务器负载;

同时,通过对日志中User-Agent分析,还可以帮助我们评估不同搜索引擎对站点的访问频次、深度、抓取效率,以便我们有针对性的做出与之相对应的优化策略。

评论

此博客中的热门博文

2022年SEO页面Title撰写指南

什么是SEO(搜索引擎优化)

观点,大型网站SEO不需要人为进行外链部署