博文

目前显示的是 十二月, 2021的博文

女性更容易成为搜索诈骗受害者?百度搜索受骗用户样本简析

图片
缘起 最近为一个客户优化网站在百度搜索结果中的点击效果。采取的措施之一就是将网站在百度搜索结果增加百度保障的图标,以提升网站在搜索用户心目中的可信度,从而提升点击比例。在开通百度保障的过程中,在 百度保障平台 的首页,有一个模块列举了用户通过百度搜索被骗后获得百度保障赔偿的三个案例。 百度保障平台首展示的案例 从这三个案例来看,其中例举的受骗用户都是女性,于是我就有了这样一个疑问:是否是说,女性更容易成为搜索诈骗受害者? 带着这个疑问,找到了百度保障官网上有一个 更多案例 的页面,在这个页面上,百度例举了更多更为详细的使用百度搜索而被骗的具体案例。 整个页面中,一共提供了174个案例,经过简单汇总整理后,就得出了一个百度保障页面上全部的展示案例的简单分析结果: 使用百度搜索受骗用户性别占比 在174个因为使用百度搜索而被诈骗的案例中,受骗用户中男性占比为67%,女性为33%。 这样看来,男性更容易成为搜索引擎类产品的受害人。 但是由于二者数据过于悬殊,性别差异比值达到了二比一,因此会让我不禁猜想,如此悬殊想性别比,是否是由于使用搜索引擎的总体样本中,就是男性用户占比高,因此导致男性用户的受骗人数也更多,从而造成的统计误差呢? 很可惜,百度并未发布过使用自家搜索产品的用户画像数据,于是我尝试从下面两个渠道来修正数据: 方法1:用百度指数修正 在百度指数中,关键词“百度”的指数近期稳定在80万左右,根据需求图谱观察,用户在百度搜索“百度”的目基本围绕百度搜索及其相关产品的需求而产生的指数。因此我们用“百度”这个关键词的指数的相关数据作为参考,应该是有一定可靠参考价值的。 该词的百度指数相关数据显示,搜索“百度”关键词的 男性用户占比58.64%,TGI 116.14 ; 女性用户占比41.36%,TGI 83.54 (数据取样时间:2021-11-01 ~ 2021-11-30)。 将数据代入到原始数据中加权计算后,得出修正后的数据为: 受骗用户中男性占比59.1%,女性占比40.9% 。 方法2:代入第三方研报数据修正 易观发布的 中国搜索引擎市场用户行为洞察2020 中指出,搜索引擎用户分布情况为男性60.2%,女性占比39.8%。这个数据和百度指数数据差异不到2个百分点。 依旧如方法1,同样将数据代入到原始数据中加权计算后,得出修正后的数据为: 受骗用户中男性占比...

2022年SEO Description撰写指南

图片
在SEO中,有一个非常基础和重要的概念,就是TDK优化,所谓的TDK对应的是Title(页面标题)、Meta Description(页面描述)和Meta Keywords(页面关键词)。搜索引擎经过了多年的发展以后,Meta Keywords(页面关键词)已经不再是搜索引擎参考的排序理由了。这一方面是由于NLP(自然语言处理)等AI技术的长足发展让搜索引擎可以更好的理解页面文字内容,也是由于Meta Keywords(页面关键词)字段总是被一些别有用心的黑帽SEOer用于SEO的作弊优化,因此 Meta Keywords 权重最终被移出了SEO的打分系统。 但是Title(页面标题)、Meta Description(页面描述)字段,在SEO中的重要性却始终未变,而且还正在变的越来越重要。今天我们就来看看,在2022年,最新的Description(页面描述)优化标准是怎么样的。 Description是HTML中元描述meta的属性之一,在HTML规范中,Description被用来总结概括网页的内容。在搜索引擎结果页面(SERP)上,Description的内容通常会出现在页面标题下,是页面SEO的关键组成部分。 Description /dəˈskripSH(ə)n/ 的发音 通过阅读本文,你将学到: 什么是Description; 为什么要设置Description; Description质量评估标准; 如果你有很多页面,如何处理Description(页面描述) 什么是Description Description是一种HTML标签类型,通过指定Description的内容,可以帮助搜索引擎以及用户更好的理解当前网页包含的主要了内容。因此在中文SEO环境,我们一般将Description成为页面简介。 如果你为一个页面设置了Description字段,那么在搜索结果中,它通常会出现在下面这样的位置: Description在百度的展示位置: Description在百度搜索结果中的展示 Description在谷歌的展示位置: Description在谷歌搜索结果中的展示 在网页代码中,Description是这样的: <meta name="description" content="2020年东京奥运会于20...

360蜘蛛IP列表大全

360搜索的蜘蛛在访问网站时,都会带上带有360Spider签名信息的UA,其形态为: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider 但是我们知道UA是可以伪装的,所以在判断是否是搜索引擎蜘蛛爬取,还是有人伪装搜索引擎蜘蛛爬取的时候,除了识别UA,也要结合IP进行判断。下面就是360搜索所有蜘蛛IP的汇总: 180.153.232.*IP段: 180.153.232.170 180.153.232.171 180.153.232.172 180.153.232.173 180.153.232.174 180.153.232.175 180.153.232.176 180.153.232.177 180.153.234.145 180.153.234.146 180.153.234.147 180.153.234.148 180.153.234.149 180.153.234.150 180.153.234.151 180.153.234.152 180.153.236.101 180.153.236.102 180.153.236.103 180.153.236.104 180.153.236.105 180.153.236.106 180.153.236.107 180.153.236.108 180.153.236.109 180.153.236.11 180.153.236.110 180.153.236.111 180.153.236.112 180.153.236.113 180.153.236.114 180.153.236.115 180.153.236.116 180.153.236.117 180.153.236.118 180.153.236.119 180.153.236.12 180.153.236.120 180.153.236.121 180.153.236.122 180.153.236.123 180.153.236.124 180.153.236.125 180.153.236.126 180.153.236.127 180.153.236...

Sitemap(站点地图)全知道

图片
什么是Sitemap(站点地图) Sitemap(站点地图)是一种文件的统称,通常Sitemap(站点地图)可以是txt或者XML格式。通过Sitemap(站点地图)你可以告诉搜索引擎关于你的站点中的网页、视频或者其他文件的相关信息,帮助搜索引擎更好的认识和理解你的站点。格式正确的Sitemap(站点地图)文件会帮助搜索引擎更高效地抓取你的网站。XML格式的站点地图,通常会包含更多的信息,比如你可以通过Sitemap(站点地图)文件告诉搜索引擎你认为网站中的哪些网页和文件比较重要,还会提供与这些文件有关的重要信息。例如,网页上次更新的时间和网页是否有任何备用的语言版本。 Sitemap(站点地图) 而在Bing和谷歌等搜索引擎,通过Sitemap(站点地图)文件还可以让搜索引擎理解下列更多事项,比如: 为视频内容提供视频时长、类别以及适合哪些年龄段的受众等关键信息; 为图片条目中可包含图片主题、类型和许可提供更多有用信息; 还可以为新闻条目提供更为确切的报道标题和发布日期。 是否所有网站都需要创建Sitemap(站点地图)? 在我看来并不是这样的。随着搜索引擎抓取能力的不断攀升,搜索引擎的爬虫已经可以在没有Sitemap(站点地图)辅助的情况下,正确的抓取、收录大部分的网页了。因而我认为如果你的网站符合下面这几种情况,那么你可以不用创建Sitemap(站点地图),依旧不会对站点的SEO带来不利的影响。 无需创建Sitemap(站点地图)的情形: 模板建站大多数情况无需创建Sitemap(站点地图):如果站点采用了 WordPress、Wix 或 Blogger 等 CMS系统,那么这些 CMS 已经自动向搜索引擎提供了站点地图,无需用户再采取任何手动措施; 小规模的网站无需创建Sitemap(站点地图):比如一般品牌官网,通常整个网站有效页面数量只有几百甚至几十个,对于这种量级的站点,一般来说,无需单独创建Sitemap(站点地图),只需要做好首页提交的工作即可; 在内链完备的情况下,也无需创建Sitemap(站点地图):对于页面量级在十万以下的站点来说, 只要网站内链设置恰当,那么搜索引擎爬虫就可以从首页沿着内链的步骤,最终爬取到所有的重要页面。 对于Bing和谷歌来说,提交正确格式的图片和视频Sitemap(站点地图),有助于对应内容出现在搜索引擎“视频”...

不同类型页面的内容质量评估标准

图片
在互联网上,不同的网页类型,承载了不同的内容,满足了浏览用户的不同需求。在我们进行页面进行SEO工作的时候,对于不同的页面类型,需要的内容优化重点是不一样的。 下面整理了最为常见的13种页面类型,在SEO的过程中,需要特别关注的内容重点是什么: 网站首页SEO内容重点: 在网站首页中,通常习惯采用满铺全屏图案来传递品牌价值,图片上的文字是否可被访问,不同的文字之间的层级关系是否明晰。 以及分类、标签是否完善、清晰;网页中的内容及链接是否可访问。 列表页、搜索结果页SEO内容重点: 列表分类是否清晰,用于描述列表的词汇是否浅显易懂,列表页呈现的内容与网页主题、搜索词是否有相关性,并且内容明确,利于阅读,符合用户的习惯。 文章页SEO内容重点: 是否提供完整、真实、有价值的内容; 内容是否有明确的层级格式,以及合理的内外链接; 图文并茂的内容,通常会比单一文字的内容,更受搜索引擎和用户的欢迎。 新闻页SEO内容重点: 具备新闻属性,对新近发生的事实有完整准确的报道,图文并茂更佳。 所谓的新闻属性,从内容上看,就是新闻稿六要素,即:“五个W”:Who(何人)、What(何事)When(何时)、Where(何地)Why(何故)“一个H”:How(如何),即:时间、地点、人物、事件的起因、经过、结果。 小说页SEO内容重点: 小说信息准确,包括书名、作者、可阅读的小说内容等清晰完整,在内容结构上无错章,章节之间连贯,更新及时。 对于小说类型的站点,要格外考虑用户长时间阅读的体验,包括滑动、翻页等交互的体验,以及上下章节的跳转。 小说类型的页面,还应该特别注意页面嵌入式广告对用户体验的影响,广告应该不对用户的正常阅读造成负向体验。 文档页SEO内容重点: 用户是否可以正常阅读,是否有权限限制。 文档页在SEO过程中,要特别注意文档格式如果是非爬虫可理解的格式,建议使用转码转译OCR等技术,将文档中的关键内容进行提取后以标准HTML代码的形式提交搜索引擎,以帮助搜索引擎更好的理解页面内容。 视频页SEO内容重点: 确保所有视频都能在公开网页上访问,用户可以在其中观看视频。确保该网页未被 robots.txt 或 noindex 漫游器元标记屏蔽是非常必要的。 同时为了尽可能提高视频曝光率,可以为每个视频创建一个专题页,其中视频是该网页上的最突出主题。别忘了为视频添加相应的...

SEO初学者的5要1不要

图片
在SEO的过程中,提升站点质量,获取更好的搜索排名和流量机会有许许多多的方法。今天总结初学者在学习SEO过程中,首要关注的SEO六个方面的内容。我将这六个方面的内容,分为了5个 建议 做的,和1个绝对 不建议 尝试的。初学SEO的小伙伴们,可以以此作为学习SEO的切入点,在每一个内容上,均有值得深入学习、拆解、探讨的空间。 要关注用户需求和用户体验 无论做任何站点,站点都应该首先考虑目标用户的利益与需求,并同时提升目标用户群体的浏览、使用体验,而不是针对搜索引擎的单方面迎合优化; 要设法提升高价值原创内容占比 SEO的本质是利用搜索引擎,完成网站内容和内容需求用户之间的匹配。因而要关注高质量原创内容的产出,减少低质量内容在网站中的数量。网站的价值不是通过采集等手段获得,而是通过自身的高质量原创内容,以合理的方式体现网站的特色,既要考虑站点的短期收益,更要重视站点的长远发展,来构筑站点的内容增长方法。 要关注内容时效性 关注失效内容与死链的清理。及时处理网站中的失效数据、过期信息与死链,并及时提交给搜索引擎进行删除; 对于过期信息如何标注,对于违规信息删除后的页面处理,以及UGC信息的用户删除后的处理等细节的处理,都将影响到网站在搜索引擎端的长期权重质量; 要关注服务器安全和访问效率 关注网站安全与访问的稳定性。防范潜在的网站安全风险,保证网站的可用性和访问稳定; 这里面包括Https、SSL、ICP备案,以及云服务器、CDN节点、图片缓存服务器等一系列的技术,为用户提供一个访问稳定,加载快速,安全有保障的网站环境。 要保持学习 关注主流搜索引擎的公告和动向,根据搜索引擎算法变动,并积极自查是否存在违规行为。 不要作弊 任何针对搜索引擎的作弊和黑帽SEO手段都是要避免的,作弊和黑帽 SEO破坏了搜索生态,有可能给你带来短期的获利,但是绝对无法提供长期的价值。因此作弊和黑帽SEO是我们在学习SEO过程中要杜绝和远离的行为。

搜索引擎常用User-Agent汇总

User-Agent  (简称UA)是 http 协议的一个请求头(header),用来让服务端识别发起请求的用户软件信息,包含有应用类型、操作系统、软件提供商、版本号等。 User-Agent中文翻译为 用户代理 ,最常见的 网页浏览器 就是一个“帮助用户获取、渲染网页内容并与之交互”的用户代理;电子邮件阅读器也可以称作 邮件代理 。 对于搜索引擎来说,搜索引擎的爬虫,就是帮助搜索引擎获取、理解网页内容的用户代理。 关于 User-Agent  的相关的规范可以看: RFC 7231, section 5.5.3: User-Agent , RFC 2616, section 14.43: User-Agent 。 在SEO中,UA经常被用在服务端识别网络爬虫类型,本文详细讲解各个爬虫的 UA特征。 Baiduspider 百度曾经是排名第二的搜索引擎,在 Google 还没退出中国之前,中文搜索质量很高,即使让用户选择,大多数也会优先选择百度,但后面几年的事大家都知道了,用户体验越来越差,个人感觉现在 bing 的中文搜索质量都比百度好了,从我们统计的爬虫数据来看,google 和 bing 是最勤劳的,而且收录频率和数量较好,百度搜索速度较差,响应时间久。 百度 搜索引擎爬虫,相关信息: BaiduSpider ,和 GoogleBot 一样根据功能分很多种,我们也只需通过  baiduspider  字段判断即可。 产品名称 对应user-agent 网页搜索 Baiduspider 移动搜索 Baiduspider 图片搜索 Baiduspider-image 视频搜索 Baiduspider-video 新闻搜索 Baiduspider-news 百度搜藏 Baiduspider-favo 百度联盟 Baiduspider-cpro 商务搜索 Baiduspider-ads Googlebot 谷歌 搜索引擎,是目前市场占有率最高的搜索引擎,达到了 92.71%(数据来源: 2021年8月,全球&中国搜索引擎市场份额排行榜 ),爬虫UA 为 Googlebot,通常有更细致的区分,比如新闻爬虫、广告爬虫、PC 网页爬虫,移动端爬虫,可以从详细的 UA 信息中看到,作为网站内容提供方,一般我们只需要判断 UA ...