共计 3569 个字符,预计需要花费 9 分钟才能阅读完成。
搜索引擎优化 (SEO)是提高网站知名度和吸引更多自然流量的重要方法。然而,这是一个复杂的策略,依赖于理解算法和利用各种排名因素。如果您想成为 SEO 专家,您需要了解搜索引擎索引。
在这篇文章中,我们将解释搜索引擎如何索引网站以及如何提高排名。我们还将回答有关此 SEO 概念的一些常见问题。
什么是搜索引擎索引?
搜索引擎索引是指搜索引擎 (例如 Google、百度) 在中央数据库 (其索引) 中组织和存储在线内容的过程。然后,搜索引擎可以分析和理解内容,并在其搜索引擎结果页面 (SERP)上的排名列表中将其提供给读者。
在索引网站之前,搜索引擎会使用“爬虫”来调查链接和内容。然后,搜索引擎获取爬取的内容并将其组织到其数据库中:
图片来源:Seobility – 许可:CC BY-SA 4.0
我们将在下一节中仔细研究这个过程是如何工作的。目前,将索引视为网站文章和页面、视频、图像和其他内容的在线归档系统会有所帮助。对于谷歌来说,这个系统是一个巨大的数据库,被称为谷歌索引。
搜索引擎如何索引网站?
像谷歌这样的搜索引擎使用“爬虫”来探索在线内容并对其进行分类。这些爬虫是跟踪链接、扫描网页并尽可能多地获取有关网站的数据的软件机器人。然后,他们将信息传递到搜索引擎的服务器以进行索引:
图片来源:Seobility – 许可:CC BY-SA 4.0
每次发布或更新内容时,搜索引擎都会对其进行抓取和索引,以将其信息添加到其数据库中。这个过程可以自动发生,但您可以通过将站点地图提交给搜索引擎来加快它。这些文档概述了您网站的基础架构(包括链接),以帮助搜索引擎更有效地抓取和理解您的内容。
搜索引擎爬虫以“爬网预算”运行。此预算限制了机器人在设定的时间内将在您的网站上抓取和索引的页面数量。(然而,他们确实回来了。)
爬虫编译有关基本数据的信息,例如关键字、发布日期、图像和视频文件。搜索引擎还通过跟踪和索引内部链接和外部 URL 来分析不同页面和网站之间的关系。
请注意,搜索引擎爬虫不会跟踪网站上的所有 URL。他们将自动抓取 dofollow 链接,忽略它们的 nofollow 等价物。因此,您需要在链接建设工作中专注于 dofollow 链接。这些是指向您的内容的外部站点的 URL。
如果外部链接来自高质量的来源,当爬虫从另一个站点跟踪它们到您的站点时,它们会传递它们的“链接权重”。因此,这些 URL 可以提高您在 SERP 中的排名:
图片来源:Seobility – 许可:CC BY-SA 4.0
此外,请记住,某些内容无法被搜索引擎抓取。如果您的页面隐藏在登录表单、密码后面,或者您的图像中嵌入了文本,搜索引擎将无法访问和索引该内容。(但是,您可以使用 alt 文本让这些图像单独出现在搜索中。)
4 搜索引擎索引工具
您可以使用多种工具来指导 Google 和其他搜索引擎如何抓取您的内容并将其编入索引。让我们看一些最有用的选项!
1. 站点地图
请记住,有两种站点地图:XML 和 HTML。这两个概念很容易混淆,因为它们都是以 -ML 结尾的站点地图类型,但它们的用途不同。
HTML 站点地图是用户友好的文件,列出了您网站上的所有内容。例如,您通常会在站点的页脚中找到这些站点地图之一。在 Apple.com 上一直向下滚动,您会发现这是一个 HTML 站点地图:
该站点地图使访问者能够轻松浏览您的网站。它充当通用目录,可以对您的 SEO 产生积极影响并提供可靠的用户体验 (UX )。
相比之下,XML 站点地图包含您网站上所有重要页面的列表。您将此文档提交给搜索引擎,以便他们可以更有效地抓取和索引您的内容:
请记住,当我们在本文中讨论站点地图时,我们将指的是 XML 文档。我们还建议您查看我们的创建 XML 站点地图指南,以便您为不同的搜索引擎准备好文档。
注:您可以安装我们的 Smart SEO Tool 插件来生成适用于百度搜索引擎的网站地图。
2. 谷歌搜索控制台
如果您想将您的 SEO 工作集中在 Google 上,Google Search Console 是您掌握的必备工具:
在控制台中,您可以访问索引覆盖率报告,该报告会告诉您哪些页面已被 Google 索引并突出显示过程中的任何问题。在这里,您可以分析问题 URL 并对其进行故障排除以使其“可索引”。
此外,您可以将您的 XML 站点地图提交到 Google Search Console。本文档充当“路线图”,帮助 Google 更有效地索引您的内容。最重要的是,您可以要求 Google 重新抓取您网站的某些 URL 和部分内容,以便您的受众始终可以使用更新的主题,而无需等待 Google 的抓取工具返回您的网站。
3. 替代搜索引擎控制台
尽管 Google 是最受欢迎的搜索引擎,但它并不是唯一的选择。将自己限制在 Google 上可能会使您的网站无法访问来自其他来源 (例如 Bing ) 的流量:
我们建议您查看有关将 XML 站点地图提交到 Bing 网站管理员工具和百度搜索资源平台的指南。不幸的是,部分搜索引擎,包括 Yahoo 和 DuckDuckGo,不允许您提交站点地图,但这两个搜索引擎使用的是 bing 的搜索结果数据。
请记住,这些控制台中的每一个都提供了独特的工具来监控您网站在 SERP 中的索引和排名。因此,如果您想扩展您的 SEO 策略,我们建议您尝试一下。
4.Robots.txt
我们已经介绍了如何使用站点地图来告诉搜索引擎索引您网站上的特定页面。此外,您可以使用 robots.txt 文件排除某些内容。
robots.txt 文件包含有关您网站的 索引信息。它存储在您的根目录中,有两行: 指定搜索引擎爬虫的用户代理行和阻止特定文件的禁止指令。
例如,robots.txt 文件可能如下所示:
User-agent: *
Disallow: /example_page/
Disallow: /example_page_2/
在此示例中,* 涵盖所有搜索引擎爬虫。然后,禁止行指定特定文件或 URL 路径。
您只需要创建一个简单的文本文件并将其命名为 robots.txt。然后,添加您的禁止数据并使用文件传输协议 (FTP) 客户端将文件上传到您的根目录。
5. 推送 API
像百度、谷歌和 Bing 这三个搜索引擎,已开放 URL 推送 API 支持,即您可以将最新发布的内容即时推送至搜索引擎,请求搜索引擎索引。
如果您使用的是 WordPress,则无需针对这三个搜索引擎做网站的 API 对接开发工作,只需要安装搜索推送插件,完成简单的配置后即可实现 URL 推送工作。
常见问题
到目前为止,我们已经介绍了搜索引擎索引的基础知识。如果您对此 SEO 概念仍有疑问,可以在下面评论留言!
如何更好地被搜索引擎收录?
您可以通过创建站点地图、审核它们的抓取错误并将它们提交给多个搜索引擎来更好地被搜索引擎索引。此外,您应该考虑针对移动设备优化内容并减少加载时间以加快爬网和索引编制。
经常更新您的内容还可以提醒搜索引擎抓取和索引您的“新”页面。最后,我们建议通过使用 robots.txt 文件或将其删除来防止搜索引擎抓取重复内容。
必须请求搜索引擎来抓取我的网站吗?
搜索引擎会在互联网上抓取新的公开内容,但这个过程可能需要数周或数月的时间。因此,您可能更喜欢通过向您选择的搜索引擎提交站点地图或者通过 API 提交链接来加快速度。
如果发布新内容,是否必须提醒搜索引擎?
我们建议您在发布新内容时更新您的站点地图。这种方法可确保您的文章被更快地抓取和索引。我们建议使用 Yoast SEO 等插件轻松生成站点地图(国内站点可以考虑使用我们的 Smart SEO Tool)。
Google 或其他搜索引擎是否会删除已收录页面?
如果内容违反其服务条款,Google 可能会从其索引中删除文章或页面。这意味着内容在许多情况下违反了隐私、诽谤、版权或其他法律。Google 还会从其索引中删除个人数据,例如可识别的财务或医疗信息。最后,谷歌可能会惩罚使用黑帽 SEO 技术的页面。
内容已被删除,如何才能将其重新编入索引?
您可以要求 Google 通过修改内容来重新索引您的内容,以符合搜索引擎的网站管理员质量指南。然后,您可以提交重新审核请求并等待查看 Google 的回复。
如何防止搜索引擎索引某些页面?
您可以通过向页面的部分添加 noindex 元标记来阻止搜索引擎对某些页面进行索引。或者,如果您的内容是媒体文件,您可以将其添加到 robots.txt 文件中。最后,Google 网站管理员工具使您能够使用删除 URL 工具隐藏页面。
小结
SEO 是一个广泛的领域,涵盖了从搜索引擎算法到页外优化技术的所有内容。如果您是该主题的新手,您可能会对所有信息感到不知所措。幸运的是,索引是更容易掌握的概念之一。
搜索引擎索引是将您的网站内容组织到中央数据库的基本过程。搜索引擎爬虫分析您网站的内容和架构以对其进行分类。然后,他们可以在结果页面中针对特定搜索词对您的页面进行排名。