谷歌SEO是什么？应该如何做优化？「完整版教程」

Google 是一个全自动搜索引擎，它使用名为“网页抓取工具”的软件定期探索网络，以便查找可添加到 Google 索引中的网站。实际上，Google 搜索结果中收录的大多数网站都不是手动提交的，而是系统网页抓取工具在抓取网络时自动找到并添加的。。

Google 会从很多不同的来源获取信息，包括：

但是，此页面将重点介绍 Google 如何通过网页获取信息。Google 按照以下三个基本步骤生成基于网页的结果：

抓取：Google 会使用名为“抓取工具”的自动程序搜索网络，以查找新网页或更新后的网页。Google 会将这些网页的地址（即网址）存储在一个大型列表中，以便日后查看。我们会通过许多不同的方法查找网页，但主要方法是跟踪我们已知的网页中的链接。

编入索引：Google 会访问它通过抓取得知的网页，并会尝试分析每个网页的主题。Google 会分析网页中的内容、图片和视频文件，尝试了解网页的主题。这些信息存储在 Google 索引中，而 Google 索引是一个存储在海量计算机中的巨大数据库。

呈现搜索结果：当用户在 Google 上进行搜索时，Google 会尝试确定最优质的搜索结果。“最佳”结果取决于许多因素，包括用户的位置、语言、设备（桌面设备或手机）以及先前用过的搜索查询。例如，在用户搜索“自行车维修店”后，Google 向巴黎用户显示的答案与向香港用户显示的答案有所不同。支付费用不能提高网页在 Google 搜索结果中的排名，网页排名是完全依靠算法完成的。

如果您拥有或负责管理在线内容、通过 Google 搜索推广在线内容或通过此类内容获利，则本指南适合您。如果您有着快速发展的业务、拥有十几个网站、是网络代理机构的 SEO 专家，或者是对搜索机制具有强烈兴趣的 DIY SEO 达人，则本指南也适用于您。如果您有兴趣根据我们的最佳做法对 SEO 基础知识进行全面了解，那么本指南是您的不二之选。本指南不会提供任何可让您的网站在 Google 中自动排位第一的秘诀（抱歉！），但是如果您遵循最佳做法，则有望让搜索引擎更容易抓取和了解您的内容，并将其编入索引。

搜索引擎优化 (SEO) 通常是指对网站的部分内容进行细微的修改。单独来看，这些修改可能只是细微的改进，但与其他优化结合起来后，则可能会对您的网站的用户体验以及在自然搜索结果中的表现产生显著影响。您可能早已熟悉本指南中的许多主题，因为它们是所有网页的基本要素，但您可能并没有充分利用它们。

您应该构建一个可让用户从中受益的网站，并且任何优化都着眼于改善用户体验。搜索引擎也是您的一个用户，它可以帮助其他用户发现您的内容。SEO 是指帮助搜索引擎了解和呈现内容。您的网站规模可能与我们的示例网站有所差别，所呈现的内容也可能截然不同，但本指南中的优化主题对于所有规模和类型的网站均适用。

1. 您是否需要做SEO

SEO 专家是指能提高网站在搜索引擎中的曝光度的专业人员。如果按照本指南学习，您将掌握足够的网站优化知识。此外，您可能也会考虑聘用一位 SEO 专业人员帮助您审核网页。

聘用 SEO 是一项重大决定，这有可能改善您的网站并节省时间。在研究聘用 SEO 可能带来的益处的同时，也请务必考虑到不负责任的 SEO 可能会给您的网站带来的损害。很多 SEO 及其他代理机构和顾问会为网站所有者提供实用的服务，包括：

审核您网站的内容或结构
网站开发技术建议：如托管、重定向、错误页、JavaScript 的使用
内容开发
业务发展的线上活动管理
关键字研究
SEO 培训
有关特定市场和地理位置的专业知识

在开始物色 SEO 之前，您不妨学习一些基本知识，熟悉搜索引擎的工作原理。建议您阅读本指南的全部内容，尤其是以下资源：

Google 101：Google 如何抓取网页、将网页编入索引和呈现网页
Google 网站站长指南
如何聘用 SEO

如果您考虑聘用 SEO，那么越早聘用越好。您打算重新设计网站或启动新网站时是聘用 SEO 的最佳时机。如此一来，您和您的 SEO 就能确保网站的整体设计均便于搜索引擎处理。此外，优秀的 SEO 还能帮助您改进现有网站。

若想详细了解如何确定自己是否需要聘用 SEO 以及应注意哪些事项，请参阅您需要 SEO 吗这篇文章

2. SEO术语大全

索引 – Google 会将所知道的所有网页存储在其索引中。每个网页的索引条目都描述了该网页的内容和位置（网址）。编入索引是指 Google 抓取、读取网页并将其添加到索引中的过程。例如：Google 今天已将我网站上的几个网页编入索引。
抓取 – 寻找新网页或更新后的网页的过程。Google 会通过跟踪链接、读取站点地图或其他各种方式来发现网址。Google 通过抓取网络来寻找新增网页，然后会在适当的时侯将其编入索引。
抓取工具 – 从网络中抓取（提取）网页并将网页编入索引的自动化软件。
Googlebot – Google 抓取工具的通用名称。Googlebot 会持续不断地抓取网页。
SEO – 搜索引擎优化：使您的网站更易于搜索引擎处理的过程；也可指从事搜索引擎优化的人员的职位名称，例如：我们刚刚聘请了新的 SEO 来提升我们在网络上的曝光度。
Crawling（抓取）：搜索引擎发现网页的过程。
De-indexed（索引取消）：指从Google索引中删除的一个或一组页面。
Featured snippets（精选片段）：针对特定查询出现在SERP顶部的自然答案框。
Google My Business listing（谷歌—我的商家信息）：本地商家可以免费发布商家简介。
Image carousels（图像轮播）：SERP中可从左向右滚动的图片显示效果。
Indexing（索引）：存储和组织在抓取过程中找到的内容。
Intent（意图）：在SEO的背景下，用户在搜索栏输入单词，通过单词，他们真正想要获得的内容。
KPI（关键绩效指标）： Key Performance Indicator 。关键绩效指标是一个可衡量的值，表明实现目标的程度。
Local pack（本地包装）：一组通常是三个本地商户列表，用于本地意图搜索，例如“附近加油站”。
Organic（自然）：与付费广告不同，在自然搜索结果中获得展示位置。Organic traffic请一定翻译为自然流量，不要翻译为有机流量，切记，切记，切记!
People Also Ask boxes（“人们还问了..”框）：SERP中的一个框，显示人们还搜索了什么问题，其中包含与查询及其答案相关的问题列表。
Query（查询）：在搜索栏中输入的单词。
Ranking（排名）：根据查询对搜索结果的排序。
Search engine（搜索引擎）：一种信息检索程序，用于搜索数据库中与用户输入的请求相匹配的项目。就像：Google，Bing和Yahoo。
SERP：搜索引擎结果页面，我们在进行搜索后显示的结果页面。
Traffic（流量）：访问网站的数据。
URL： Uniform Resource Locator英文翻译是统一资源定位符，也就是Web上各个内容的位置或地址，我们常说的网址。
Webmaster guidelines（网站管理员指南）： Google和Bing等搜索引擎发布的指南，旨在帮助网站所有者创建可在搜索结果中找到、编制索引并执行良好的内容，帮助站长做好网站。
Sandbox（沙盒效应）：Google对新网站的排名延迟处理的一种方式。新网站前期排名不稳定的这段期间就是沙盒，也可以说是Google对新网站的考察期。
White hat（白帽）：符合Google质量指南的搜索引擎优化实践。

3. 如何查询网站被Google 索引？

确定您的网站是否在 Google 的索引中

对您网站的首页网址执行 site: 搜索。如果您能看到相关结果，则表明您的网站在索引中。例如，搜索 site: http://wikipedia.org 会返回这些结果。

如果您的网站不在 Google 的索引中

虽然 Google 可抓取数十亿个网页，但遗漏部分网站也在所难免。造成抓取工具遗漏网站的常见原因如下：

此网站未与网络上的其他网站紧密关联
您刚刚推出新的网站，Google 还没来得及抓取
网站的设计致使 Google 难以有效抓取其中的内容
Google 在尝试抓取网站时遇到问题
您的政策阻止 Google 抓取网站

4. 如何快速让Google 收录？

让网站纳入 Google 搜索结果完全免费，且操作简单，甚至不需要向 Google 提交网站。Google 是一个全自动搜索引擎，它使用网页抓取工具持续抓取网页，以便查找可添加到 Google 索引中的网站。实际上，显示在 Google 搜索结果中的大多数网站都不是手动提交收录的，而是 Google 在抓取网页时找到并自动添加的。了解 Google 如何发现、抓取和呈现网页。

我们提供了网站站长指南，可以帮助您构建方便 Google 处理的网站。虽然无法保证我们的抓取工具一定能够找到某个特定网站，但遵循这些指南内容有助于让您的网站显示在我们的搜索结果中。

Google Search Console 提供了一系列工具，可以协助您向 Google 提交内容，同时监测您的网站/移动应用在 Google 搜索结果中的曝光度。如果您愿意，当 Google 在抓取您网站的过程中发现任何严重问题时，Search Console 甚至可以向您发送提醒。注册 Search Console。

首先，您需要问自己以下几个有关网站的基本问题。

我的网站是否会显示在 Google 搜索结果中？
我是否为用户提供了高品质的网站内容？
我的本地商家是否会显示在 Google 搜索结果中？
使用各种设备的用户能否轻松快速地访问我的网站内容？
我的网站是否安全？

5. sitemap及robots.txt 的作用

sitemap的作用：帮助 Google 找到您的内容

要让网站显示在 Google 搜索结果中，首要步骤便是确保 Google 能够找到它。最好的办法是提交站点地图。站点地图是网站上的一种文件，可告知搜索引擎网站上新增了哪些网页或有哪些网页进行了更改。详细了解如何构建和提交站点地图。

Google 还会通过其他网页上的链接找到您的网页。了解如何通过宣传您的网站来吸引用户发现您的网站。

Robots.txt的作用：告诉 Google 您不希望抓取哪些网页

对于非敏感信息，可以使用 robots.txt 阻止不必要的抓取

robots.txt 文件会告诉搜索引擎是否可以访问您网站的各个部分并抓取这些内容。此文件必须命名为 robots.txt，且必须位于网站的根目录下。被 robots.txt 阻止的网页也可能会被抓取，因此请使用更安全的方法保护敏感网页。

# http://brandonsbaseballcards.com/robots.txt # Tell Google not to crawl any URLs in the shopping cart or images in the icons folder, # because they won’t be useful in Google Search results. User-agent: googlebot Disallow: /checkout/ Disallow: /icons/您可能不希望网站的某些页面被抓取，因为这些页面显示在搜索引擎的搜索结果中可能对用户无用。如果您希望阻止搜索引擎抓取您的网页，Google Search Console 可提供便捷的 robots.txt 生成器帮助您创建此文件。请注意，如果您的网站使用了子网域，并且您希望 Google 不要抓取特定子网域上的某些网页，那么您必须为该子网域单独创建一个 robots.txt 文件。若想详细了解 robots.txt，建议参阅使用 robots.txt 文件指南。

*应避免的做法：

允许 Google 抓取内部搜索结果页。用户不喜欢点击搜索引擎结果后却又被转到您网站上的另一个搜索结果页。
允许抓取因代理服务而创建的网址。

对于敏感信息，请使用更安全的方法

要阻止用户访问敏感或机密信息，robots.txt 并不是一个适当或有效的方式。它只会告知运行得体的抓取工具不要抓取相应网页，却不会阻止服务器将这些网页发送给请求它们的浏览器。其中一个原因是：如果互联网上的某处（例如引荐来源网址日志）恰好存在指向这些被禁止访问的网址的链接，那么搜索引擎仍然能够引用这些网址（仅显示网址，但不显示标题或摘要）。此外，未同意遵守《漫游器排除标准》的不合规搜索引擎或流氓搜索引擎可能会违反您的 robots.txt 文件中的指令。最后，用户可能会出于好奇查看 robots.txt 文件中的目录或子目录，并猜测您不想让人看见的内容的网址。

在这些情况下，如果您只是希望网页不显示在 Google 中，并不介意任何用户会通过链接访问该网页，则可使用 noindex 标记。为了确保绝对安全，请使用合适的授权方法（例如需要用户密码才能访问）或将网页从网站上彻底移除。

6. 如何创建Google易于理解的内容

帮助 Google（和用户）了解您的内容

向 Google 和用户呈现相同的网页

Googlebot 在抓取某个网页时，应该和普通用户看到的网页相同。为了实现最佳的呈现和索引编制效果，请始终允许 Googlebot 访问您网站所用的 JavaScript、CSS 和图片文件。如果您网站的 robots.txt 文件禁止抓取这些资源，则会直接影响到我们的算法呈现您的内容以及将其编入索引的效果，进而导致您的网站排名降低。

建议采取的措施：使用网址检查工具。该工具可让您确切地了解 Googlebot 所看到的内容以及它会如何呈现这些内容，有助于您找出并修复网站上存在的许多索引编制问题。

创建独特且准确的网页标题

<title> 标记可告诉用户和搜索引擎特定网页的主题是什么。请将 <title> 标记放在 HTML 文档的 <head> 元素中，并为您网站上的每个网页创建一个独一无二的标题。

…

在搜索结果中创建恰当的标题和摘要

如果您的文档会显示在搜索结果页中，则 title 标记的内容可能会显示在结果的第一行。如果您不熟悉 Google 搜索结果的各个组成部分，不妨观看搜索结果解析视频。

首页标题可列出网站/商家的名称，并可包含其他重要信息，例如商家的实际营业地点或主营业务/产品。

准确描述网页内容

选择一个读起来自然且能有效传达网页内容主题的标题。

应避免的做法：

选择与网页内容无关的标题。
使用默认或模糊标题，例如“无标题”或“新增网页 1”。

为每个网页创建唯一专用标题

确保网站上的每个页面具有唯一专用标题，这有助于 Google 了解该页面与您网站上其他页面的区别。如果网站具有独立的移动版网页，也请为移动版网页使用恰当的标题。

应避免的做法：

为网站的所有页面或大量页面使用同一个标题。

使用简短但描述准确的标题

标题应简短且包含丰富的信息。如果标题太长或被认为不太相关，那么 Google 可能只会显示部分标题或在搜索结果中自动生成的标题。Google 还可能根据用户的查询或搜索时所用设备显示不同的标题。

应避免的做法：

使用对用户来说不实用的冗长标题。
在 title 标记中填充不需要的关键字。

使用 description 元标记

网页的 description 元标记可让 Google 和其他搜索引擎了解该网页的大致内容。网页的标题可以是几个词或一个短语，而网页的 description 元标记则可以是一两个句子或是一小段话。与 <title> 标记一样，description 元标记也位于 HTML 文档的 <head> 元素中。

…

description 元标记有哪些好处？

description 元标记很重要，因为 Google 可能会将其用作网页的摘要。请注意，我们说的是“可能”，因为如果网页中有一段可见文本能很好地匹配用户查询，那么 Google 也可能会选择使用这段文本。最好为每个网页添加 description 元标记，以防 Google 找不到要在摘要中使用的恰当文本。您不妨去 Google 搜索中心博客看看，其中有通过更合适的 description 元标记改进搜索结果摘要等多篇实用博文。帮助中心内也不乏如何创建良好的标题和摘要这样的实用文章。

准确总结网页内容

撰写的说明不但要提供实用信息，还要能吸引用户，这样他们在搜索结果中看到摘要形式的 description 元标记时才会想要进一步浏览。虽然 description 元标记中的文本没有字数上下限，但建议您确保其长度能够完全显示在搜索结果中（请注意，用户可能会看到不同长度的摘要，具体取决于用户搜索时所用的方式和设备），并且包含方便用户判断该网页是否有用以及是否与其搜索内容有关的所有相关信息。

*应避免的做法：

编写与网页内容无关的 description 元标记。
使用“这是一个网页”或“与棒球卡相关的网页”等通用说明。
仅使用关键字填写说明。
将整个文档复制并粘贴到 description 元标记中。

为每个网页使用不同的说明

为每个网页使用不同的 description 元标记对用户和 Google 都有帮助，尤其是当用户的搜索可能会使您网域上的多个网页显示在搜索结果中时（例如，使用 site: 运算符进行搜索）。如果您的网站有数千个甚至数百万个网页，那么手动构建 description 元标记可能不可行。在这种情况下，您可以根据每个网页的内容自动生成 description 元标记。

*应避免的做法：

为网站所有网页或大量网页使用同一个 description 元标记。

使用标题标记强调重要文字

使用有意义的标题来指明重要主题，并帮助为您的内容创建层次结构，便于用户浏览文档。

想象您在编写大纲

和给长篇论文编写大纲相似，您可以想想网页内容的要点和次要点是什么，这将有助于决定在何处使用标题标记。

*应避免的做法：

在标题标记中放置对定义网页结构无用的文字。
在更适合使用 <em> 和 <strong> 等其他标记的地方使用标题标记。
毫无规律地使用不同长度的标题标记。

在网页上谨慎使用标题

应在合适的位置使用标题标记，因为如果网页上的标题标记过多，用户将难以浏览内容，也难以确定主题的起止位置。

*应避免的做法：

在网页上过度使用标题标记。
标题过长。
仅出于为文字添加样式（而非为了呈现结构）的目的使用标题标记。

7. 如何优化结构化数据标记

结构化数据是可添加到网站网页中的代码，用于向搜索引擎描述内容，以便搜索引擎更好地了解网页上的信息。搜索引擎可以利用这类信息在搜索结果中以有用的（且吸引用户的）方式显示您的内容。这也有助于您吸引到适合您业务的客户。

例如，如果您有一个网店并且标记了一个单独的商品页面，这就能帮助我们了解到该网页主要显示自行车、自行车价格以及客户评价。我们可能会在相关查询的搜索结果的摘要中显示这些信息。我们称之为富媒体搜索结果。

除了使用结构化数据标记来实现富媒体搜索结果外，我们还可能会使用结构化数据提供其他格式的相关结果。例如，如果您拥有一家实体店，标记营业时间可让潜在客户在需要时准确找到您，并能让他们知道在他们搜索时您的店是否在营业。

您可以标记许多与业务相关的实际信息：

所销售的产品
营业地点
与产品或业务有关的视频
营业时间
活动信息
食谱
贵公司的徽标等等！

查看受支持的内容类型的完整列表。

我们建议您使用结构化数据和任何受支持的符号标记来说明您的内容。您可在网页的 HTML 代码中添加标记，也可使用数据标注工具和结构化数据标记助手等工具。

用富媒体搜索结果测试来检查标记

标记完内容后，您可以利用 Google 富媒体搜索结果测试来确保整个实现过程准确无误。您可以输入内容所在的网址，也可以复制包含标记的实际 HTML 代码。

应避免的做法：

使用无效标记。

使用数据标注工具和结构化数据标记助手

如果想在不更改网站源代码的情况下尝试给出结构化标记，则可以使用数据标注工具，这是一款集成在 Search Console 中的免费工具，支持一系列内容类型。

如果想准备好标记代码以复制并粘贴到您的网页中，您可以尝试使用结构化数据标记助手。

*应避免的做法：

在对标记实现还没有把握的情况下更改网站的源代码。

跟踪已标记网页的表现

Search Console 中提供的各种富媒体搜索结果报告会显示以下信息：我们在您网站上检测到了多少个带有特定类型标记的网页、它们在搜索结果中出现了多少次，以及用户在过去 90 天内点击了它们多少次。该报告还会显示我们检测到的所有错误。

*应避免的做法：

添加用户看不到的标记数据。
制作虚假评价或添加无关标记。

8. 如何优化网站的层级结构

了解搜索引擎如何使用网址

搜索引擎需要获得每部分内容的唯一网址，才能抓取内容并将其编入索引，并使用户转到相应内容。不同内容（例如某个商店中的不同产品）以及修改后的内容（例如某内容的翻译版本或不同地区的版本）需要使用单独的网址，才能在搜索结果中得到恰当的展示。

网址通常分为多个不同的部分：

protocol://hostname/path/filename?querystring#fragment

例如：

https://www.example.com/RunningShoes/Womens.htm?size=8#info

Google 建议所有网站尽可能都使用 https://。主机名是网站的托管之处，所使用的域名通常与您的电子邮件地址域名相同。Google 会区分 www 版本和非 www 版本（例如， www.example.com 或仅 example.com）。将网站添加到 Search Console 时，建议您同时添加 http:// 版本和 https:// 版本以及 www 版本和非 www 版本。

路径、文件名和查询字符串决定了会访问服务器上的哪些内容。这三个部分区分大小写，因此使用 FILE 与使用 file 将得到不同的网址。主机名和协议不区分大小写，大小写不同不会产生任何影响。

片段（本例中为 #info）通常用于标识浏览器应滚动到网页的哪个部分。由于不管片段是什么，内容本身通常是一样的，因此搜索引擎常常会忽略所使用的片段。

指向首页时，主机名后的结尾斜线是可选的，因为不论有无该斜线都将指向相同的内容（ https://example.com/ 与 https://example.com 的效果相同）。对于路径和文件名，结尾斜线的存在与否将产生不同的网址（斜线可指明是文件还是目录），例如，https://example.com/fish 与 https://example.com/fish/ 并不相同。

导航对搜索引擎非常重要

网站导航对于帮助访问者快速找到所需内容非常重要，它也可以帮助搜索引擎了解哪些是网站所有者认为重要的内容。虽然 Google 的搜索结果是在网页级别提供的，但 Google 也希望了解网页在网站这个更大层面上的作用。

根据首页规划导航

所有网站都有首页或根网页，这通常是网站上最常被访问的网页，也是很多访问者浏览网站的起点。除非您的网站只有极少量的网页，否则需要考虑访问者将如何从一个内容宽泛的网页（根网页）转到所含内容更具体的网页。围绕特定主题的网页是否多到需要创建一个网页来介绍这些相关的网页（例如，根网页 -> 相关主题列表 -> 特定主题）？您是否有数百种不同的产品，需要分类到多个类别网页和子类别网页中？

使用面包屑导航列表

面包屑导航是位于网页顶部或底部的一行内部链接，可让访问者快速返回上一版块或根网页。许多面包屑导航都将内容最宽泛的网页（通常为根网页）设置为最左边的首个链接，并在右侧列出更具体的部分。我们建议在显示面包屑导航时使用面包屑导航结构化数据标记。

为用户创建简洁的导航页

导航页是网站上显示网站结构的一个简单页面，通常包含网站页面的分层列表。如果在网站上查找页面时遇到问题，访问者可能会访问此页面。虽然搜索引擎也会访问此网页，以便使抓取范围尽量覆盖网站的全部网页，但其主要对象还是人类访问者。

创建自然流畅的层次结构

让用户尽可能方便地从网站上的宽泛内容转到他们所需的更加具体的内容。在必要时增加导航页，并将其有效地纳入到内部链接结构中。确保网站上的所有网页都可通过链接访问，并且不需要内部搜索功能便可找到。在适当情况下，链接到相关的网页，方便用户发现相似的内容。

应避免的做法：

创建复杂的导航链接网页，例如将网站上的所有页面都相互链接。
过度拆分内容（以至于从首页前往目标内容过程中需要点击 20 次）。

使用文字进行导航

主要通过文字链接控制网站的网页导航，可使搜索引擎更容易抓取和理解您的网站。使用 JavaScript 创建网页时，请使用 a 元素，将网址用作 href 属性值，并在网页加载时生成所有菜单项，而不是等待用户互动时生成。

应避免的做法：

创建完全以图片或动画为基础的导航。
导航需要使用以脚本或插件为基础的事件处理功能。

为用户创建导航页，为搜索引擎创建站点地图

为方便用户使用，您可以为整个网站或最重要的网页（如果您有成百上千个网页）提供一个简洁的导航页。同时，创建一个 XML 站点地图文件，确保搜索引擎能够发现网站上的新增网页和更新后的网页，文件中要列出所有相关网址及其主要内容的最后修改日期。

应避免的做法：

任由导航页内容过期、链接损坏。
创建一个只是简单罗列页面而不加以整理（例如按主题）的导航页。

显示实用的 404 页面

用户偶尔会因点击损坏的链接或输入错误的网址而转到您网站上不存在的网页。使用自定义 404 页面能够有效引导用户返回到您网站上的正常网页，从而大幅提升用户的体验。不妨考虑添加返回根网页的链接，并提供指向您网站上热门内容或相关内容的链接。您可以使用 Google Search Console 找出导致“未找到”错误的网址来源。

应避免的做法：

允许搜索引擎将您的 404 网页编入索引（确保网络服务器配置为：当请求访问不存在的网页时，返回 404 HTTP 状态代码；如果是使用 JavaScript 的网站，则包含 noindex 标记）。
通过 robots.txt 文件阻止抓取 404 网页。
仅提供模糊的消息，例如“未找到”、“404”或根本没有 404 页面。
404 页面使用的设计与网站其他部分的设计不一致。

简洁网址易于传达内容信息

为网站上的文档创建描述准确的类别和文件名，不仅可以帮助您更好地组织网站，而且可以为希望链接到您的内容的用户创建更简单、易于使用的网址。如果网址极为冗长、含义模糊，并且包含很少的可识别字词，访问者可能会望而却步。

下面的网址可能会造成困惑且不易于使用：

https://www.brandonsbaseballcards.com/folder1/22447478/x2/14032015.html

如果您的网址有明确的含义，则该网址在不同上下文中都可能会更实用且更易于理解。

https://www.brandonsbaseballcards.com/article/ten-rarest-baseball-cards.html

网址会显示在搜索结果中

最后需要注意的是，文档的网址通常以某种形式显示在 Google 搜索结果中的文档标题附近。

Google 擅长抓取各种类型的网址结构（即使它们相当复杂），但花一些时间尽量让您的网址变得简单才是上策。

在网址中使用字词

若网址具有与网站内容以及结构相关的字词，则对浏览您网站的访问者来说更易于使用。

应避免的做法：

使用含有不必要的参数和会话 ID 的冗长网址。
选择使用通用网页名称，例如 page1.html。
使用过多的关键字，例如 baseball-cards-baseball-cards-baseballcards.html。

创建简单的目录结构

使用可有效组织内容的目录结构，让访问者轻松知晓其在网站上的位置。尝试使用目录结构指明在该网址中找到的内容类型。

应避免的做法：

具有深层嵌套的子目录，例如 …/dir1/dir2/dir3/dir4/dir5/dir6/page.html。

使用与其内容无关的目录名称。

提供相同版本的文档访问网址

为防止将某些用户链接到网址的一个版本而将其他用户链接到另一版本（这可能会导致在这两个网址之间拆分该内容的声誉），请确保在网页结构和内部链接中使用同一个网址。如果您确实发现用户在通过多个网址访问相同的内容，那么设置一个从非首选网址到主导网址的 301 重定向是一个很好的解决方案。如果无法重定向，您还可使用 rel=”canonical” link 元素。

应避免的做法：

让子网域和根目录的网页访问相同内容，例如 domain.com/page.html 和 sub.domain.com/page.html。

9. 如何优化网站的内容

让网站有趣实用

与本文中讨论的其他因素相比，创建吸引力与实用性兼具的内容可能对您网站的影响是最大的。内容是否优质，用户一看便知；当用户发现优质内容时，他们很可能会推荐其他用户访问此内容。他们可能通过博文、社交媒体服务、电子邮件、论坛或其他方式进行推荐。

自然的口碑效应有助于您的网站在用户和 Google 中建立声誉，但如果没有优质的内容，就难以产生这种效应。

了解读者所想（并向他们提供所需信息）

思考用户找到您的某些内容时可能用到的搜索字词。相较于不太熟悉相关主题的用户，非常了解该主题的用户可能在搜索查询中会使用不同的关键字。例如，资深足球迷可能会搜索“fifa”（Fédération Internationale de Football Association 的缩写），而新粉丝则可能会使用更为常规的查询，如“足球季后赛”。在撰写内容时，预测搜索行为的这些差异并将其纳入考虑范围内，例如可以搭配使用恰当的关键字词组，就可能会产生积极的影响。Google Ads 提供了便利的关键字规划师工具，该工具可帮助您发现新的关键字变体并了解每个关键字的大概搜索量。此外，Google Search Console 提供了效果报告，方便您查看会使您的网站显示在搜索结果中的热门搜索查询，以及为您的网站带来最多用户的搜索查询。

考虑创建一项还没有其他网站提供的实用新服务。您还可以撰写原创研究内容，爆料吸引眼球的新闻报道，或善用您独特的用户群。其他网站可能缺乏这样做的资源或专业知识。

撰写简单易懂的文字

用户喜欢文笔优秀、易于理解的内容。

应避免的做法：

编写的文章马虎草率，有许多拼写和语法错误。
文笔欠佳。
在图片和视频中嵌入文本：用户可能想复制和粘贴这些文本，但搜索引擎无法读取该文本。

主题结构清晰明了

合理安排内容结构总是有好处的，这可以让访问者清楚地知道内容主题的起止位置。将内容划分为符合逻辑的多个语块或部分，可帮助用户更快地找到他们想要的内容。

应避免的做法：

将大量不同主题的文字堆砌到网页上，不分隔段落、子标题或布局。

创建新鲜独特的内容

新内容不仅可以让现有访问者群体再次访问网站，还能吸引新访问者。

应避免的做法：

稍加改动（甚至复制）现有内容几乎不能为用户带来额外价值。
网站上到处是重复或近似重复的内容。

详细了解重复内容。

针对用户而非搜索引擎优化内容

根据访问者的需求设计网站并确保网站易于搜索引擎访问，这样做通常会产生积极的影响。

应避免的做法：

插入大量针对搜索引擎的不必要关键字，这些关键字让用户感到厌烦或对他们毫无意义。
含有“试图访问此网页时的常见拼写错误”等对用户几乎没有价值的文本。
以欺骗手法对用户隐藏文字，但对搜索引擎显示这类文字。

以培养用户的信任感为目标

如果用户认为您的网站可靠，就会愿意访问。

声誉良好的网站的可信度较高。增强网站的声誉，使其在特定领域具有专业性和权威性。

向用户说明您网站的发布商、提供相关内容的人员以及该网站的目标。如果您拥有一个购物网站或其他金融交易网站，确保提供清晰且令人满意的客户服务信息，以帮助用户解决问题。如果您拥有新闻网站，请明确说明谁对内容负责。

使用适当的技术也很重要。如果购物结算页没有采用安全的连接，用户便无法信任该网站。

彰显专业性和权威性

网站的专业性和权威性越强，其质量就越高。确保您网站上的内容是由相关主题的专家创作或编辑的。例如，提供专家信息或经验来源可以帮助用户了解文章的专业性。在网页中展示对某些科学主题广泛达成的共识是一种非常好的做法（如果此类共识存在的话）。

提供适量内容来阐明您的主题

制作优质内容至少需要在以下某个方面付出努力：时间、精力、专业知识和才能/技能。请确保内容准确无误、文笔清晰并且全面。例如，如果您在网页中描述了一个食谱，请提供易于理解的完整食谱，而不只是菜肴的一组配料或基本描述。

应避免的做法：

提供不足以阐明网页用途的内容。

避免投放会分散用户注意力的广告

网页上可以出现广告，不过，请不要让广告分散用户注意力，或妨碍他们浏览网站内容。例如，让用户难以使用网站的广告、补充内容或插页（在用户希望看到的内容之前或之后显示的网页）。详细了解此主题。

应避免的做法：

在您的网页上投放会分散用户注意力的广告。

明智地使用链接

撰写优质链接文字

链接文字是链接内的可见文字。这类文字会告诉用户和 Google 有关您将链接到的网页的信息。您网页上的链接可能是内部链接，即指向您网站上的其他网页，也可能是外部链接，即引向其他网站上的内容。在这两种情况下，定位文字越优质，用户越容易找到所需内容，Google 也越容易了解您链接到的网页上的内容。

使用适当的定位文字可让用户和搜索引擎轻松了解链接页所包含的内容。

选择描述性文字

定位文字至少提供有关链接到的网页的基本说明。

应避免的做法：

使用宽泛的定位文字，如“网页”、“文章”或“点击此处”。
使用与主题或链接到的网页的内容无关的文字。
在多数情况下将网页的网址用作定位文字。虽然这样做在某些情况下也合情合理，如宣传或引用新网站的地址。

文字简明扼要

尽量使用简短但具有描述性的文字 – 通常是几个字或一个短语。

应避免的做法：

撰写很长的定位文字，如一个长句或一小段文字。

设置链接格式，让链接容易识别

让用户能够轻松区分常规文本和链接的定位文字。如果用户没有看到链接或意外点击了它们，您内容的实用性将降低。

应避免的做法：

使用 CSS 或文本样式，让链接看起来像常规文本。

将内部链接的定位文字也纳入考虑范围

通常，您可能会考虑链接能否正常指向外部网站的问题，但加大对用于内部链接的定位文字的关注可帮助用户和 Google 更好地在您的网站中导航。

应避免的做法：

仅仅为了搜索引擎而使用冗长或关键字泛滥的定位文字。
创建不利于用户在网站中导航的不必要链接。

选择描述性文字

定位文字至少提供有关链接到的网页的基本说明。

应避免的做法：

使用宽泛的定位文字，如“网页”、“文章”或“点击此处”。
使用与主题或链接到的网页的内容无关的文字。
在多数情况下将网页的网址用作定位文字。虽然这样做在某些情况下也合情合理，如宣传或引用新网站的地址。

文字简明扼要

尽量使用简短但具有描述性的文字 – 通常是几个字或一个短语。

应避免的做法：

撰写很长的定位文字，如一个长句或一小段文字。

设置链接格式，让链接容易识别

让用户能够轻松区分常规文本和链接的定位文字。如果用户没有看到链接或意外点击了它们，您内容的实用性将降低。

应避免的做法：

使用 CSS 或文本样式，让链接看起来像常规文本。

将内部链接的定位文字也纳入考虑范围

通常，您可能会考虑链接能否正常指向外部网站的问题，但加大对用于内部链接的定位文字的关注可帮助用户和 Google 更好地在您的网站中导航。

应避免的做法：

仅仅为了搜索引擎而使用冗长或关键字泛滥的定位文字。
创建不利于用户在网站中导航的不必要链接。

注意所链接到的网站

您将自己的网站链接至其他网站时，这些网站也会因您网站的声誉而获益。有时，用户会通过在您网站的评论版块或留言板中添加自己网站的链接来使自己获益。或者，有时您是从负面角度提及某个网站，但同时您又不希望它因为您的网站的声誉而跟着沾光。例如，假设您正在撰写关于垃圾评论的博文，并且想引用一个最近对您的博客发表了垃圾评论的网站。您想提醒其他人提防该网站，因此，您在自己的内容中加入了指向该网站的链接；但是，您当然不希望这样的链接使得该网站因为您的声誉而获益。这时候就非常适合使用 nofollow。

另一个适合使用 nofollow 属性的情形就是微件链接。如果您使用了第三方微件来丰富网站的体验及吸引用户，请检查该微件是否包含您不想随其一起放到网站上的链接。某些微件可能会向您的网站添加链接，而这些链接并不属于编辑精选内容，并且还可能包含您作为网站所有者也许无法控制的定位文字。如果无法从微件中移除这类垃圾链接，您随时可以使用 nofollow 停止跟踪这些链接。如果您为自己提供的功能或内容创建微件，请务必在默认代码段的链接中包含 nofollow。

最后，如果您不希望搜索引擎跟踪网页中的任何链接，可以在该网页的 <head> 标记中添加 <meta name=”robots” content=”nofollow”> 标记。您可以在我们的文档中详细了解漫游器元标记。

使用 nofollow 处理垃圾评论

如需告知 Google 不要跟踪链接到的网页或链接到的网页不能因您网页的声誉而获益，请将链接的 rel 属性值设为 nofollow 或 ugc。如需让搜索引擎不跟踪某个链接，需要在该链接的锚标记中添加 rel=”nofollow” 或更具体的属性，例如 ugc，如下所示：

<a href=”http://www.example.com” rel=”nofollow”>Anchor text here</a>

或：

<a href=”http://www.example.com” rel=”ugc”>Anchor text here</a>

什么时候适合使用此标记？如果您网站上的博客启用了公开评论功能，那么这些评论中的链接可能会将您的声誉传递给某些您可能不愿意为其背书的网页。网页上的博客评论区域很容易出现垃圾评论。不跟踪该区域中用户添加的链接可确保您的网页来之不易的声誉不被垃圾网站沾光。

自动将 nofollow 添加到评论栏和留言板

许多博客软件包会自动对用户评论设置 nofollow，但那些不提供此功能的博客软件包也应该可以通过手动编辑的方式实现不跟踪。此建议也适用于您网站上可能涉及用户生成的内容的其他版块，例如留言簿、论坛、留言板、引荐来源网址列表等。如果您愿意为第三方添加的链接背书（例如，如果某评论者在您的网站上值得信赖），则无需针对链接使用 nofollow；但链接到 Google 认为是垃圾网站的网站可能会影响您自己网站的声誉。Google 搜索中心文档提供了更多有关如何避免垃圾评论的提示，例如，使用人机识别系统以及启用评论审查功能。

10. 如何优化SEO图片方法

使用 HTML 图片

使用 HTML 图片元素在内容中嵌入图片。

使用 HTML <img> 或 <picture> 元素。

语义 HTML 标记有助于抓取工具找到并处理图片。使用 <picture> 元素，您还可以针对不同屏幕尺寸为自适应图片指定多个选项。您还可以在图片上使用 loading=”lazy” 属性，提高用户的网页加载速度。

应避免的做法：

使用 CSS 显示您希望我们编入索引的图片。

使用 alt 属性

为图片提供说明性文件名和 alt 属性说明。alt 属性使您能够为图片指定替代文本，在图片由于某种原因不能显示时起到救场的作用。

为什么使用此属性？如果用户使用屏幕阅读器等辅助技术查看您的网站，则 alt 属性的内容会提供关于照片的信息。

另一个原因是，如果您将图片用作链接，则该图片的替代文本会等同于文字链接的定位文字。但是，如果文字链接可以起到相同的作用，我们建议不要在网站的导航中使用太多图片作为链接。最后，优化图片文件名和替代文本可使图片搜索项目（如 Google 图片）更好地理解您的图片。

为什么使用此属性？如果用户使用屏幕阅读器等辅助技术查看您的网站，则 alt 属性的内容会提供关于照片的信息。

使用简短但具有描述性的文件名和替代文本

和网页上被视为优化对象的许多其他部分一样，简短但具有描述性的文件名和替代文本是最理想的。

应避免的做法：

在可能的情况下均使用 image1.jpg、pic.gif、1.jpg 等宽泛的文件名。如果您的网站有数千张图片，您可能希望自动为图片命名。
文件名非常长。
替代文本中充斥着关键字，或复制粘贴整个句子来作为替代文本。

使用图片作为链接时提供替代文字

如果您决定使用图片作为链接，同时提供替代文本可帮助 Google 更深入地了解您链接到的网页。这就像您为文字链接撰写定位文字一样。

应避免的做法：

撰写会被认为是垃圾内容的超长替代文本。
网站导航仅使用图片链接。

帮助搜索引擎找到图片

图片站点地图可为 Googlebot 提供更多与在您网站上找到的图片有关的信息。这样能够提高您的图片出现在 Google 图片搜索结果中的几率。该文件的结构与您网页的 XML 站点地图文件类似。

使用标准图片格式

使用普遍支持的文件类型 – 大多数浏览器支持 JPEG、GIF、PNG、BMP 和 WebP 图片格式。另外，最好让文件扩展名与文件类型相匹配。

11. 如何优化seo移动端网站页面

构建适合移动设备的网站

当今世界由移动设备主宰。绝大多数人都是在移动设备上使用 Google 进行搜索。桌面版网站在移动设备上可能不太容易浏览及使用。因此，拥有适合移动设备的网站是提升在线影响力的重要因素。事实上，从 2016 年年末起， Google 已经开始尝试主要使用网站的移动版内容进行排名、解析结构化数据及生成摘要。

了解设备之间的差异

智能手机 – 在本文档中，“移动”或“移动设备”指智能手机，例如运行 Android 系统的手机、iPhone 或 Windows Phone。虽然移动设备的屏幕尺寸较小，且在几乎所有情况下，其默认屏幕方向为纵向，但移动浏览器与桌面浏览器类似，都可以呈现各种 HTML5 规格的网页。

平板电脑 – 我们将平板电脑视为一个单独的设备类别，因此在提及移动设备时，通常不包括平板电脑。相对而言，平板电脑的屏幕要大一些。这意味着，除非您提供针对平板电脑进行了优化的内容，否则用户通过平板电脑浏览网站时，还是希望看到桌面浏览器的显示方式，而非智能手机浏览器的显示方式。

多媒体手机：这类手机采用的浏览器可呈现符合 XHTML 编码标准的网页；支持 HTML5 标记、JavaScript/ECMAscript，但可能不支持某些采用 HTML5 标准的扩展程序 API。这通常指的是大多数带有 3G 功能的非智能手机中的浏览器。

非智能手机：这类手机采用的浏览器无法呈现使用标准 HTML 进行编码的标准桌面版网页，其中包括仅呈现使用 cHTML (iMode)、WML、XHTML-MP 等语言进行编码的网页的浏览器。

我们的建议主要针对智能手机，但即使是面向多媒体手机和非智能手机的网站，我们也鼓励其所有者酌情采纳这些建议。

选择移动策略

有多种方法可以让您的网站适合移动设备，并且 Google 也支持不同的实现方法：

自适应设计（推荐）

动态提供内容

单独的网址

创建完适合移动设备的网站后，您可以通过 Google 的移动设备适合性测试检验您网站上的网页是否满足相关条件，以便其能在 Google 搜索结果页上被标记为适合移动设备。您还可以查看 Search Console 的“移动设备易用性报告”，并修正会对您的网站在移动设备上的易用性造成影响的问题。

如果您的网站在多个网页上提供大量静态内容（如博文或商品着陆页），请考虑使用 AMP (Accelerated Mobile Pages) 实现静态内容。AMP 是一种特殊的 HTML，可确保您的网站保持较快速度并方便用户使用，并可以通过各种平台（包括 Google 搜索）进一步加速。

配置移动网站，以便网站被准确编入索引

无论您选择使用哪种配置来设置移动网站，都需要注意以下几点：

如果您动态提供内容或拥有单独的移动网站，当网页采用适合移动设备的格式时（或当网页拥有所用格式适合移动设备的对等网页时），请告知 Google。这有助于 Google 在搜索结果中准确地向移动设备搜索用户提供内容。

如果您使用自适应设计，请使用 meta name=”viewport” 标记告诉浏览器如何调整内容。如果您使用的是动态提供内容功能，请使用 Vary HTTP 标头，根据用户代理指示您所做的更改。如果您使用单独的网址，则可以通过向网页添加包含 rel=”canonical” 和 rel=”alternate” 元素的 <link> 标记，指明两个网址之间的关系。

确保资源可供抓取。屏蔽网页资源会致使 Google 无法了解您网站的全貌。当您的 robots.txt 文件阻止了对您的某些或所有网页资源的访问时，通常会发生这种情况。如果 Googlebot 无法访问某个网页的资源（如 CSS、JavaScript 或图片），那么我们可能无法检测出该网页是专门为了在移动设备浏览器中正常显示和运行而构建的。也就是说，我们可能无法检测到该网页是适合在移动设备上浏览的网页，因而不能以适当的方式向移动搜索用户提供该网页。

避免出现会阻碍移动设备访问者访问网页的常见错误，比如存在无法播放的视频。

如果移动版网页无法提供令人满意的搜索体验，那么在移动搜索结果中的排名便会下降，或是在移动搜索结果中显示时伴有警告。这类情况包括但不限于，移动设备上会妨碍用户体验的全页插页式广告。

在所有设备上提供所有功能。移动用户希望网站在移动设备上提供和在其他设备上一样的功能（如发布评论和结帐）及内容。除了文字内容，确保所有重要图片和视频都已经嵌入移动版本，并且用户能通过移动设备访问。对于搜索引擎，在所有版本的网页上提供所有结构化数据和其他元数据（例如标题、说明、link 元素和其他元标记）。

确保移动网站上也包含桌面网站上所有的结构化数据、图片、视频和元数据。

☆ 最佳做法

使用移动设备适合性测试测试您的移动版网页，看看 Google 是否认为您的网站适合在移动设备上浏览。

如果您的移动版网页有单独的网址，请务必对移动版网址和桌面版网址都进行测试，以确保 Google 可以识别并抓取相关重定向。

12. 如何推广你的网站

虽然随着人们通过搜索或其他方式发现您的内容并链接到您的网站，大多数连接至您网站的链接都将逐渐添加至您的网站，但是 Google 理解您希望其他人能够了解您为内容所付出的努力。有效推广新内容能够让对同一主题感兴趣的人更快发现您的内容。与本文中提及的大部分建议一样，极端地采纳这些建议实际上可能会损害您网站的声誉。

在网站上写一篇博文，告诉访问者群体您已经添加了新内容，这是宣传新内容或服务的不错方法。关注您网站或 RSS Feed 的其他网站所有者也可能会帮您继续宣传下去。

倾注精力线下推广您的公司或网站也非常有帮助。例如，如果您拥有企业网站，请确保将网址印在您的名片、信头、海报上等。您还可以通过电子邮件向客户定期发送简报，让他们了解公司网站上的新内容。

如果您经营着一家本地商家，将商家信息添加到 Google 我的商家将有助于您在 Google 地图和 Google 搜索上吸引客户。

了解社交媒体网站

围绕用户互动和共享构建的网站让感兴趣人群更容易找到相关内容。

× 应避免的做法：

事无巨细地推广所创建的每一个新内容；应该推广精彩、有趣的内容。
对网站采用链接方案，在这些服务中人为地置顶您的内容。

与相关社区的其他网站建立联系

很多网站上的主题很有可能与您网站上的主题相似。与这些网站建立通信通常对您有利。您的特定领域或社区中的热门话题能够激发新的内容想法或帮助建立良好社区资源。

× 应避免的做法：

将链接请求不加挑选地发给与您的主题相关的所有网站。
从另一个网站购买链接，以提升 PageRank。

13. 如何分析网站

分析搜索效果

包括 Google 在内的主流搜索引擎为网站所有者提供了免费工具，可用于分析网站在搜索引擎中的效果。Google 的工具是 Search Console。

Search Console 可提供以下两类重要信息：Google 能够找到我的内容吗？我的网站在 Google 搜索结果中的效果如何？

使用 Search Console 并不会让您的网站获得优先待遇，但它可以帮助您发现问题，如果解决了这些问题，则有助于提高您的网站在搜索结果中的排名。

借助该服务，网站所有者可以：

了解 Googlebot 无法抓取网站的哪些部分

测试及提交站点地图

分析或生成 robots.txt 文件

移除 Googlebot 已经抓取的网址

指定首选网域

找出 title 和 description 元标记中的问题

了解用来转向网站的热门搜索

了解 Googlebot 看到的网页外观如何

接收质量指南违反通知，并请求重新审核网站

微软的 Bing 网站站长工具也为网站所有者提供免费工具。

分析网站上的用户行为

如果您已经使用 Google Search Console 或其他服务改进了网站的抓取和索引编制效果，那么您可能想了解关于自己的网站流量的信息。Google Analytics（分析）等网站分析程序是了解这一点的实用来源。您可以使用这些网站分析程序来：

洞悉用户如何找到您的网站以及在您的网站上有何行为

发现您网站上最受欢迎的内容

衡量对网站所做的优化带来的影响，例如，更改 title 和 description 元标记是否提高了搜索引擎带来的流量？

对于高级用户，分析包提供的信息与您的服务器日志文件的数据相结合，可以提供更加全面的关于访问者如何与文档互动的信息（例如，搜索者可能用来查找您网站的其他关键字）。

14. 其他资源

Google 搜索中心博客

在 Google 搜索中心博客获取最新资讯，您可以找到关于 Google 搜索更新、Search Console 新功能及其他众多内容的信息。

Google 搜索中心帮助论坛

在网站所有者的产品论坛中，您可以就网站存在的问题发帖咨询，还能找到有关创建品质出众的网站的妙招。论坛中有许多经验丰富的贡献者，包括产品专家，偶尔还会有 Google 员工。

Google 搜索中心 Twitter 帐号

请关注我们，获取各种能够帮助您构建精彩网站的资讯和资源。 “Google 搜索中心”YouTube 频道

观看我们为网站所有者社区录制的数百个实用视频，让 Google 员工为您答疑解惑。

Google 搜索的运作方式

了解当您通过 Google 搜索进行搜索时后台发生的活动。您将了解到一些非常精彩的趣事！

在线开展业务

如果您有家小型企业，可以免费注册一个网站。GYBO 是 Google 和 Homestead 合作的项目，旨在帮助小型企业注册网站并供其免费使用一年。

三、SEO高阶优化指南

1. sitemap的创建与管理

什么是站点地图？

站点地图是一种文件，您可以在其中提供与您网站中的网页、视频或其他文件有关的信息，还可以说明这些内容之间的关系。Google 等搜索引擎会读取此文件，以便更高效地抓取您的网站。站点地图会告诉 Google 您认为网站中的哪些网页和文件比较重要，还会提供与这些文件有关的重要信息。例如，网页上次更新的时间和网页是否有任何备用的语言版本。

您可以使用站点地图提供与特定类型的网页内容（包括视频、图片和新闻内容）有关的信息。例如：

站点地图视频条目可以指定视频的时长、类别以及适合哪些年龄段的受众。

站点地图图片条目中可包含图片主题、类型和许可。

站点地图新闻条目中可包含报道标题和发布日期。

☆ 如果您使用的是 WordPress、Wix 或 Blogger 等 CMS，那么您的 CMS 可能已经向搜索引擎提供了站点地图，您无需采取任何措施。

我需要站点地图吗？

如果您网站上的网页链接得当，那么 Google 通常能够发现其中的大多数网页。链接得当是指您认为重要的所有网页都可以通过某些形式的导航（例如您网站的菜单，或您放入网页中的链接）抵达。即便如此，站点地图仍有助于我们更加高效地抓取规模更大、更复杂的网站或更特殊的文件。

☆ 由于 Google 依靠复杂的算法安排抓取流程，因此，使用站点地图并不能保证 Google 能抓取站点地图中的所有内容并将其编入索引。但在大多数情况下，您的网站都会因使用站点地图而受益，而绝不会造成负面影响。

在以下情况下，您可能需要站点地图：

网站规模很大。在这种情况下，Google 网页抓取工具更有可能在抓取时漏掉部分新网页或最近更新的网页。

网站有大量内容页归档，这些内容页之间互不关联或缺少有效链接。如果您的网站网页没有自然地相互引用，那么您可以在站点地图中列出这些网页，确保 Google 不会漏掉其中某些网页。

网站为新网站且指向该网站的外部链接不多。Googlebot 及其他网页抓取工具是通过跟踪网页之间的链接来抓取网页的。因此，如果没有其他网站链接到您的网页，Google 可能不会发现您的网页。

您的网站包含大量富媒体内容（视频、图片）或显示在 Google 新闻中。如果提供了站点地图，在适当情况下，Google 能将站点地图中的其他信息纳入搜索范围。

在以下情况下，您可能不需要站点地图：

您的网站规模“较小”。规模较小是指网站上的网页数不超过 500 个。（只有您认为需要纳入搜索结果中的网页才会计入此总数。）

您的网站已在内部全面建立链接。这意味着，Google 可以沿着首页的链接找到您网站上的所有重要网页。

您想在搜索结果中显示的媒体文件（视频、图片）或新闻网页不多。站点地图可帮助 Google 找到并了解您网站上的视频和图片文件或新闻报道。但如果您不希望这些内容出现在图片、视频或新闻搜索结果中，则可能不需要站点地图。

如何创建站点地图？

站点地图格式

Google 支持多种站点地图格式：

XML

RSS、mRSS 和 Atom 1.0

文本

Google 支持所有格式的标准站点地图协议，但目前不支持在站点地图中使用 <priority> 属性。

无论采用哪种格式，单个站点地图的文件大小一律不得超过 50MB（未压缩），并且其中包含的网址数量不得超过 50000 个，否则必须将站点地图拆分成多个较小的站点地图。您也可以选择创建站点地图索引文件（即指向站点地图列表的文件），然后将这个索引文件提交给 Google。您可以向 Google 提交多个站点地图和/或站点地图索引文件。

XML

下方是一个非常基本的 XML 站点地图，其中仅包含 1 个网址的位置信息：

您可以在 sitemaps.org 上找到更复杂的示例和完整文档。

您可以查看指定其他语言版本网页的站点地图示例，以及新闻、图片或视频文件的站点地图示例。

RSS、mRSS 和 Atom 1.0

如果您的博客有 RSS 或 Atom Feed，那么您可以将该 Feed 的网址作为站点地图提交。大多数博客软件都能为您创建 Feed，但请注意，此类 Feed 只会提供关于近期网址的信息。

Google 支持 RSS 2.0 Feed 和 Atom 1.0 Feed。

您可以使用 mRSS（媒体 RSS）Feed 向 Google 提供有关您网站上视频内容的详情。

文本

如果您的站点地图只包含网页网址，那么您可以向 Google 提供简单的文本文件（每行只包含一个网址）。例如：

http://www.example.com/file1.html

http://www.example.com/file2.html

创建站点地图方式

创建站点地图，就是在告诉搜索引擎您希望让哪些网址显示在搜索结果中。这些就是规范网址。如果不同网址下可供访问的内容相同，请选择您偏好的网址并将其加入站点地图，而不是将所有指向相同内容的网址都加入站点地图。

在确定要将哪些网址加入站点地图后，选择下列方式之一来创建站点地图，具体取决于您网站的架构和大小：

让您的 CMS 为您生成站点地图。

如果要创建的站点地图包含的网址不到几十个，您可以手动创建站点地图。

如果要创建的站点地图包含的网址超过几十个，请自动生成站点地图。

让您的 CMS 为您生成站点地图

如果您使用的是 WordPress、Wix 或 Blogger 等 CMS，那么您的 CMS 可能已经向搜索引擎提供了站点地图。尝试搜索以下方面的信息：您的 CMS 如何生成站点地图，或者在您的 CMS 没有自动生成站点地图时如何创建站点地图。例如，如果您使用的是 Wix，请搜索“wix sitemap”。

对于所有其他网站设置，您需要自行生成站点地图。

手动创建站点地图

如果要创建的站点地图包含的网址不到几十个，您或许能够手动创建站点地图。为此，请打开 Windows Notepad、 Nano（Linux、MacOS）等文本编辑器，然后按照站点地图格式部分中所述的语法创建站点地图。

您可以手动创建较大的站点地图，但此过程非常繁琐。

自动生成站点地图

如果要创建的站点地图包含的网址超过几十个，您需要自动生成站点地图。有很多工具可以生成站点地图。不过，最好是让您的网站制作软件为您生成站点地图。例如，您可以从您网站的数据库中提取网站的网址，然后将网址导出到屏幕上或网络服务器的实际文件中。请与您的开发者或服务器管理员讨论此解决方案。如果您需要代码方面的指导，不妨看看我们以前汇总的第三方站点地图生成器。

请注意，站点地图的大小不得超过 50 MB。详细了解如何管理大型站点地图。

如何将站点地图提交给 Google

Google 并非每次抓取网站时都会查看站点地图。我们仅在首次发现站点地图时查看；之后仅在您使用 ping 功能通知我们站点地图有变更时查看。请仅在新建或更新站点地图时向 Google 发送站点地图相关提醒。如果站点地图无任何变更，请勿多次向我们提交或 ping 站点地图。

如果站点地图中有更新过的网页，请使用 <lastmod> 字段标记这些网页。其他 XML 文件有类似的字段，例如 Atom XML 的 <updated>。您还可以参阅相关说明，了解如何计算此日期。

您可通过以下几种不同方法将站点地图提交给 Google：

使用站点地图报告提交站点地图。

使用 ping 工具。在浏览器或命令行中向此地址发送 GET 请求，并指定站点地图的完整网址。请确保站点地图文件可供访问：

https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP示例：

https://www.google.com/ping?sitemap=https://example.com/sitemap.xml

将下面这行内容插入到 robots.txt 文件中的任意位置，指定站点地图的路径。我们会在下次抓取 robots.txt 文件时找到该站点地图：

Sitemap: https://example.com/my_sitemap.xml

如果您的站点地图采用了 Atom/RSS，并且您想要向 Google 及其他搜索引擎广播您的更改，请使用 WebSub

站点地图使用指南

使用一致且完全限定的网址。Google 会严格按照您列出的网址进行抓取。例如，如果网站位于 https://www.example.com/，请勿将网址指定为 https://example.com/（缺少 www）或 ./mypage.html（相对网址）。

站点地图可以发布在网站上的任何位置，但是站点地图只影响父级目录中的下级目录。因此，如果站点地图发布在网站的根目录下，则可以影响网站上的所有文件，所以我们建议将站点地图发布在此目录下。

请勿在站点地图中包含网址的会话 ID。这样可以减少对这些网址的重复抓取。

使用 hreflang 注解将其他语言版本的网址告知 Google。

您必须对站点地图文件进行 UTF-8 编码，并且适当地对网址进行转义。

将较大的站点地图拆分成数个较小的站点地图：站点地图的网址数量上限为 50000 个，且压缩前的大小上限为 50MB。使用站点地图索引文件列出所有单个站点地图，然后将这个文件提交给 Google，而不是分别提交各个站点地图。

在站点地图中仅列出规范网址。如果您的网页有两个版本，则仅在站点地图中列出您希望在搜索结果中显示的版本。如果您有两个版本的网站（例如，www 和非 www），请确定您的首选网站，并将站点地图放入其中，然后在另一个网站上添加 rel=canonical 或重定向。

如果您为网页的移动版和桌面版提供了不同的网址，建议在站点地图中仅指向一个版本。但是，如果您认为需要同时指向这两个网址，请为网址添加注解，指明桌面版和移动版分别是哪个。

使用站点地图扩展功能指向视频、图片和新闻等其他媒体类型。

如果您针对不同语言或区域提供了其他版本的网页，可以在站点地图或 HTML 标记中使用 hreflang 指明其他版本的网址。

非字母数字字符和非拉丁字符。 我们要求您的站点地图文件使用 UTF-8 编码（您通常可在保存文件时采用这种编码）。和所有 XML 文件一样，对于下表中列出的字符，任何数据值（包括网址）都必须使用实体转义码。站点地图只能包含 ASCII 字符；它不能包含扩展 ASCII 字符、某些控制码或特殊字符（如 * 和 {}）。如果您的站点地图网址包含这些字符，那么当您尝试添加该网址时，就会收到错误消息。

此外，所有网址（包括站点地图的网址）都必须经过编码，以便能被它们所在的且会对其网址进行转义的网络服务器识别。不过，如果您使用任何类型的脚本、工具或日志文件（除手动输入网址以外的任何方法）生成网址，这部分工作通常已由系统替您完成。如果您提交了站点地图，然后却收到了提示您 Google 无法找到其中某些网址的错误消息，请检查并确保网址遵循了适用于 URI 的 RFC-3986 标准、适用于 IRI 的 RFC-3987 标准以及 XML 标准。

下方是一个采用非 ASCII 字符 (ü) 和需要进行实体转义的字符 (&) 的网址示例：

http://www.example.com/ümlat.html&q=name

下方是采用 ISO-8859-1 编码（以便在使用该编码的服务器上托管）且经过网址转义的同一网址：

http://www.example.com/%FCmlat.html&q=name

下方是采用 UTF-8 编码（以便在使用该编码的服务器上托管）且经过网址转义的同一网址：

http://www.example.com/%C3%BCmlat.html&q=name

下方是经过实体转义的同一网址：

http://www.example.com/%C3%BCmlat.html&q=name

请注意，站点地图用于向 Google 建议您认为重要的网页，Google 不承诺会抓取站点地图中的每个网址。

Google 会忽略 <priority> 和 <changefreq> 值。

如果 <lastmod> 值始终准确并可验证（例如通过与网页的最后修改日期进行比较），Google 会使用该值。

网址在站点地图中的位置并不重要；Google 不会按照网址在站点地图中的显示顺序抓取网址。

2. robots.txt创建与管理

什么是robots.txt

robots.txt 文件规定了搜索引擎抓取工具可以访问您网站上的哪些网址。此文件主要用于避免您的网站收到过多请求；它并不是一种阻止 Google 抓取某个网页的机制。若想阻止 Google 访问某个网页，请使用 noindex 禁止将其编入索引，或使用密码保护该网页。

robots.txt 文件有什么作用？

robots.txt 文件主要用于管理流向您网站的抓取工具流量，通常用于阻止 Google 访问某个文件（具体取决于文件类型）：

了解 robots.txt 文件的限制

在创建或修改 robots.txt 文件之前，您应了解这种网址屏蔽方法的限制。根据您的目标和具体情况，您可能需要考虑采用其他机制来确保搜索引擎无法在网络上找到您的网址。

并非所有搜索引擎都支持 robots.txt 指令。

robots.txt 文件中的命令并不能强制规范抓取工具对网站采取的行为；是否遵循这些命令由抓取工具自行决定。Googlebot 和其他正规的网页抓取工具都会遵循 robots.txt 文件中的命令，但其他抓取工具未必如此。因此，如果您想确保特定信息不会被网页抓取工具抓取，我们建议您采用其他屏蔽方法，例如用密码保护服务器上的隐私文件。

不同的抓取工具会以不同的方式解析语法。

虽然正规的网页抓取工具会遵循 robots.txt 文件中的指令，但每种抓取工具可能会以不同的方式解析这些指令。您需要好好了解一下适用于不同网页抓取工具的正确语法，因为有些抓取工具可能会无法理解某些命令。

如果其他网站上有链接指向被 robots.txt 文件屏蔽的网页，则此网页仍可能会被编入索引

尽管 Google 不会抓取被 robots.txt 文件屏蔽的内容或将其编入索引，但如果网络上的其他位置有链接指向被禁止访问的网址，我们仍可能会找到该网址并将其编入索引。因此，相关网址和其他公开显示的信息（如相关页面链接中的定位文字）仍可能会出现在 Google 搜索结果中。若要正确阻止您的网址出现在 Google 搜索结果中，您应为服务器上的文件设置密码保护、使用 noindex 元标记或响应标头，或者彻底移除网页。

如何创建 robots.txt 文件

☆ 如果您使用了 Wix 或 Blogger 等网站托管服务，则可能无需（或无法）直接修改 robots.txt 文件。您的托管服务提供商可能会通过显示搜索设置页面或借用其他某种方式，让您告知搜索引擎是否应抓取您的网页。

如果您想向搜索引擎隐藏/取消隐藏您的某个网页，请搜索以下说明：如何在托管服务上修改网页在搜索引擎中的可见性，例如搜索“Wix 向搜索引擎隐藏网页”。

您可以使用 robots.txt 文件控制抓取工具可以访问您网站上的哪些文件。robots.txt 文件应位于网站的根目录下。因此，对于网站 www.example.com，robots.txt 文件的路径应为 www.example.com/robots.txt。robots.txt 是一种遵循漫游器排除标准的纯文本文件，由一条或多条规则组成。每条规则可禁止或允许特定抓取工具抓取相应网站的指定文件路径下的文件。除非您在 robots.txt 文件中另行指定，否则所有文件均隐式允许抓取。

下面是一个包含两条规则的简单 robots.txt 文件：

User-agent: Googlebot Disallow: /nogooglebot/ User-agent: * Allow: / Sitemap: http://www.example.com/sitemap.xml

以下是该 robots.txt 文件的含义：

名为 Googlebot 的用户代理不能抓取任何以 http://example.com/nogooglebot/ 开头的网址。

所有其他用户代理均可抓取整个网站。不指定这条规则也无妨，结果是一样的；默认行为是用户代理可以抓取整个网站。

该网站的站点地图文件路径为 http://www.example.com/sitemap.xml。

创建 robots.txt 文件的基本准则

要创建 robots.txt 文件并使其在一般情况下具备可访问性和实用性，需要完成 4 个步骤：

创建一个名为 robots.txt 的文件。

向 robots.txt 文件添加规则。

将 robots.txt 文件上传到您的网站。

测试 robots.txt 文件。

创建 robots.txt 文件

您几乎可以使用任意文本编辑器创建 robots.txt 文件。例如，Notepad、TextEdit、vi 和 emacs 可用来创建有效的 robots.txt 文件。请勿使用文字处理软件，因为此类软件通常会将文件保存为专有格式，且可能会向文件中添加非预期的字符（如弯引号），这样可能会给抓取工具带来问题。如果保存文件时出现相应系统提示，请务必使用 UTF-8 编码保存文件。

格式和位置规则：

文件必须命名为 robots.txt。

网站只能有 1 个 robots.txt 文件。

robots.txt 文件必须位于其要应用到的网站主机的根目录下。例如，若要控制对 https://www.example.com/ 下所有网址的抓取，就必须将 robots.txt 文件放在 https://www.example.com/robots.txt 下，而不能将其放在子目录中（例如 https://example.com/pages/robots.txt 下）。如果您不确定如何访问自己的网站根目录，或者需要相应权限才能访问，请与网站托管服务提供商联系。如果您无法访问网站根目录，请改用其他屏蔽方法（例如元标记）。

robots.txt 文件可应用到子网域（例如 https://website.http://example.com/robots.txt）或非标准端口（例如 http://example.com:8181/robots.txt）。

robots.txt 文件必须是采用 UTF-8 编码（包括 ASCII）的文本文件。Google 可能会忽略不属于 UTF-8 范围的字符，从而可能会导致 robots.txt 规则无效。

向 robots.txt 文件添加规则

规则是关于抓取工具可以抓取网站哪些部分的说明。向 robots.txt 文件中添加规则时，请遵循以下准则：

robots.txt 文件包含一个或多个组。

每个组由多条规则或指令（命令）组成，每条指令各占一行。每个组都以 User-agent 行开头，该行指定了组适用的目标。

每个组包含以下信息：

组的适用对象（用户代理）

代理可以访问的目录或文件。

代理无法访问的目录或文件。

抓取工具会按从上到下的顺序处理组。一个用户代理只能匹配 1 个规则集（即与相应用户代理匹配的首个最具体组）。

系统的默认假设是：用户代理可以抓取所有未被 disallow 规则屏蔽的网页或目录。

规则区分大小写。例如，disallow: /file.asp 适用于 https://www.example.com/file.asp，但不适用于 https://www.example.com/FILE.asp。

# 字符表示注释的开始处。

Google 的抓取工具支持 robots.txt 文件中的以下指令：

user-agent: [必需，每个组需含一个或多个 User-agent 条目] 该指令指定了规则适用的自动客户端（即搜索引擎抓取工具）的名称。这是每个规则组的首行内容。 Google 用户代理列表中列出了 Google 用户代理名称。使用星号 (*) 会匹配除各种 AdsBot 抓取工具之外的所有抓取工具，AdsBot 抓取工具必须明确指定。例如：

# Example 1: Block only Googlebot User-agent: Googlebot Disallow: / # Example 2: Block Googlebot and Adsbot User-agent: Googlebot User-agent: AdsBot-Google Disallow: / # Example 3: Block all but AdsBot crawlers User-agent: * Disallow: /

disallow: [每条规则需含至少一个或多个 disallow 或 allow 条目] 您不希望用户代理抓取的目录或网页（相对于根网域而言）。如果规则引用了某个网页，则必须提供浏览器中显示的完整网页名称。它必须以 / 字符开头；如果它引用了某个目录，则必须以 / 标记结尾。

allow: [每条规则需含至少一个或多个 disallow 或 allow 条目] 上文中提到的用户代理可以抓取的目录或网页（相对于根网域而言）。此指令用于替换 disallow 指令，从而允许抓取已禁止访问的目录中的子目录或网页。对于单个网页，请指定浏览器中显示的完整网页名称。对于目录，请用 / 标记结束规则。

sitemap: [可选，每个文件可含零个或多个 sitemap 条目] 相应网站的站点地图的位置。站点地图网址必须是完全限定的网址；Google 不会假定存在或检查是否存在 http、https、www、非 www 网址变体。站点地图是一种指示 Google 应抓取哪些内容的不错方式，但并不用于指示 Google 可以抓取或不能抓取哪些内容。详细了解站点地图。示例：

Sitemap: https://example.com/sitemap.xml Sitemap: http://www.example.com/sitemap.xml

除 sitemap 之外的所有指令都支持使用通配符 * 表示路径前缀、后缀或整个字符串。

与这些指令均不匹配的行将被忽略。

如需有关每个指令的完整说明，请参阅 Google 对 robots.txt 规范的解释页面。

上传 robots.txt 文件

将 robots.txt 文件保存到计算机后，您便可以将其提供给搜索引擎抓取工具。没有一个统一工具可以帮助您完成这项工作，因为如何将 robots.txt 文件上传到网站取决于您的网站和服务器架构。请与您的托管公司联系，或在托管公司的文档中进行搜索；例如，搜索“上传文件 infomaniak”。

上传 robots.txt 文件后，请测试该文件是否可公开访问，以及 Google 能否解析该文件。

测试 robots.txt 标记

要测试新上传的 robots.txt 文件是否可公开访问，请在浏览器中打开无痕浏览窗口（或等效窗口），然后转到 robots.txt 文件的位置。例如：https://example.com/robots.txt。如果您看到 robots.txt 文件的内容，就可准备测试标记了。

Google 提供了两种测试 robots.txt 标记的方式：

Search Console 中的 robots.txt 测试工具。您只能针对您网站上可供访问的 robots.txt 文件使用此工具。

如果您是开发者，请了解并构建 Google 的开源 robots.txt 库，该库也用在 Google 搜索中。您可以使用此工具在计算机上本地测试 robots.txt 文件。

向 Google 提交 robots.txt 文件

在您上传并测试 robots.txt 文件后，Google 的抓取工具会自动找到并开始使用您的 robots.txt 文件。您无需采取任何操作。如果您更新了 robots.txt 文件，并需要尽快刷新 Google 的缓存副本，请了解如何提交更新后的 robots.txt 文件。

实用的 robots.txt 规则

如何更新 robots.txt 文件

若要更新现有 robots.txt 文件中的规则，请从您的网站下载 robots.txt 文件的副本，然后进行必要的修改。

下载 robots.txt 文件

您可以通过多种方式下载 robots.txt 文件，例如：

导航到 robots.txt 文件（例如 https://example.com/robots.txt），并将其内容复制到计算机上的新文本文件中。在创建新的本地文件时，请务必遵循与文件格式相关的准则。

使用 cURL 等工具下载 robots.txt 文件的实际副本。例如：curl https://example.com/robots.txt -o robots.txt

使用 Search Console 中的 robots.txt 测试工具下载 robots.txt 文件的副本。

点击 robots.txt 编辑器右下角的提交。系统会打开“提交”对话框。

点击提交对话框中的下载，从 robots.txt 测试工具页面下载 robots.txt 代码。

修改 robots.txt 文件

在文本编辑器中打开从您的网站下载的 robots.txt 文件，然后对规则进行必要的修改。请确保使用正确的语法，并以 UTF-8 编码格式保存文件。

上传 robots.txt 文件

将新的 robots.txt 文件以文本文件的形式上传到您所在网域的根目录下，名称仍为 robots.txt 将文件上传到网站的方式在很大程度上取决于平台和服务器。请查看有关将 robots.txt 文件上传到网站的帮助提示。

3. Google 是如何理解网页的？

Google之所以能理解网页，就是因为有元标记，Google 既支持网页级元标记也支持内嵌指令，可以根据这些指令和标记判断如何在 Google 搜索结果中显示您网站的网页。

网页级元标记是网站所有者向搜索引擎提供网站相关信息的绝佳方法。您可以使用元标记为各种类型的客户端提供信息，但每个系统只会处理它可以识别的元标记，而将其余元标记全部忽略。元标记应添加到 HTML 网页的 <head> 部分，通常如下所示：

Google 可识别以下元标记（该列表并不详尽）：

需要注意的其他事项

无论网页采用的是哪种代码，Google 都能读取 HTML 和 XHTML 样式的元标记。

除了 google-site-verification 外，其他元标记的大小写通常无关紧要。

此列表并未列出所有的元标记。如果其他元标记对您的网站很重要，您可以使用这些元标记，但 Google 会忽略它不知道的元标记。

内嵌指令

您可以在网页级元标记之外单独指定在摘要中排除 HTML 网页的某些部分。为此，您可以将 data-nosnippet HTML 属性添加到某个受支持的 HTML 标记中：

span

div

section

例如：

This text can be included in a snippet and this part would not be shown.

如何阻止搜索引擎编入索引？

若想阻止某个网页出现在 Google 搜索结果中，您可以在该网页的 HTML 代码中添加 noindex 元标记，或在 HTTP 响应中返回 noindex 标头。当 Googlebot 下次抓取该网页并发现该标记或标头时，就会完全阻止该网页出现在 Google 搜索结果中，不论是否有其他网站链接到该网页。

☆ 重要提示：为让 noindex 指令生效，网页不得被 robots.txt 文件屏蔽，并且必须能被抓取工具访问。如果该网页被 robots.txt 文件屏蔽或抓取工具无法访问该网页，那么抓取工具将永远无法看到 noindex 指令，因此该网页可能仍会显示在搜索结果中，例如，如果有其他网页链接到该网页的话。

如果您不具备对服务器的根访问权限，可借助非常实用的 noindex 控制对您网站中各个网页的访问权限。

实施 noindex

实施 noindex 的方法有两种：将其作为元标记实施，或作为 HTTP 响应标头实施。这两种方法的效果相同，从中选择更方便您网站采用的那一种方法即可。

<meta> 标记

若想阻止大部分搜索引擎网页抓取工具将您网站中的某个网页编入索引，请将以下元标记放入该网页的 <head> 部分中：

Plain Text<meta name=”robots” content=”noindex”>

若想仅阻止 Google 网页抓取工具将网页编入索引，请使用以下元标记：

Plain Text<meta name=”googlebot” content=”noindex”>

请注意，某些搜索引擎网页抓取工具对 noindex 指令可能会有不同的解读。因此，您的网页可能仍会出现在其他搜索引擎的结果中。

HTTP 响应标头

除了使用元标记，您还可在响应中返回一个值为 noindex 或 none 的 X-Robots-Tag 标头。下面是一个 HTTP 响应示例，它含有一个 X-Robots-Tag，用来指示抓取工具不要将某一网页编入索引：

ApacheHTTP/1.1 200 OK(…)X-Robots-Tag: noindex(…)

4.如何使用抓取工具

请求 Google 重新抓取您的网址

如果您最近向网站添加了新网页或对网站中的现有网页进行了更改，则可以使用下列任一方法请求 Google 将该网页重新编入索引。您无法请求将不受您管理的网址编入索引。

☆ 您是否使用了托管式内容管理平台（例如 Blogger 或 WordPress）？在大多数情况下，内容管理平台会自动将您的新内容提交给搜索引擎。请查看相应平台的支持文章。

常规指南

抓取用时可能会从几天到几周不等。请耐心等待，并通过索引状态报告或网址检查工具监控进度。

本文所述的所有方法的响应用时大致相同。

提交单个网址时有配额限制。

多次请求重新抓取同一网址或站点地图并不会缩短其抓取用时。

请求抓取的方法

使用网址检查工具（若网址数量不多）

注意：您必须是 Search Console 资源的所有者或完整权限用户，才能在网址检查工具中请求将相应网址编入索引。

您可以使用网址检查工具请求抓取单个网址。请注意，如果您有大量网址，请改为提交站点地图。

若要将网址提交至索引系统，请执行以下操作：

遵循常规指南。

使用网址检查工具检查网址。

选择请求编入索引。该工具会对网址进行实时测试，检查网址是否存在任何明显的索引编制问题。如果不存在，此网页将加入索引编制队列。如果该工具发现网页存在问题，请尝试修正这些问题。

☆ 请求抓取并不能保证系统会立即将网页收录到搜索结果中，甚至不能保证系统会收录该网页。我们的系统会优先快速收录优质、实用的内容。

提交站点地图（一次提交多个网址）

站点地图是让 Google 发现您网站上网址的重要渠道。站点地图也可包含与备用语言版本、视频、图片或新闻网页相关的其他元数据。

验证 Googlebot

您可以验证访问您服务器的网页抓取工具是否确实是 Googlebot（或其他 Google 用户代理）。如果您担心自称是 Googlebot 的垃圾内容发布者或其他麻烦制造者在访问您的网站，则会发现该方法非常有用。Google 不会发布一个公开的 IP 地址列表供网站所有者添加到许可名单。这是因为这些 IP 地址范围可能会发生变化，从而给已对其进行硬编码的网站所有者带来麻烦。因此，您必须按照下述方法运行 DNS 查找。

验证抓取工具是否为 Googlebot

使用命令行工具

使用 host 命令对日志中访问服务器的 IP 地址运行 DNS 反向查找。

验证域名是 googlebot.com 还是 google.com。

使用 host 命令对在第 1 步中检索到的域名运行 DNS 正向查找。验证该域名与日志中访问服务器的原始 IP 地址是否一致。

示例 1：

> host 66.249.66.1

1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

> host http://crawl-66-249-66-1.googlebot.com

http://crawl-66-249-66-1.googlebot.com has address 66.249.66.1

示例 2：

> host 66.249.90.77

77.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.

> host http://rate-limited-proxy-66-249-90-77.google.com

http://rate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77

减慢 Googlebot 的抓取速度

Google 会通过先进的算法确定最佳的网站抓取速度。我们的目标是，每次访问您的网站时都尽可能多地抓取网页，但不会过多地占用服务器的带宽。在某些情况下，Google 抓取您的网站可能会给您的基础架构带来沉重负载，或在服务中断期间带来不必要的成本。为了避免这种情况，您可以决定减少 Googlebot 发出的请求数量。

☆ 警告：减慢 Googlebot 的抓取速度将会产生广泛的影响，请谨慎考虑。此举的影响包括：Googlebot 发现的新网页数量会减少，现有网页的刷新频率会降低（例如，价格和商品库存状况可能需要更长时间才能体现在 Google 搜索中），被移除的网页保留在索引中的时间可能会更长。

如果您决定减慢 Googlebot 的抓取速度，可以采用以下方法：

通过 Search Console 减慢抓取速度（推荐做法）

让 Google 自动减慢抓取速度

通过 Search Console 减慢抓取速度（推荐做法）

如需快速减慢抓取速度，您可以在 Search Console 中更改 Googlebot 抓取速度。对此设置所做的更改通常会在几天内得以体现。如需使用此设置，请先验证您的网站所有权。设置抓取速度时，请务必避免将速度值设得过低，导致无法满足您网站的需求。详细了解抓取预算对 Googlebot 而言有何意义

让 Google 自动减慢抓取速度

如果您急需让抓取速度在短时间（如几个小时或 1-2 天）内减慢，应该返回包含 500、503 或 429 HTTP 结果代码（而非所有内容）的信息性错误页面。在遇到大量包含 500、503 或 429 HTTP 结果代码的网址时（例如，如果您停用了您的网站），Googlebot 会减慢对您网站的抓取速度。这项更改会在 Googlebot 抓取返回这些错误的网址以及整个网站时体现出来。这些错误的数量减少后，抓取速度会自动重新开始提升。

☆ 警告：我们不建议您长时间（即超过 1-2 天）这么做。因为如果 Googlebot 一连数天在同一网址上发现上述状态代码，可能会将该网址从 Google 索引中移除。

发布于 2022-03-27 14:54

搜索引擎优化（SEO）

1. 抓取

2. 编入索引

3. 呈现（和排名）

二、SEO新手指南

1. 您是否需要做SEO

2. SEO术语大全

3. 如何查询网站被Google 索引？

4. 如何快速让Google 收录？

5. sitemap及robots.txt 的作用

6. 如何创建Google易于理解的内容

7. 如何优化结构化数据标记

8. 如何优化网站的层级结构

9. 如何优化网站的内容

10. 如何优化SEO图片方法

11. 如何优化seo移动端网站页面

12. 如何推广你的网站

13. 如何分析网站

14. 其他资源

三、SEO高阶优化指南

1. sitemap的创建与管理

2. robots.txt创建与管理

3. Google 是如何理解网页的？

4.如何使用抓取工具