SEO 人员可以在哪里找到 Robots.txt 文件

obots.txt 文件通常位于您网站的根目录中。要访问它，您需要 Yoast 之类的插件或对您的服务器的 FTP 访问权限。

以下是如何使用 FTP 查找 robots.txt 文件：

注意：您可能在根目录中找不到 robots.txt 文件。这意味着它不存在。但不用担心，您可以使用文章中提到的协议创建一个 robots.txt 文件并将其上传到根目录。它会完美运行。但是，请确保您上传的是 .txt 文件，而不是 .doc 或 .page 等文本编辑器版本。

如果您不是技术人员，您可垃圾邮件数据以选择安装Yoast SEO 插件。安装后，您可以使用此插件编辑 robots.txt 文件。

robots.txt 文件由指令组成，用于指导搜索引擎机器人如何与网站进行交互。以下是您在典型的 robots.txt 文件中可以找到的一些关键组件：

User-agent元素用于指定规则适用的 Web 爬虫。这是应出现在 robots.txt 文件中的第一个规则集。

如果您想将同一组规则应用于 1000个手机号码所有网络爬虫，则需要使用星号（*）。

例如：用户代理：*

如果您想指定用户代理，请提供其名称。

示例：用户代理：Googlebot

以下是您可以在 robots.txt 文件中使用的用户代理列表，以匹配最常用的搜索引擎：

如果您想了解有关 Google 的用户代理和查询字符串的更多信息，请查看这篇文章。

您可以在 robots.txt 文件中找到第二条指令。它用于告诉搜索引擎爬虫必须排除哪些页面的爬取。

当您使用带有正斜杠 (/) 的 Disallow 指令时，它是针对您选择不扫描任何页面的用户代理的通配符指令。

例如：不允许：/

如果您想要忽略一个或多个特定文件夹，则可以将 disallow 指令与子文件夹或 URL 路径一起使用。

例如：Disallow: /private/

当最初的 Robots 排除协议（也称为Robots 排除标准或 robots.txt 协议）于 1998 年发布时，它并不包含允许指令。

但是，在 Google 和其他搜索引擎开始使用 robots.txt 协议后，“允许”指令指示可以抓取的 URL 和文件夹。

当您使用带有正斜杠 (/) 的 Allow 指令时，它是针对用户代理的指令，可以不受限制地抓取网站上的所有页面。

例如：允许：/

如果您打算仅允许不允许的页面中的特定 URL/子文件夹，则可以在侦探中明确定义该页面。

例子：

这又是一个搜索引擎专用指令，可帮助爬虫识别网站的站点地图 URL。在 robots.txt 文件中添加网站的站点地图将有助于搜索引擎轻松导航到包含网站重要 URL 的站点地图文件。

例如：站点地图：