|
文本文件或文件(通常被错误地称为文件)是任何网页的必备工具。将 文件添加到站点的根文件夹是一个非常简单的过程,拥有此文件实际上是搜索引擎的“质量标志”。 只是一个 ASCII 或纯文本文件,它告诉搜索引擎他们不允许进入网页的哪些位置 - 也称为机器人排除规则。本文档中出现的任何文件或文件夹都不会被搜索引擎蜘蛛抓取和索引。拥有文件,即使是空白文件,也表明您承认搜索引擎可以进入您的网站并可以免费访问它。建议将 robots 文本文件添加到网站。* S9 S" C% W% | n- P3 b4 k
, B3 d4 W! {" q1 N: Q
的主域和所有子域如何创建 文件您必须对您的域具有 root 访问权限。您的虚拟主机可以帮助您确定您是否拥有正确的访问权限。文件最重要的部分是它的创建和 哥斯达黎加 WhatsApp 号码 位置。使用任何文本编辑器创建文件。 最后,您需要确保您的文件是 UTF-8 编码的文本文件。Google 和其他流行的搜索引擎和爬虫可以忽略 UTF-8 范围之外的字符,这会使您的规则无效。 设置你的用户代理 创建文件的下一步是设置用户代理。用户代理是指您要允许或阻止的网络爬虫或搜索引擎多个实。
8 P# n! f) n$ f1 L; t8 D6 d4 R G( m, ~* r
0 F( d; j) D, M0 y6 O0 n) C
3 [' B6 \% q7 N
体可以是用户代理是用户代理的一些示例设置文件规则 分批读取文件。一个组将指定用户代理是谁,并将有一个规则或策略来指示用户代理可以或不能访问哪些文件或目录。 这些是使用的指令: Disallow:该指令指的是与您的根域相关的页面或目录,您不希望命名用户代理爬网。它将以正斜杠 (/) 开头,后跟页面的完整 URL。只有当它引用目录而不是整个页面时,它才会以正斜杠结尾。您可以为每个规则使用一个或多个不允许设置 Allow:该指令指。7 U/ T1 t+ n; T" ?7 Q
: e, D! q* e! m
! I: c% G8 a4 c' g2 v
|
|