robots.txt を1行間違えたらサイトが検索結果から消えた｜CreaTools

結論：robots.txt は「何を禁止するか」だけ書く

robots.txt でやることは1つ。クローラーに「ここは見に来ないで」と伝えるだけ。

逆に「ここを見て」とは書けない。Allow は「Disallow の例外」であって、「インデックスしてくれ」という意味ではない。

ステージング環境を本番にコピーしたとき、robots.txt もそのままコピーした。

User-agent: *
Disallow: /

ステージングでは正しい設定。本番では致命的。サイト全体がクロール拒否になった。

3日後、「サイト名で検索しても出てこない」と連絡が来て気づいた。修正してからインデックスが戻るまで2週間かかった。

たった1行、/ を書いただけで2週間の損失。

User-agent: *
Disallow: /admin/
Disallow: /tmp/
Allow: /admin/public/

Sitemap: https://example.com/sitemap.xml

書かなければ全ページクロール許可。 何も制限しないなら、空の robots.txt を置くか、ファイル自体を置かないでいい。

ステージングや開発環境のコピーで起きる。デプロイ手順に robots.txt の確認を入れるべき。

# 間違い — /admin-page なども拒否される
Disallow: /admin

# 正しい — /admin/ 配下だけ拒否
Disallow: /admin/

末尾スラッシュの有無でマッチ範囲が変わる。/admin は /admin-page や /administrator にもマッチする。

robots.txt の Disallow は「クロールしないで」であって「インデックスから消して」ではない。

やりたいこと	正しい方法
ページをクロールさせない	robots.txt の Disallow
ページをインデックスから消す	`<meta name="robots" content="noindex">`
両方	noindex だけで十分（クロールされないと noindex も読めない）

Disallow したページがインデックスに残り続けることがある。 確実に消したいなら noindex を使う。

WordPress は /wp-admin/ の robots.txt を自動生成する。自動生成の内容を確認せずに放置するのは危険。

https://あなたのサイト.com/robots.txt

ブラウザでアクセスするだけ。

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Sitemap: https://example.com/sitemap.xml

/wp-admin/admin-ajax.php は Allow にする。テーマやプラグインがフロントエンドから使うため、ブロックすると動作に影響が出る。

/wp-includes/ や /wp-content/uploads/ を Disallow にしない。 画像やCSS・JSのクロールをブロックすると、Google がページを正しくレンダリングできなくなる。

robots.txt を書いたら、Google Search Console で確認する。

確認すべきこと：

書いて終わりではない。確認するまでがセット。

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

User-agent: *
Disallow: /admin/
Disallow: /api/
Disallow: /tmp/

Sitemap: https://example.com/sitemap.xml

User-agent: GPTBot
Disallow: /

User-agent: *
Disallow: /admin/

Sitemap: https://example.com/sitemap.xml

AI クローラーをブロックしたい場合は、User-agent を指定して個別に拒否する。* でまとめて拒否すると Google も巻き込む。