実装・技術解説 2026.04.25 16 min read

ClaudeBotはどう動いてサイトを読むのか—ログで見えた5つの行動パターンと対策

ClaudeBotの5つの行動パターンと対策を解説する記事のサムネイル
OBS-LOG / 2026.04.25
TABLE OF CONTENTS

「ClaudeBotがサイトに来ているのはわかった。でも、実際に何をしているのか」——そう思ったサイト運営者は多いはずです。

robots.txtを読む、サイトマップを確認する、記事を取得する。クローラーの基本的な動きはそう説明されます。でも実際のログを追うと、もっと複雑で、もっと興味深い動きが見えてきました。

サイトマップのURLを404に踏み続けながら毎日来る。llms.txtを読んだ直後に記事クロールへ進む。タグページを何度も繰り返し巡回する。AI観測ラボのサーバーログに残ったClaudeBotの足跡を、時系列で丁寧に追いました。

ClaudeBotに読んでもらいたい、引用してもらいたいと考えているサイト運営者に向けて、実測データをもとに5つの行動パターンと具体的な対策(2026.4月時点)の情報をまとめます。

この記事でわかること|📖:約8分

  • ClaudeBotが毎日サイトに来てやっている5つの行動パターン
  • sitemap.xmlを404に踏み続けるループ問題の原因と対策
  • llms.txtを置くとClaudeBotの行動がどう変わるか
  • ClaudeBotに記事を読んでもらうためにサイト運営者がやるべき3つのこと

ClaudeBotとは—AnthropicがClaudeのために動かすクローラー

ClaudeBotは、AI企業Anthropicが運営するウェブクローラーです。AnthropicはClaude(クロード)というAIを開発している会社で、ClaudeBotはClaudeの学習データを集めるためにウェブ上のページを巡回します。

User-Agent(クローラーの名札)は以下の文字列で識別できます。

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)

IPアドレスは216.73.216.0/24帯からのアクセスが確認されており、Anthropicが公式に保有するIP範囲です。サーバーログでClaudeBotを見つけたい場合は、このUser-AgentかこのIP帯で絞り込むと確実です。

ClaudeBotとよく似た名前のクローラーとして、Claude-SearchBotClaude-Userがあります。役割が異なるため、混同しないよう注意が必要です。違いはClaude-SearchBotの解説記事でまとめています。

行動パターン①:robots.txtとsitemap_index.xmlを毎日セットで確認する

ログを見て最初に気づいたのは、ClaudeBotが毎日必ずrobots.txtとsitemap_index.xmlをセットで取得していることです。しかも1日に複数回、同じ動作を繰り返していました。

実際のログはこうなっています。

216.73.216.164 [17/Apr/2026:14:04:08] GET /robots.txt → 200
216.73.216.164 [17/Apr/2026:14:04:08] GET /sitemap_index.xml → 200

216.73.216.164 [17/Apr/2026:18:27:08] GET /robots.txt → 200
216.73.216.164 [17/Apr/2026:18:27:09] GET /sitemap_index.xml → 200

216.73.216.164 [17/Apr/2026:22:08:34] GET /robots.txt → 200
216.73.216.164 [17/Apr/2026:22:08:35] GET /sitemap_index.xml → 200

robots.txtとsitemap_index.xmlへのアクセスは、ほぼ同じ秒に記録されています。ClaudeBotは「まずルールを確認してから地図を見る」という手順を、毎回欠かさず踏んでいます。

サイト運営者にとって重要なのは、ClaudeBotはサイトを継続的に監視しているという点です。1回来て終わりではなく、毎日複数回robots.txtの内容を確認しています。robots.txtでClaudeBotの動きを制御したい場合、設定を変えれば比較的早く反映される可能性があります。

ClaudeBotがrobots.txtとsitemap_index.xmlを1日複数回セットで巡回するパターンの図解
ClaudeBotはアクセスのたびにrobots.txt → sitemap_index.xmlをワンセットで確認する

逆に言えば、ClaudeBotに来てほしいサイトはrobots.txtでClaudeBotをブロックしていないか確認しておく必要があります。設定の書き方はrobots.txtでAIクローラーを制御する記事にまとめています。

行動パターン②:存在しないsitemap.xmlを何度も探してループする

7日間のログで最も気になった動きがこれです。ClaudeBotはsitemap_index.xmlを正常に取得しているにもかかわらず、存在しないsitemap.xmlを繰り返し探しに来て、9回連続で404を受け取っていました

実際のログはこうなっています。

216.73.216.220 [15/Apr/2026:12:35:10] GET /sitemap.xml → 404
216.73.216.220 [15/Apr/2026:12:52:36] GET /sitemap_index.xml → 200
216.73.216.220 [15/Apr/2026:14:44:28] GET /sitemap.xml → 404
216.73.216.220 [15/Apr/2026:18:01:25] GET /sitemap.xml → 404
216.73.216.220 [16/Apr/2026:12:48:31] GET /sitemap.xml → 404
    ・・・(計9回)

パターンは毎回同じです。sitemap_index.xmlを取得して200を受け取る、次にsitemap.xmlを探しに行って404を受け取る、またsitemap_index.xmlに戻る——このループが数日続きました

ClaudeBotがsitemap.xmlを404に踏み続けてsitemap_index.xmlに戻るループの図解
sitemap_index.xmlは取得できているのに、存在しないsitemap.xmlを9回繰り返し探しに来ていた

なぜこうなるのかというと、WordPressにYoast SEOを入れている場合、サイトマップのURLは/sitemap_index.xmlが正しい形式です。ところがClaudeBotはその中身を読んで、慣例的なURL/sitemap.xmlも存在するはずだと判断して探しに行っている可能性があります。

404を受け取ってもClaudeBotは記事クロールをやめるわけではありません。ログを見ると、404を踏みながらも並行して記事を取得しています。ただ、サイトマップを正しく読めていない状態では、新しい記事を効率よく発見できない可能性があります。

対策:sitemap.xmlへのリダイレクトを設定する

WordPressの場合、/sitemap.xmlへのアクセスを/sitemap_index.xmlに301リダイレクトする設定を.htaccessに追加すると、ClaudeBotが404を踏まなくなります。

RewriteRule ^sitemap\.xml$ /sitemap_index.xml [R=301,L]

設定後はサーバーログで/sitemap.xmlへのアクセスが301になっているか確認してください。

行動パターン③:llms.txtを読んだ直後に記事クロールへ進む

7日間のログの中で、ClaudeBotが記事を連続して取得したのは1回だけでした。そのタイミングを確認すると、直前にllms.txtを取得していたことがわかりました。

実際のログはこうなっています。

216.73.216.164 [17/Apr/2026:18:27:09] GET /sitemap_index.xml → 200
216.73.216.164 [17/Apr/2026:18:33:20] GET /llms.txt → 200
216.73.216.164 [17/Apr/2026:18:33:21] GET /why-competitor-cited-by-ai/ → 200
216.73.216.164 [17/Apr/2026:18:35:47] GET /ai-kansoku-tool/ → 200
216.73.216.164 [17/Apr/2026:18:36:55] GET /index.md → 200
216.73.216.164 [17/Apr/2026:18:38:38] GET /ai-crawler-japan-chatgpt-user/ → 200
216.73.216.164 [17/Apr/2026:18:39:06] GET /ai-citation-boundary/ → 200

llms.txtを取得してから約1分以内に、記事を5本連続で取得しています。それまでsitemap_index.xmlを何度も確認するだけだったClaudeBotが、llms.txtを読んだ瞬間に動き出した形です。

ClaudeBotがllms.txtを読んだ直後に記事クロールへ進んだログの図解
llms.txtを取得してから約1分以内に記事を5本連続で取得した

llms.txtはサイトの内容をAIに向けて説明するファイルです。どんな記事があるか、サイトの目的は何かを簡潔にまとめて置いておくことで、ClaudeBotがクロールすべきページを判断しやすくなる可能性があります。

因果関係を断言することはログだけでは難しいですが、llms.txtを読んだ直後に記事クロールが始まったという事実は、サイト運営者として無視できないデータです。llms.txtをまだ設置していないサイトは、設置を検討する価値があります。設置方法はllms.txtの書き方・設置手順の記事でまとめています。

行動パターン④:タグページを何度も繰り返し巡回する

記事クロールと並行して目立ったのが、タグページへの大量アクセスです。しかも同じタグページを1セッション中に複数回訪問するという、他のAIクローラーでは見られない動きをしていました。

実際のログはこうなっています。

216.73.216.164 [17/Apr/2026:19:55:05] GET /tag/国別/ → 200
216.73.216.164 [17/Apr/2026:20:01:41] GET /tag/診断ツール/ → 200
216.73.216.164 [17/Apr/2026:20:01:49] GET /tag/競合サイト/ → 200
216.73.216.164 [17/Apr/2026:21:10:31] GET /tag/国別/ → 200
216.73.216.164 [17/Apr/2026:22:40:08] GET /tag/国別/ → 200
216.73.216.164 [17/Apr/2026:22:42:47] GET /tag/競合サイト/ → 200
216.73.216.164 [17/Apr/2026:22:55:00] GET /tag/AI可視性スコア/ → 200
216.73.216.164 [17/Apr/2026:22:58:07] GET /tag/AI検索トレンド/ → 200

「国別」「競合サイト」「診断ツール」といったタグページに、同じセッション中に3〜4回アクセスしています。タグページには複数の記事がリスト表示されるため、ClaudeBotはタグページを「関連記事をまとめて発見する入口」として使っている可能性があります。

サイト運営者への示唆としては、タグの設計がClaudeBotのクロール範囲に影響するということです。関連性の高い記事を同じタグでまとめておくと、ClaudeBotが芋づる式に関連記事を発見しやすくなります。逆にタグが散漫だと、ClaudeBotが同じタグページを何度も巡回しても新しい記事に到達できない状態になります。

行動パターン⑤:index.mdを取得していた—Markdownファイルも読む

今回のログで最も予想外だったのがこれです。ClaudeBotがllms.txtの直後に/index.mdを取得していました。

216.73.216.164 [17/Apr/2026:18:33:20] GET /llms.txt → 200
216.73.216.164 [17/Apr/2026:18:33:21] GET /why-competitor-cited-by-ai/ → 200
216.73.216.164 [17/Apr/2026:18:35:47] GET /ai-kansoku-tool/ → 200
216.73.216.164 [17/Apr/2026:18:36:55] GET /index.md → 200
216.73.216.164 [17/Apr/2026:18:38:38] GET /ai-crawler-japan-chatgpt-user/ → 200

index.mdはサーバーのルートディレクトリに設置したMarkdownファイルです。設置日は4月5日で、ClaudeBotが取得したのは4月17日——設置から12日後のことでした。

同じ期間にindex.mdを取得したクローラーは3社でした。

日付 クローラー ステータス
4月14日 Amazonbot 200 ✅
4月16日 meta-externalagent 200 ✅
4月17日 ClaudeBot 200 ✅

GPTBotとPerplexityBotはこの期間中に取得していません。ただしサーバーログの保持期間は7日間のため、それ以前に来ていた可能性は否定できません。引き続き計測を続けます。

ClaudeBotはHTMLだけでなく、Markdownファイルも取得することが今回のログで確認できました。llms.txtの中にindex.mdへの参照が含まれていたため、llms.txtを読んだことがきっかけでindex.mdに到達した可能性が高いです。サーバーへのMarkdownファイルの設置方法はAIはHTMLよりMarkdownを好むの記事でまとめています。

ClaudeBotに読んでもらうためにやるべき3つのこと

7日間のログから見えたClaudeBotの行動パターンをもとに、サイト運営者がすぐに実践できる対策を3つにまとめます。

① robots.txtでClaudeBotをブロックしていないか確認する

ClaudeBotは毎日複数回robots.txtを確認しています。ブロック設定が入っていると、それ以上クロールが進みません。robots.txtに以下の記述がないか確認してください。

# これがあるとClaudeBotをブロックしてしまう
User-agent: ClaudeBot
Disallow: /

ClaudeBotを許可する場合は上記の記述を削除するか、最初から書かないことが対策になります。robots.txtの設定方法はrobots.txtでAIクローラーを制御する記事で詳しくまとめています。

② llms.txtを設置する

今回のログでもっとも明確だったのが、llms.txtを読んだ直後に記事クロールが始まったという事実です。llms.txtはサイトの内容をAIに向けて説明するファイルで、サーバーのルートに置くだけで設置できます。ClaudeBotにどんな記事があるかを伝える道標として機能する可能性があります。設置方法はllms.txtの書き方・設置手順の記事でまとめています。

③ sitemap.xmlへのリダイレクトを設定する

WordPressにYoast SEOを使っている場合、正しいサイトマップURLは/sitemap_index.xmlです。ClaudeBotは慣例的な/sitemap.xmlも探しに来るため、404が続く状態になります。.htaccessに以下を追加すると、ClaudeBotが正しいサイトマップに到達できます。

RewriteRule ^sitemap\.xml$ /sitemap_index.xml [R=301,L]

まとめ

ClaudeBotは毎日サイトに来ています。ただ来ているだけでなく、robots.txtでルールを確認し、サイトマップで記事を探し、llms.txtをきっかけに記事クロールへ進む——という一連の行動パターンがログから見えました。

ClaudeBotに引用してもらうための第一歩は、ClaudeBotがサイトに入りやすい環境を整えることです。robots.txtの確認、llms.txtの設置、sitemap.xmlのリダイレクト設定——この3つをまず試してみてください。

ClaudeBotに引用されるサイトの作り方についてはClaudeに引用されるサイトの作り方の記事もあわせて読んでみてください。

Free Diagnostic Tool

あなたのサイトは、
AIに見えていますか?

URLを入力するだけで30秒。8項目を自動診断し、優先度別の改善プランを提示します。完全無料・登録不要。