実装・技術解説 2026.06.13 12 min read

タグページはAIクローラーの目次になっている?PerplexityBotのログで見えた読み方

タグページがAIクローラーの目次として機能する可能性をPerplexityBotの実測ログで解説した記事のサムネイル
OBS-LOG / 2026.06.13
TABLE OF CONTENTS

2026年6月5日の12時01分台、PerplexityBotが少し面白い動きをしていました。

27秒のあいだに10個のURLを連続で取得していたのですが、バラバラに読みに来たようには見えませんでした。タグページを確認して、そこに紐づく記事一覧をたどり、個別記事へ入っていく。広い情報から、少しずつ細かい情報へと絞り込んでいくような動きです。

「AIクローラーがタグページを目次として評価している」と断定することはログだけではできません。が、しかし単なる一覧ページとしてではなく、サイト内の文脈をたどる入口として使っている可能性はあります。AI観測ラボのサーバーログで記録した実測データをもとに、整理します。

この記事でわかること|📖:約6分

  • 6/5に記録した「27秒・10URL」の実測ログで見えたPerplexityBotの動き方
  • タグページ→記事一覧→個別記事という順序で、粒度を上げていくように見える読み方
  • タグページのレスポンスサイズが大きくなりやすい理由と、一覧ページとしての役割
  • タグ設計がAIクローラーの情報収集に影響する可能性と、今日からできる見直し方

6月5日のログで何が起きていたか

まず実際のログを見てください。2026年6月5日12:00:54〜12:01:21にかけて、PerplexityBotが以下の順番でURLを取得していました。

時刻 取得したURL ページの種類
12:00:54 /perplexity/ 個別記事(起点)
12:01:03 / トップページ
12:01:03 /tag/aiクローラー/ タグページ
12:01:04 /tag/ai検索/ タグページ
12:01:10 /claude/ 個別記事
12:01:11 /articles/ 記事一覧
12:01:11 /google-chatgpt-search-difference/ 個別記事
12:01:11 /tag/chatgpt/ タグページ
12:01:11 /category/ai-optimization/ カテゴリページ
12:01:21 /perplexity-crawler-guide/ 個別記事(深掘り)

起点の記事(/perplexity/)にアクセスしてから、最後の深掘り記事(/perplexity-crawler-guide/)に到達するまで27秒。その間、複数のIPアドレスが並行して動いていました。

PerplexityBotが27秒で10URLを取得した順序を示したフロー図。記事、トップページ、タグページ、記事一覧、カテゴリページ、深掘り記事へ進む流れ。
PerplexityBotが27秒間に取得した10URLの順序。個別記事だけでなく、タグページやカテゴリページも含めて取得していた。

注目したいのは、取得されたURLの種類と順番です。記事を1本読んで終わりではなく、トップページ、タグページ、記事一覧、カテゴリページを経由しながら、別の記事へ進んでいます。

無論、このログだけで「PerplexityBotがタグページを目次として評価している」と断定することはできません。少なくともこのタイミングでは、個別記事だけでなく、サイト内の一覧ページや分類ページもまとめて取得していたことがわかります。

タグページには複数記事の手がかりが集まっている

タグページを経由する動きに理由があるとすれば、「1回のアクセスで取得できる手がかりの多さ」が関係している可能性があります。

タグページとは、同じタグがついた記事をまとめて一覧表示するページです。たとえば/tag/gptbot/を開くと、GPTBotに関連する記事のタイトル・抜粋・日付などが一画面に並びます。

今回確認したログの中で、タグページと記事ページのレスポンスサイズ(データの大きさ)を比較すると、以下のようになっていました。

ページの種類 URL例 サイズ
タグページ /tag/gptbot/ 約91,800 bytes
タグページ /tag/perplexitybot/ 約63,200 bytes
記事一覧 /articles/ 約34,300 bytes
記事ページ /meta-externalagent/ 約24,000 bytes
記事ページ /perplexity-crawler-guide/ 約23,500 bytes

タグページ1枚のサイズは、標準的な記事ページの約2.5〜3倍あります。なんでかというと、タグに紐づく複数記事のタイトル・抜粋・日付などがまとめて含まれているためです。

タグページは、個別記事の本文そのものではなく、「このテーマについて、サイト内にどんな記事があるのか」を一覧できるページです。人間に例えると、本を1冊ずつ読む前に目次を開いて、本棚に並んでいる内容を確認する動きに近いかもしれません。

タグページと記事ページのレスポンスサイズ比較。タグページが記事ページより大きなサイズになっている横棒グラフ。
タグページには複数記事のタイトル・抜粋・日付などが集約されるため、記事ページより大きなデータになることがある。

レスポンスサイズが大きいからといって、AIクローラーが必ずタグページを重視しているとは言えません。ですが、タグページには複数記事への手がかりが集約されているため、サイト内の関連トピックをたどる入口になりやすい構造だとは言えます。

3段階のズームイン構造で読んでいた

6/5のログを改めて整理すると、PerplexityBotの動きは3つの段階に分けて見ることができます。

第1段階:広い情報を取る(12:00:54〜12:01:04)

起点となった/perplexity/の記事にアクセスしたあと、トップページと2つのタグページ(/tag/aiクローラー//tag/ai検索/)を取得しています。個別記事だけでなく、サイト全体のテーマや周辺ページを確認しているようにも見えます。

第2段階:文脈を広げる(12:01:10〜12:01:11)

その後、関連する個別記事(/claude//google-chatgpt-search-difference/)、記事一覧(/articles/)、別タグ(/tag/chatgpt/)、カテゴリページ(/category/ai-optimization/)を1秒以内に並行取得しています。起点の記事の周辺にある情報を、まとめて取得しているような動きです。

第3段階:特定記事を深掘りする(12:01:21)

第2段階から10秒後、/perplexity-crawler-guide/という個別記事に到達しています。起点の/perplexity/と同じPerplexity系の深掘り記事です。広い情報で周辺の文脈を確認したあと、より具体的な記事へ進んでいるように見えます。

PerplexityBotの3段階ズームイン構造の図解。第1段階が全体把握、第2段階が文脈収集、第3段階が深掘りという流れ。
広い情報から周辺情報へ、さらに深掘り記事へ進んでいるように見える3段階の取得順序。

上記挙動が毎回同じパターンで起きるとは限りません。今回のログでは、記事を1本読んで終わりではなく、タグページやカテゴリページを経由してから別の記事へ進む順序が記録されていました。

PerplexityBotの巡回パターンの詳細についてはPerplexityBotとはで解説しています。タグページをnoindexにした場合の影響についてはタグをnoindexにしたらGPTBotが止まったも参考にしてください。

タグ設計がAIの情報収集に影響する可能性

ここからは観測データをサイト設計に落とし込む話です。断定はできませんが、今回のログから見えたことをもとに考えてみます。

タグがぼんやりしていると、AIにも伝わりにくい

今回PerplexityBotが取得したタグは「aiクローラー」「ai検索」「chatgpt」でした。どれもAI観測ラボのテーマを直接表す言葉です。

逆に、タグが「その他」「未分類」「メモ」のような曖昧な言葉で運用されているサイトを想像してください。タグページを取得しても、サイトの専門テーマや記事同士のつながりを読み取りにくくなります。

タグページが目次のように機能するかどうかは、タグの言葉そのものの質に左右される可能性があります。

記事が少なすぎるタグは、目次として弱くなる

タグページのサイズが大きくなりやすい理由は、複数記事の情報が集約されているからです。タグに紐づく記事が1〜2本しかない場合、一覧ページとして取得できる手がかりは少なくなります。

複数の記事をまとめて把握できるという特性が薄れるため、目次のような役割も弱くなります。タグはむやみに増やすのではなく、3〜5本以上の記事が集まるテーマを優先して整理する方が、サイト構造として伝わりやすくなります。

タグ設計の良い例と悪い例の比較図。左側が明確なタグ名で記事が集約されているケース、右側が曖昧なタグ名で記事が分散しているケース。
タグの言葉が明確で、関連する記事がまとまっているほど、サイト内の文脈を伝えやすくなる可能性がある。

noindexにすると、目次として見えにくくなる可能性がある

WordPressでYoast SEOを使ってタグページをnoindexに設定している場合、検索エンジンには「このページをインデックスしないでください」という指示を出すことになります。

noindexはクロールそのものを完全に止める指示ではありません。ですが、タグページが検索結果やAI検索の参照対象として扱われにくくなる可能性はあります。AI観測ラボでも過去にタグをnoindexにしたところ、GPTBotの巡回が止まった記録がありました。

SEOの観点では、薄いタグページをnoindexにする運用はよくあります。対して、AIクローラーへの影響を考えると、記事数が十分にあり、テーマが明確なタグページはindex対象として残しておく方が、サイト内の文脈を伝えやすくなる可能性があります。

タグのnoindex設定とAIクローラーへの影響についてはタグをnoindexにしたらGPTBotが止まったで詳しく解説しています。

まとめ

今回のログで見えたことを整理します。

  • PerplexityBotが27秒間で10URLを連続取得した動きを記録した
  • 記事→トップページ→タグページ→個別記事→カテゴリページ→深掘り記事という順序で、広い情報から細かい情報へ進んでいるように見えた
  • タグページのレスポンスサイズは標準的な記事ページの約2.5〜3倍あり、1回のアクセスで複数記事の手がかりをまとめて取得できる
  • タグページが「サイト内の関連トピックをたどる入口」として機能している可能性がある

今回のログは、PerplexityBotのすべての動きを説明するものではありません。27秒間に10URLを連続取得し、タグページやカテゴリページを経由して深掘り記事へ進んだ順序は、偶然の羅列として片づけるには少し興味深い動きでした。

少なくとも今回の観測では、タグページは単なる一覧ページではなく、サイト内の関連トピックをたどる入口として取得されていました。タグの言葉が明確で、関連する記事がまとまっているほど、AIクローラーにとってもサイトの文脈を追いやすい構造になるはずです。

お伝えしたい点としてタグは「とりあえずつけるもの」ではなく、「サイトの専門テーマを伝える言葉」として設計する価値があります。タグページのnoindex設定とAIクローラーの関係についてはタグをnoindexにしたらGPTBotが止まった、PerplexityBotの全体的な巡回パターンについてはPerplexityBotとはも参考にしてください。

Free Diagnostic Tool

あなたのサイトは、
AIに見えていますか?

URLを入力するだけで30秒。8項目を自動診断し、優先度別の改善プランを提示します。完全無料・登録不要。