AI実験室 2026.06.19 16 min read

ChatGPTのクローラー「GPTBot/1.4」は何が変わった?実測ログで見えた4つの行動

ChatGPTのクローラーGPTBot/1.4の行動変化を実測ログで解説するAI観測ラボのサムネイル画像
OBS-LOG / 2026.06.19
TABLE OF CONTENTS

2026年6月、AI観測ラボのサーバーログにGPTBot/1.4のアクセスを確認しました。4月に観測していたGPTBot/1.2と比べると、llms.txtへのアクセス・sitemapの定期確認・自己紹介系ページの読取など、サイト全体を把握しようとするような動きが見えてきました。

なお、GPTBotによる/llms.txt取得については、すでに別記事で詳しく整理しています。本記事では、llms.txt単体ではなく、GPTBot/1.4として観測された巡回全体の変化に注目します。

この記事でわかること|📖:約7分

  • GPTBot/1.4がいつ頃から観測されているのか、外部情報と実測ログで確認できること
  • 4月のGPTBot/1.2と何が違うのか、比較の基準線
  • 実測ログで見えた4つの行動パターン(sitemap・llms.txt・自己紹介系・noindex通過)
  • サイト運営者が整えておきたいポイント

GPTBot/1.4はいつ頃から観測されているのか

GPTBot/1.2から1.4へのバージョン推移タイムライン図解
外部観測情報では2026年5月22日頃からGPTBot/1.4が確認されている。AI観測ラボでの初確認は6月11日。

OpenAIからGPTBot/1.4に関する公式アナウンスは、2026年6月時点で確認できていません。ですが、外部のUser-Agentデータベース「Udger」では、2026年5月23日 08:22:04にGPTBot/1.4の初回観測が記録されています。

また、同じUdger上では、OAI-SearchBot/1.4も2026年5月22日に初回観測されています。GPTBotとOAI-SearchBotは用途の異なるクローラーですが、OpenAI系クローラーのバージョン更新が同時期に進んでいた可能性があります。

これらはOpenAI公式の発表ではなく、あくまで外部観測情報です。なので本記事では、「2026年5月下旬ごろからGPTBot/1.4が観測され始めた」と表現します。

AI観測ラボのサーバーログでは、2026年6月11日にGPTBot/1.4のアクセスを初確認しました。ログの保持期間の関係で6月11日が初確認になっていますが、外部観測情報と照らすと、実際には5月下旬から巡回していた可能性があります。

なお、OpenAI公式ドキュメント上のGPTBotのフルUA表記は、2026年6月時点でまだGPTBot/1.3のままです。つまり、公式ドキュメント上の表記と、外部データベースや実際のサーバーログで確認されるUser-Agentには差があります。

4月のGPTBot/1.2では何が見えていたか

比較の基準線として、4月時点で観測していたGPTBot/1.2の行動を簡単に振り返ります。詳細はGPTBotの行動パターン記事にまとめています。

4月のログで確認できた主な動きは、次のとおりです。

  • llms.txtへのアクセスは7日間で確認できなかった
  • サイトマップは確認していたが、毎日のように更新確認するパターンは見えなかった
  • 記事本文への到達は全アクセスの約21%にとどまっていた
  • タグページやナビゲーションを繰り返し確認する動きが中心だった

一言でまとめると、記事本文を深く読むというより、タグページやナビゲーションなど、サイト構造の周辺情報を広く確認しているように見える動きでした。

GPTBot/1.4として観測されるようになった時期以降、この動きにいくつかの変化が見えてきます。

GPTBot/1.4で確認できた4つの行動

① sitemap_index.xmlを毎日確認していた

6月11日から17日のログを確認すると、GPTBot/1.4は7日連続で/sitemap_index.xmlにアクセスしていました。単発の確認ではなく、ほぼ決まった時間帯に繰り返しアクセスしているパターンです。

以下はいずれも、User-AgentにGPTBot/1.4を含むアクセスです。

74.7.241.21 [11/Jun/2026:09:05:35] GET /sitemap_index.xml → 200
74.7.241.21 [12/Jun/2026:09:07:55] GET /sitemap_index.xml → 200
74.7.241.21 [13/Jun/2026:09:09:36] GET /sitemap_index.xml → 200
74.7.241.21 [14/Jun/2026:09:10:48] GET /sitemap_index.xml → 200
74.7.241.21 [15/Jun/2026:09:11:47] GET /sitemap_index.xml → 200
74.7.241.21 [16/Jun/2026:09:12:05] GET /sitemap_index.xml → 200
74.7.241.21 [17/Jun/2026:09:14:10] GET /sitemap_index.xml → 200

毎朝9時台にサイトマップを確認し、その後に投稿・タグ・カテゴリページへ巡回している日もありました。サイトの更新状況を定期的に確認しているように見える動きです。

GPTBot/1.4が毎日sitemap_index.xmlを確認している実測ログのタイムライン図解
6月11日から17日まで、GPTBot/1.4は毎朝9時台にsitemap_index.xmlへアクセスしていた。

これまで動きから考えると、サイトマップは人間向けのSEOだけでなく、AIクローラーにサイト構造や更新状況を伝える入口にもなっている可能性があります。

WordPressでYoast SEOなどのSEOプラグインを使っている場合は、/sitemap_index.xmlが正常に200で返っているか、不要なリダイレクトやエラーが出ていないかを確認しておくと安心です。

② llms.txtへのアクセスも確認できた

GPTBot/1.4がllms.txtを取得したあと記事ページへ移動するフロー図解
GPTBot/1.4はllms.txtを取得したあと、そのまま記事ページへの巡回を続けていた。

4月に観測していたGPTBot/1.2では、7日間のログで/llms.txtへのアクセスは確認できませんでした。一方、6月に観測したGPTBot/1.4では、/llms.txtへのアクセスがログに残っていました。

74.7.241.21 [14/Jun/2026:19:02:50] GET /llms.txt → 200
74.7.241.21 [14/Jun/2026:19:02:55] GET /ai-crawler-tag-index/ → 200
74.7.241.21 [14/Jun/2026:19:02:59] GET /baiduspider/ → 200
74.7.241.21 [14/Jun/2026:19:03:02] GET /index.md → 200

/llms.txt取得後に、記事ページや/index.mdへ続けてアクセスしている点は注目できます。ですが、llms.txtがGPTBotの巡回にどのような影響を与えているかまでは、このログだけでは断定できません。

GPTBotによる/llms.txt取得や/index.mdへの連続アクセスについては、別記事で詳しく整理しています。

GPTBotがllms.txtを取得していたサーバーログの記録

③ 自己紹介系・入口ページをまとめて読んでいた

6月16日のログには、GPTBot/1.4がトップページから主要なページへ続けてアクセスしたセッションが残っていました。記事ページだけでなく、サイトの説明や入口にあたるページをまとめて読んでいる点が特徴です。

実際のログはこうなっています。以下はいずれも、User-AgentにGPTBot/1.4を含むアクセスです。

74.7.241.21 [16/Jun/2026:19:04:09] GET / → 200
74.7.241.21 [16/Jun/2026:19:04:12] GET /diagnosis-guide/ → 200
74.7.241.21 [16/Jun/2026:19:04:14] GET /shapbot/ → 200
74.7.241.21 [16/Jun/2026:19:04:19] GET /ai-kansoku-lab-tracker/ → 200
74.7.241.21 [16/Jun/2026:19:04:22] GET /start-guide/ → 200
74.7.241.21 [16/Jun/2026:19:04:24] GET /about/ → 200
74.7.241.21 [16/Jun/2026:19:04:27] GET /ai-crawler-zukan/ → 200
74.7.241.21 [16/Jun/2026:19:04:30] GET /articles/ → 200

トップページから、ナビゲーション上の主要リンクを順番にたどっているように見えます。特に注目したいのが、/about//start-guide//ai-crawler-zukan/といったページへのアクセスです。これらは個別記事というより、「このサイトが何をしているのか」「どこから読めばいいのか」を説明するページです。

GPTBot/1.4がトップページから自己紹介系ページを順番に巡回するフロー図解
GPTBot/1.4はトップページから/about/・/start-guide/・/ai-crawler-zukan/など、サイトの立ち位置を説明するページを優先的に読んでいた。

この動きからは、GPTBot/1.4が記事単体だけでなく、サイトの入口ページや説明ページもあわせて確認している可能性が見えます。

aboutページ、はじめての方向けページ、カテゴリの入口ページを整えておくことは、AIクローラーにサイトの全体像を伝えるうえでも意味があるかもしれません。

④ noindexページも内部リンク上の通過点になっていた

今回の観測で一番意外だったのがこの動きです。AI観測ラボには、検索インデックスに登録しないようnoindexを設定しているページがあります。そのページにGPTBot/1.4がアクセスしていました。

GPTBot/1.4がnoindexページを内部リンクの通過点として次のページへ移動するフロー図解
GPTBot/1.4はnoindexページにも到達し、そこから内部リンクをたどって次のページへ移動していた。noindexはクロールを止める指示ではない。

実際のログはこうなっています。

74.7.241.21 [15/Jun/2026:17:47:35] GET /ai-new-site-recognition-experiment/ → 200
 (リファラー:/ai-citation-checklist/)
74.7.241.21 [15/Jun/2026:17:47:38] GET /祖母の鉄鍋と火加減の設計/ → 200
 (リファラー:/ai-new-site-recognition-experiment/)
74.7.241.21 [15/Jun/2026:17:47:41] GET /robots-meta-ai-check/ → 200
 (リファラー:/祖母の鉄鍋と火加減の設計/)

リファラーを見ると流れがわかります。記事ページから内部リンクをたどってnoindexページに到達し、さらにnoindexページに張られた内部リンクを経由して次のページへ移動しています。

ここで整理しておきたいのが、noindexの意味です。

  • noindex:検索エンジンのインデックスに登録しない指示
  • noindex ≠ クロールしない:クロール自体を止める指示ではない
  • クロールを止めたい場合はrobots.txtでのDisallowが必要

「noindexだからAIにも読まれない」は誤解です。noindexページに他のページへの内部リンクが張られていると、クローラーはそこから先へ進んでいきます。noindexページの内部リンク設計も、サイト全体のクロール動線に影響する可能性があります。

サイト運営者は何を整えるべきか

今回の観測から見えてきた対策をまとめます。「GPTBotに読んでもらうために何か特別なことをする」というより、GPTBotが自然にサイト構造を理解し、深く読める状態を整えるという発想が近いと思います。

sitemapを正しく整備する

GPTBot/1.4は、観測期間中に/sitemap_index.xmlを繰り返し確認していました。サイトマップが正しく整備されていないと、AIクローラーが新しい記事や重要なページを見つけにくくなる可能性があります。

WordPressでYoast SEOなどのSEOプラグインを使っている場合は、/sitemap_index.xmlが正常に200で返っているか、不要なリダイレクトやエラーが出ていないかを確認しておくと安心です。

llms.txtを置くなら、サイトの要点を整理して書く

GPTBot/1.4が/llms.txtを読んだあと、記事ページや/index.mdへ続けてアクセスする動きが確認できました。llms.txtはClaudeBotだけでなく、GPTBot/1.4でも参照され始めている可能性があります。

設置する場合は、サイトの概要・主要記事・カテゴリ構成など、サイトの全体像が伝わる内容を書いておくとよいでしょう。

about・start-guide・運営方針ページを整える

GPTBot/1.4は、/about//start-guide//ai-crawler-zukan/といった、サイトの説明や入口にあたるページにもアクセスしていました。

これらのページが薄い内容だと、サイトが何を扱っているのか、誰に向けて書いているのかをAIクローラーに伝えにくくなる可能性があります。記事単体だけでなく、サイト全体の立ち位置を説明するページも整えておきたいところです。

内部リンクを雑にしない

GPTBot/1.4は、トップページやナビゲーション、関連ページから内部リンクをたどって巡回しているように見えました。重要な記事へのリンクがトップページやカテゴリページから張られているか、孤立しているページがないかを確認しておくと、クロール動線の改善につながります。

noindexは「検索に出さない」だけで、「読まれない」とは別に考える

今回のログでは、noindexページもクロールされ、内部リンク上の通過点になっている動きが確認できました。noindexは検索結果に表示させないための指定であり、クローラーのアクセス自体を止めるものではありません。

AIクローラーに読ませたくないページがある場合は、noindexだけでなく、robots.txtでの制御や、必要に応じて認証制限を検討する必要があります。一方で、単に検索結果に出したくないだけのページであれば、noindexの役割を理解したうえで使い分けることが大切です。

AIクローラーごとのログを分けて観測する

今回の記事で見てきたように、クローラーごとに行動パターンは異なります。「AIクローラーが来ている」だけでなく、どのクローラーが、どのページを、どの順番で読んでいるかを分けて観測することで、対策の精度が上がります。

自サイトのAIクローラー訪問を記録したい場合は、AI Kansoku Lab Trackerを使うと、WordPress上で手軽に計測できます。

まとめ

GPTBot/1.4として観測されるようになった時期以降、AI観測ラボの実測ログでは、4月に確認していたGPTBot/1.2とはもっぱら異なる行動がいくつか見えてきました。

行動 GPTBot/1.2(4月) GPTBot/1.4(6月)
llms.txtへのアクセス ❌ 確認できず ✅ あり
sitemapの定期確認 △ 不定期 ✅ 7日連続で確認
自己紹介系・入口ページの読取 △ 限定的 ✅ 主要ページを連続読取
noindexページの通過 - 未確認 ✅ 内部リンク経由で通過

無論、これだけで「バージョンアップによってGPTBotの仕様が変わった」と断定できるものではありません。ただ、今回のログを見る限り、GPTBot/1.4は記事本文だけでなく、sitemap・llms.txt・自己紹介系ページ・内部リンクを使いながら、サイト全体の文脈も確認しているように見えました。

その意味では、記事単体の最適化だけでなく、サイトマップ、llms.txt、aboutページ、はじめての方向けページ、内部リンク構造を整えることが、GPTBot/1.4への対応として意味を持つ可能性があります。

GPTBot/1.2時代の行動パターンはGPTBotの行動パターン記事にまとめています。あわせて読むと、今回の変化がよりわかりやすいと思います。

AI観測ラボでは、引き続きGPTBotやClaudeBot、PerplexityBotなどのAIクローラーの動きを観測していきます。新しい変化が見えたら、この記事にも追記していきます。

Free Diagnostic Tool

あなたのサイトは、
AIに見えていますか?

URLを入力するだけで30秒。8項目を自動診断し、優先度別の改善プランを提示します。完全無料・登録不要。