AIクローラーは構造化データを見ている?実測ログから考えるJSON-LDの役割
「構造化データを入れればAIに引用されやすくなる」——AI観測ラボの答えは半分あってて半分間違いです。
AIクローラーは本当に構造化データを「見ている」のでしょうか。サーバーログで確認できる事実は、思っているより限られています。
AI観測ラボでは、2026年6月にApplebotとChatGPT-Userが/structured-data-guide/にアクセスしたログを確認しました。取得されたHTMLにはJSON-LDが含まれていました。ただ、JSON-LDをどう評価したかまでは、ログからは判断できません。
今回の記事では、実測ログで確認できた事実と確認できなかった事実を正直に整理したうえで、それでもJSON-LDを整えておくべき理由を説明します。
この記事でわかること|📖:約7分
- 構造化データとJSON-LDがページ情報を伝える仕組み
- AIクローラーが構造化データを含むページを取得した実測ログ
- サーバーログで分かること・分からないことの正直な切り分け
- AI時代に最低限整えておきたい構造化データの種類と実装方法
構造化データとJSON-LDとは?

構造化データとは、ウェブページの内容を機械が読みやすい形式で記述したデータを指します。人間が見る本文とは別に、「このページは記事です」「著者はこの人です」「公開日はこの日付です」といった意味情報を付け加えます。
たとえるなら、レストランのページに「営業時間:11時〜22時」と書いてあっても、機械はその文字が営業時間を意味しているとは自動では判断できません。構造化データを使うと、「この数字は営業時間です」と明示的に伝えられるようになります。
JSON-LDは、構造化データを書くための形式のひとつです。HTMLの<head>内などに<script type="application/ld+json">というタグで記述します。GoogleもJSON-LD形式を推奨しており、WordPressではYoast SEOなどのSEOプラグインを使うことで、記事・ページ・パンくずリスト・サイト情報などの基本的な構造化データを自動で出力できます。
構造化データとJSON-LDの関係を一言でまとめると、構造化データが「何を伝えるか」で、JSON-LDが「どう書くか」です。この記事では以降、JSON-LD形式で書かれた構造化データを前提に話を進めます。
サーバーログで確認できたこと
AI観測ラボのサーバーログで、/structured-data-guide/へのAIクローラーのアクセスを確認しました。確認できた事実を順番に整理します。
ApplebotがHTMLを取得していた
2026年6月4日12時21分、ApplebotがこのページのHTMLを取得しました。
17.246.15.35 - - [04/Jun/2026:12:21:27 +0900] "GET /structured-data-guide/ HTTP/1.1" 200 21833 "-" "Mozilla/5.0 ... (Applebot/0.1)"
ステータスコード200は、ページが正常に返されたことを意味します。ApplebotはAppleが運営するクローラーで、Appleの検索・AI関連機能に使われる可能性があるクローラーです。
ApplebotはCSSファイルも取得していた
HTML取得の約2分後、ApplebotはページのCSSファイルも取得していました。
17.246.15.195 - - [04/Jun/2026:12:23:37 +0900] "GET /wp-content/themes/generatepress-child/css/single.css HTTP/1.1" 200 3084 "https://www.blog.ai-kansoku.com/structured-data-guide/" "-"
Refererに/structured-data-guide/が含まれており、このページを参照元としてCSSを取得しています。HTMLだけでなく関連ファイルまで回収する動きは、Applebotのレンダリング型クローラーとしての特徴と一致しています。
ChatGPT-Userが2回取得していた
同じページに、ChatGPT-Userが6月4日と6月7日の2回アクセスしていました。
20.194.157.186 - - [04/Jun/2026:12:27:12 +0900] "GET /structured-data-guide/ HTTP/1.1" 200 19655 "-" "ChatGPT-User/1.0"
172.204.27.20 - - [07/Jun/2026:17:08:21 +0900] "GET /structured-data-guide/ HTTP/1.1" 200 19753 "-" "ChatGPT-User/1.0"
ChatGPT-Userは、ユーザーがChatGPT上でURLを扱った場合などにページを取得するリアルタイム取得系のクローラーです。学習用のGPTBotとは役割が異なります。構造化データに関する記事が、ChatGPT経由で実際に取得されていたことは確認できます。
取得されたHTMLにはJSON-LDが含まれていた
AIクローラーが取得したHTMLの中には、実際にJSON-LDが含まれていました。Yoast SEOが自動出力するスキーマ(Article・WebPage・BreadcrumbList・WebSite・Person)に加え、ページ下部にはFAQPageのJSON-LDも入っています。

つまりは、AI関連クローラーがJSON-LDを含むHTMLを取得したことは、サーバーログとHTMLの確認結果から言えます。
それでもJSON-LDを整えておきたい理由
ログで評価まで確認できないなら、JSON-LDは意味がないのでしょうか。そうではありません。
構造化データの本来の役割は、「AIに引用させる裏技」ではなく、ページの意味を機械が読み取りやすい形で伝える情報設計です。その対象はAIクローラーだけではありません。
- 検索エンジン——GoogleはJSON-LDを利用して、ページの内容を理解し、リッチリザルトの表示に活用します。記事の著者・公開日・FAQなどを検索結果で扱いやすくなります
- AIクローラー——HTMLを取得した際に、ページの種類・著者・日付・階層構造などを機械が読み取りやすい形で確認できます
- 外部の解析・参照システム——構造化されたページ情報を参照するツールやシステムに対して、ページの意味を伝えやすくなります

特にAI検索が広がっている今、ページの著者・公開日・記事の種類が機械に伝わりやすい状態を作っておくことは、最低限の情報設計として意味があります。
構造化データは魔法の指示ではありません。でも、整えていないページより整えているページのほうが、機械にとって読み取りやすい状態に近づくとは言えます。
AI時代に最低限入れておきたい構造化データ
構造化データにはさまざまな種類がありますが、ブログ運営者が最低限押さえておきたいのは4つです。
BlogPosting(記事の基本情報)
ブログ記事に使う最も基本的な構造化データです。タイトル・著者・公開日・更新日・説明文を機械に伝えます。Yoast SEOを使っていれば、記事ページの基本情報は自動で出力されます。
特にdatePublishedとdateModifiedは、AIや検索エンジンが情報の鮮度を把握する手がかりになります。更新した記事は、本文だけでなく更新日も正しく反映されているか確認しておきましょう。
BreadcrumbList(サイトの階層構造)
ページがサイト内のどこに位置するかを伝える構造化データです。「ホーム→カテゴリー→記事」という階層を、AIや検索エンジンが把握しやすくなります。Yoast SEOなどSEOツールを使っていれば自動で出力されます。
FAQPage(質問と回答のセット)
記事末尾にFAQを設置している場合に使います。質問と回答のセットを構造化することで、機械が「どの質問に対して、どの回答が対応しているのか」を把握しやすくなります。
各種SEOツールの基本出力だけではFAQPageまで出ないケースがあるため、必要に応じて別途対応します。
Organization/WebSite(運営者情報)
サイト全体の運営者情報を伝える構造化データです。企業名・URL・ロゴ・SNSアカウントなどを明記することで、サイトの素性をAIや検索エンジンに伝えやすくなります。トップページやサイト全体の設定として整えておく項目です。Yoast SEOの設定画面から入力できます。
実装時に気をつけること
構造化データは、入れること自体が目的ではありません。本文の内容と一致した正確な情報を、機械が読み取りやすい形で伝えることが大事です。
本文と一致させる
JSON-LDに書いた内容と本文の内容が食い違っていると、Googleのガイドライン違反になる可能性があります。著者名・公開日・タイトル・FAQの内容は、本文と必ず合わせてください。
嘘を書かない
実際には存在しない著者名や、でたらめな公開日を入れるのは避けましょう。構造化データは「ページの意味を正確に伝えるもの」なので、事実と異なる情報を入れると逆効果になります。
入れすぎない
関係のない構造化データを大量に入れても意味はありません。ページの内容に合ったタイプだけを選んで使いましょう。
実装後は必ず検証する
書いたつもりでも、構文エラーがあると構造化データとして正しく認識されない場合があります。実装後はGoogleのリッチリザルトテストやSchema.orgの検証ツールで確認しておきましょう。
URL:https://search.google.com/test/rich-results
まとめ
今回のサーバーログで確認できたのは、ApplebotとChatGPT-UserがJSON-LDを含むHTMLを取得したという事実までです。JSON-LDを実際にどう評価したかは、ログからは判断できません。
構造化データは、AIへの魔法の指示ではなく、ページの種類・著者・公開日・階層・FAQを機械が読み取りやすい形で整える情報設計です。検索エンジンやAIクローラーにページの意味を伝えやすくするための、基本的な土台だと考えたほうが自然です。
整えていないページより、整えているページのほうが、機械にとって読み取りやすい状態に近づきます。「引用される裏技」として期待するのではなく、ページの基本設計として淡々と整えておく——がAI時代の構造化データとの正しい付き合い方だと思います。
構造化データの実装状況を含むAI可視性を診断したい方は、AI観測ラボの診断ツールもあわせてお試しください。
あなたのサイトは、
AIに見えていますか?
URLを入力するだけで30秒。8項目を自動診断し、優先度別の改善プランを提示します。完全無料・登録不要。