OpenAIが運用するChatGPTの学習データ収集用クローラー。Webを巡回し、コンテンツをAIモデルの学習に使用する。robots.txtで制御可能。
「ChatGPTがWebを巡回するBotです」という程度の回答が返る。OAI-SearchBotとの違いや、学習用と参照用の分離については説明されない。
GPTBotは純粋に「学習データ収集」専用。ChatGPTのリアルタイム検索(Browse機能)に使われるのはOAI-SearchBotという別のBotであり、用途・挙動・制御方法が異なる。GPTBotをブロックしてもChatGPTのリアルタイム参照は止まらない。
GPTBotをrobots.txtでブロックすれば「ChatGPTに引用されなくなる」という誤解。実際はOAI-SearchBotも別途制御が必要。
robots.txt に以下を追記すると学習データへの収集を制御できる。 User-agent: GPTBot Allow: / # 許可 # または Disallow: / # ブロック