01調査概要

背景と目的

「ChatGPTで推薦される施策は、Geminiでも有効なのか」──GEO(Generative Engine Optimization)に取り組む企業がまず直面する問いである。しかし、各エンジンが引用するソースがどの程度重複しているかを大規模データで測定した日本語の研究は、我々の知る限り存在しない。

本調査では、4大AI検索エンジンが同一クエリに対して引用するドメインの重複率を測定し、「どの層で」「どの程度」共通しているかを構造的に分析した。

データ規模

Table 1 ── 調査データの概要
項目数値
ドメイン引用数(domain_citations)9,891件
観測レコード数(observations)1,793件
調査対象キーワード37件
測定期間22日間(2026年2月27日〜3月29日)
対象エンジンChatGPT / Gemini / Perplexity / Google AI Overviews
注記: 本調査は株式会社LIFEのGEO研究チームが独自に実施したものである。37件の調査対象は美容、HR SaaS、金融、転職、教育など複数業種にわたる日本語クエリである。各エンジンに対して人間の検索体験を再現する形でクエリを投入した。

02ドメイン引用の重複率 ── 約10%

同一クエリを4エンジンに投入し、各エンジンが引用したドメインのJaccard係数(共通要素÷和集合)を算出した。結果は以下の通りである。

4エンジン共通のドメイン: 1,843ドメイン中わずか81個(4.4%)

同一クエリ×同一日で4エンジン全てが引用したドメインの割合は、平均1.2%、中央値0.0%であった。

エンジンペア間の重複率

Table 2 ── エンジンペア間のドメイン引用重複率(同一クエリ×日ごとの平均Jaccard係数)
エンジンペア平均Jaccard中央値
Perplexity × AIO18.9%16.7%
Gemini × Perplexity13.2%11.1%
Gemini × AIO10.8%9.1%
ChatGPT × Perplexity6.9%0.0%
ChatGPT × Gemini6.2%0.0%
ChatGPT × AIO6.0%5.0%
Figure 1 ── ドメイン引用重複率ヒートマップ(同一クエリ×日ごとの平均Jaccard)
ChatGPT
Gemini
Perplexity
AIO
ChatGPT
6.2%
6.9%
6.0%
Gemini
6.2%
13.2%
10.8%
Perplexity
6.9%
13.2%
18.9%
AIO
6.0%
10.8%
18.9%

ChatGPTの構造的孤立

ヒートマップから明瞭に見て取れるのは、ChatGPTが他の3エンジンと著しく異なるソースを参照しているという事実である。ChatGPTと他エンジンの重複率は全て6〜7%台であり、ChatGPT×Geminiの中央値は0.0%──つまり半数以上のクエリで、1つも共通ドメインがない

一方、Perplexity×AIOは18.9%と最も高い。両者はGoogle検索という共通基盤を持つためである。ただし18.9%でも「約8割は異なるドメインを引用している」ことを意味する。

Figure 2 ── エンジン間の構造的関係
AIO 18.9% Perplexity 10.8% ─ 13.2% Gemini
Google検索基盤グループ
← 6〜7% →
ChatGPT
独自ソース

03ブランド推薦の重複率 ── 約14%

ドメイン(引用元のURL)だけでなく、各エンジンが推薦するブランド名の重複率も測定した。998件の回答テキストからブランド名を抽出し、同様にJaccard係数を算出した。

ドメインの重複率が約10%であるのに対し、ブランドの重複率は約14%。

全ペアでブランド重複率がドメイン重複率を上回った(Perplexity×AIOを除く)。平均して+4.6ポイント。

Table 3 ── ドメイン重複率 vs ブランド重複率の比較(同一クエリ×日ごとの平均Jaccard)
エンジンペアドメインブランド
ChatGPT × Gemini6.2%11.9%+5.7pt
ChatGPT × Perplexity6.9%12.1%+5.2pt
ChatGPT × AIO6.0%11.4%+5.4pt
Gemini × Perplexity13.2%16.5%+3.3pt
Gemini × AIO10.8%16.4%+5.6pt
Perplexity × AIO18.9%16.6%-2.3pt

この結果は重要な示唆を含んでいる。異なるドメイン(情報源)を見ていても、結果的に同じブランドを推薦しているケースがある。つまり、AIの推薦は特定のURLに依存しているのではなく、Web上に分散した情報の総体──後述する「パーセプション」──から形成されている可能性が高い。

04推薦文脈の一致率 ── 約37%

分析をさらに一段深め、各エンジンが「なぜそのブランドを推薦したのか」という文脈(推薦理由のタグ)の一致率を測定した。135件の回答テキストから推薦文脈タグ(例: 「コスパ」「初心者向け」「実績豊富」「口コミ高評価」等)を抽出し、エンジンペア間のJaccard係数を算出した。

推薦文脈の一致率は平均37%。ドメイン(10%)やブランド(14%)よりも大幅に高い。

各エンジンの「選び方の軸」には明確な個性がある: ChatGPTは権威軸、Geminiは分類軸、Perplexityはユーザー評価軸、AIOはGoogle検索近似軸。それでも約4割の文脈は共通している。

Table 4 ── エンジンペア間の推薦文脈一致率(平均Jaccard係数)
エンジンペア文脈タグ
Gemini × AIO42.5%
Gemini × Perplexity39.1%
ChatGPT × Gemini37.9%
Perplexity × AIO37.4%
ChatGPT × AIO32.2%
ChatGPT × Perplexity31.5%

文脈レベルでもChatGPTの孤立傾向は見られるが(31〜38%)、ドメインレベル(6〜7%)と比較すると、その差は大幅に縮まっている。つまり、ChatGPTは他エンジンと全く異なる情報源を見ているにもかかわらず、推薦の理由づけにはある程度の共通性がある

業界による文脈一致度の差

文脈がどの程度揃うかは、業界特性に大きく依存する。

Table 5 ── 文脈一致度の業界別パターン
分類4エンジン共通文脈特徴
高一致ネット証券、転職エージェント44〜50%業界TOP3が確立。評価軸が明確
中一致化粧品、ECツール15〜40%一部の軸は共通だが独自視点も多い
低一致ネイルスクール、SNSインフルエンサー0〜9%地域性が強い、正解がない主観的質問

05パーセプション3層構造

以上の分析から、AIエンジン間の「共通性」には3つの層があることが明らかになった。我々はこれを「パーセプション3層構造」と呼ぶ。

Figure 3 ── パーセプション3層構造
37%
文脈層 ── なぜ推薦するか
Web全体のパーセプション(認知構造)から形成。エンジン間で最も共通性が高い
14%
ブランド層 ── 何を推薦するか
文脈から選ばれるが、各エンジンの引用癖で結果が異なる
10%
ドメイン層 ── 何を引用するか
各エンジンが独自のインデックスから選択。共通性は最も低い

3層構造が意味すること

この構造には実務上重要な含意がある。

つまり、全エンジンに横断的に効く施策は、文脈層とブランド層に働きかけるもの──すなわち、多様な場所でブランドについて語られている状態を作ること(パーセプション強化)──である。個別ドメインへの掲載は「そのドメインを引用するエンジン」にしか効かない。

06海外研究との比較

本調査の結果を、海外で公開されている類似研究と比較する。

Table 6 ── 国内外のエンジン間重複率データ比較
調査元時期言語圏エンジン間重複率測定対象
ConvertMate2024年英語圏11%ドメイン
Profound2025〜2026年英語圏40〜60%が月次で変動引用ソースの月次変動率
SparkToro / Gumshoe.ai2025年11〜12月英語圏リスト完全一致1%未満ブランドリスト
本調査(LIFE)2026年2〜3月日本語約10%(ドメイン)/ 約14%(ブランド)ドメイン+ブランド+文脈

ConvertMateの英語圏データ(ドメイン重複率11%)と本調査の日本語データ(約10%)はほぼ一致した。「エンジン間のドメイン引用重複率は約10%」という傾向は、言語圏を問わず普遍的である可能性が高い。

一方、SparkToroの「ブランドリスト完全一致1%未満」も本調査と整合する。同調査はさらに「上位の常連ブランドは安定して出現する」と指摘しており、これは本調査の「ドメインは違ってもブランドの重複率は高い」という発見と同じ構造を異なる角度から捉えたものと言える。

本調査の独自の貢献は、ブランド重複率(14%)と文脈一致率(37%)の測定である。

海外の既存研究はドメインレベルまたはブランドリストレベルの分析にとどまっている。「なぜ推薦するか」(文脈層)まで踏み込んだ分析は、我々の知る限り本調査が初めてである。

07企業への示唆

全エンジン共通施策 ── パーセプション強化

3層構造の発見から導かれる最も重要な実務的示唆は、「パーセプション強化」が全エンジンに横断的に効く施策であるという点である。

具体的には、以下のような活動が文脈層とブランド層に働きかける。

エンジン別施策 ── ドメイン層の個別対応

パーセプション強化はベースラインとして必須だが、それだけでは不十分なケースもある。特にChatGPTは他3エンジンとドメインの重複率が6〜7%と極めて低く、ChatGPT固有の引用傾向(権威性の高いソース、英語圏のデータ等)への対応が別途必要になる。

エンジン別の引用傾向の詳細は、ChatGPTとGeminiで推薦が違う理由を参照されたい。

業界特性による優先度の判断

08調査方法の詳細

データ収集

各AI検索エンジンに日本語クエリを投入し、回答テキストと引用URLを収集した。各クエリについて複数回測定を行い、信頼度の高いデータセットを構築した。

重複率の測定

Table 7 ── 測定項目一覧
測定項目データソース抽出手法分析対象件数
ドメイン引用引用URLからドメインを抽出URLパース9,891件
ブランド名回答テキストテキスト解析998件
推薦文脈タグ回答テキストテキスト解析135件
再現性について: ブランド名と文脈タグの抽出にはテキスト解析を使用しているため、完全な再現性は保証されない。ただし、抽出結果は全件記録しており、同一入力に対して同一の抽出結果を使用している。ドメイン引用の重複率については、機械的な処理のみで算出しており、再現性は高い。