AIの引用数はプロンプトで11倍変わる｜LLMO実験データで検証

Contents

問いの設定 —— 「AIが何を見ているか」は調べられるのか
実験 —— 聞き方を変えるだけで引用数はどう変わるか
落とし穴 —— 引用URLの重複率は8〜12%しかない
参照の3層構造 —— 1次・2次・潜在参照という考え方
警鐘 —— この実験結果が意味すること
では、どう調べるべきか

01問いの設定

LLMOやGEO（Generative Engine Optimization）に取り組む上で、最初にぶつかる壁がある。「AIが自社について何を参照しているのか」が見えないという問題だ。

従来のSEOであれば、Google Search Consoleで「どのクエリで何位に表示されているか」を確認できた。しかしAI検索では、そうした公式ツールが存在しない。ChatGPTやGeminiが回答を生成する際、裏側でどのサイトを参照しているのかは基本的にブラックボックスである。

ならば、プロンプトの工夫で引き出せないか。「出典を教えて」「参照したURLを一覧にして」と付け加えれば、AIが内部で参照しているソースをもっと可視化できるのではないか——弊社はこの仮説を検証するため、3つのAIエンジンで比較実験を行った。

結論を先に述べる。プロンプト次第で引用数は2〜11倍に増える。だが、それで見えたドメインを「AIが普段参照しているソース」と見なすのは危険である。

02実験 —— 聞き方を変えるだけで引用数はどう変わるか

実験設計

5業種（HR SaaS、EC施策ツール、ネイルスクール、GEOコンサルタント、インフルエンサー選定）について、以下の2パターンでクエリを投入した。

パターンA（通常質問）: 「おすすめの○○を教えてください」
パターンB（質問の仕方を変更）: 同じ意図の質問を、異なる聞き方で投入

対象エンジンはChatGPT、Gemini、Perplexityの3つ。各クエリについてパターンA・Bの両方で回答を取得し、引用URL数とその内容を比較した。

結果: 引用URL数の変化

Table 1 —— パターンA vs B の引用URL数（5業種平均）

エンジン	パターンA（通常）	パターンB（参照要求付き）	変化倍率
ChatGPT	8.2件	18.4件	2.2倍
Gemini	0.0件	7.8件	0 → 引用発生
Perplexity	2.0件	23.2件	11.6倍

Perplexityでは11.6倍、ChatGPTでは2.2倍。Geminiに至っては、通常質問では引用URLが一切表示されなかったものが、参照要求を加えることで7.8件出現した。

聞き方ひとつで、AIが提示するソース情報の量はこれほど変わる。

回答の文字数も大幅に変化する

引用数だけでなく、回答そのものの情報量も変わった。

Table 2 —— パターンA vs B の回答文字数（5業種平均）

エンジン	パターンA	パターンB	差分
ChatGPT	1,221字	2,129字	+908字
Gemini	1,310字	1,965字	+654字
Perplexity	649字	4,282字	+3,633字

Perplexityの変化が特に顕著で、回答文字数は6.6倍に膨らんだ。参照要求プロンプトが、Perplexityの「詳細回答モード」とでも呼ぶべき挙動をトリガーしている可能性が高い。

03落とし穴 —— 引用URLの重複率は8〜12%しかない

ここまでの結果だけを見ると、「参照要求を付ければAIが参照しているドメインをもっと調べられる」と結論づけたくなる。弊社も当初そう期待していた。

期待していたこと

パターンA（通常質問）でAIが提示する引用URLは、AIが内部で参照しているソースのごく一部にすぎないはずだ。ユーザーに見せるのは推薦先の公式サイトや大手メディアが中心であり、回答を生成するために参照したすべてのソースを表示しているわけではない。

ならば、パターンB（参照要求付き）で引き出したURLは、パターンAの引用を包含する、より大きな円になるはずだ——つまり、ベン図で言えばパターンAがパターンBの中にほぼ100%内包される形を想定していた。

様々なプロンプトを試した

弊社では、参照要求の表現を複数パターンで検証した。「出典を教えてください」「回答内容を変えずに参照元を追加してください」「参照URLを表形式で一覧にしてください」など、回答そのものに影響を与えずに参照情報だけを引き出すことを意図した様々なプロンプト設計を試みた。

しかし、どのような表現を使っても、素のクエリ（パターンA）の引用を高い割合で内包するような結果は得られなかった。

実際に起きたこと

パターンAとパターンBで、引用されるURLがほぼ完全に入れ替わっていた。

Table 3 —— パターンA・B間のURL重複率

エンジン	URL重複率	意味
ChatGPT	12.5%	パターンAの引用URLのうち、パターンBにも登場するものは12.5%のみ
Gemini	—	パターンAの引用が0件のため算出不可
Perplexity	8.0%	ほぼ完全に別のURLセットが引用された

Figure 1 —— 期待と現実：引用ドメインの重複

内包されるどころか、重複はわずか12%。パターンAの引用とパターンBの引用はほぼ別物だった。

パターンBで新たに出現した大量のURLは、パターンAでは引用されていないサイトである。逆に、パターンAで引用されていたURLの大半は、パターンBでは消えている。参照要求プロンプトは「隠れた参照先を可視化する」のではなく、回答の生成方針そのものを変えてしまうのだ。

04参照の3層構造 —— 1次・2次・潜在参照という考え方

この「期待と現実のズレ」から、弊社ではAIが引用するドメインを、ベン図の位置関係に基づいて3つに分類している。

一次参照ドメイン —— A・B両方に出現する引用

パターンA（通常質問）でもパターンB（参照要求付き）でも、どちらでも引用されるドメイン。上記の実験で言えば、重複した12%（Perplexityでは8%）に該当する。

プロンプトの聞き方を変えても一貫して引用されるということは、AIがそのテーマについて回答する際に最も強く結びついているソースと言える。ただし実態としては、推薦先の公式サイトや大手メディアが大半を占める。たとえば「おすすめの車」と聞けばトヨタやホンダの公式サイト、あるいは大手自動車メディアのURLが一次参照になる。つまり一次参照に載っているドメインは、AIに「推薦された結果」として表示されるものであり、ここに自社ドメインが載ることを直接の目標にするのはGEO戦略として適切ではない。

二次参照ドメイン —— パターンAのみに出現する引用

通常質問（パターンA）では引用されるが、参照要求を付けたパターンBでは消えてしまうドメイン。一般ユーザーが実際に目にする回答に含まれているが、プロンプトを変えると出てこない不安定な引用である。

GEOモニタリングにおいては、この層の変動を追跡することが重要になる。ユーザーの自然な質問に対してAIが実際に提示する引用であるため、二次参照ドメインの増減は実際のユーザー体験に直結する。

潜在参照ドメイン —— パターンBのみに出現する引用

通常質問では引用されないが、参照要求プロンプトを付けると出現するドメイン。前述の通り、プロンプトを変えた時点で回答そのものが変わっているため、あくまで参考値である。

しかし、基本的には同じ質問をしているのだから、パターンBで出現したドメインは、パターンAの回答を生成する際にもAIが内部的に参照していた可能性がある。明示的に引用URLとして表示されなかっただけで、AIの「知識」には含まれている——その意味で「潜在的な参照ドメイン」と位置づけている。

重要なのは、この3分類がベン図の位置で決まるという点だ。

一次参照は「最も重要な参照」ではなく「A・Bの共通部分」。二次参照は「二番目に重要」ではなく「Aのみに出現する引用」。潜在参照は「見えない参照」ではなく「Bのみに出現し、Aでも参照されていた可能性がある引用」。それぞれ異なる性質を持ち、GEO施策における扱い方も異なる。

05警鐘 —— この実験結果が意味すること

参照の3層構造を踏まえた上で、GEO施策に取り組む際に注意すべき点を整理する。

1. 参照要求プロンプトで「AIの全参照マップ」は描けない

パターンBで得られる潜在参照ドメインは、あくまで「AIがそのテーマについて知っているかもしれないサイト」の断片にすぎない。回答文字数が1.5〜6.6倍に変わり、引用URLの重複率が8〜12%しかないという事実は、パターンBが「パターンAの詳細版」ではなく本質的に異なる回答であることを示している。潜在参照を過信してGEO施策の全体像を組み立てるのは危険だ。

2. 一次参照に載ること自体はGEOの目標ではない

一次参照ドメインの実態は、推薦先の公式サイトや大手メディアである。ここに載っているのは「AIに推薦された結果のURL」であって、「AIに推薦されるために参照されたURL」ではない。GEOの目標は、AIの推薦リストに自社が載ることであり、一次参照ドメインに自社サイトを入れること自体が目標ではない。

3. 二次参照の定点観測がGEOモニタリングの核になる

一般ユーザーが実際に目にする回答（パターンA）に含まれる引用——すなわち二次参照ドメインの動きを継続的に追跡することが、GEOモニタリングの中心になる。この層の変動を見ることで、「AIがどのソースを根拠に推薦を行っているか」の傾向を掴むことができる。

4. 潜在参照は「AIの知識の広がり」を読み取る補助データ

潜在参照ドメインは、AIがそのテーマについて「どの方面のソースに反応しやすいか」を読み取る補助データとして有用である。自社が潜在参照に出現しているなら、AIの知識には入っているが通常の推薦では表に出ていない——つまり改善の余地があるという示唆になる。ただし、それが通常の回答でも参照されていたかは確証がない。

3つの参照レベルを混同すると、GEO分析の前提が崩れる。

「参照要求プロンプトで20件のURLを取得し、自社が含まれていなかったからAIに無視されている」——この推論は危うい。その20件は潜在参照であり、通常のユーザーが見る引用（二次参照）とも、安定して出現する引用（一次参照）とも別物だからだ。

06では、どう調べるべきか

プロンプト追加による参照調査が万能でないとすれば、AIの参照状況をどう調べればよいのか。弊社が実践しているアプローチの骨子を共有する。

パターンA・Bの両方を定期的に取得する

最も重要なのは、通常質問と参照要求付き質問の両方を定期的に投入し、その結果を突き合わせることである。両方を取ることで初めて、一次参照・二次参照・潜在参照の3分類が可能になる。片方だけでは「そのドメインがどの層に属するか」を判定できない。

二次参照ドメインの変動を追跡する

一般ユーザーの体験に直結する二次参照ドメインの増減を、定期的に記録・比較する。あるドメインが二次参照から消えたなら、AIの推薦ロジックに変化が起きた兆候である。逆に新たなドメインが二次参照に出現し始めたなら、AIがそのソースを評価し始めた可能性がある。

複数エンジンを横断して比較する

本実験でも明らかなように、エンジンごとにプロンプトへの反応は全く異なる。Geminiは通常質問でURLを出さないが、ChatGPTは出す。Perplexityはプロンプト変更に最も敏感に反応する。1つのエンジンの結果だけで「AIの参照状況」を語ることはできない。

3層を意識した施策設計

自社が潜在参照にすら出現していないなら、まずAIの知識に入ることが先決。潜在参照には出ているが二次参照に出ていないなら、AIが参照はしているが推薦には使っていない状態——コンテンツの質や構造化データの改善が有効かもしれない。どの層に自社が位置しているかによって、打つべき施策は変わる。具体的な対策手順は「LLMO対策7選｜ChatGPT・GeminiにおすすめされるAI検索最適化」で体系的に解説している。

本調査データの利用について: 本稿に掲載したデータは株式会社LIFEの独自調査に基づくものです。データの引用・参照は出典明記の上で歓迎いたします。自社の業種における個別調査については、下記よりお問い合わせください。

AIの引用数はプロンプト次第で
11倍変わる

01問いの設定

02実験 —— 聞き方を変えるだけで引用数はどう変わるか

実験設計

結果: 引用URL数の変化

回答の文字数も大幅に変化する

03落とし穴 —— 引用URLの重複率は8〜12%しかない

期待していたこと

様々なプロンプトを試した

実際に起きたこと

04参照の3層構造 —— 1次・2次・潜在参照という考え方

一次参照ドメイン —— A・B両方に出現する引用

二次参照ドメイン —— パターンAのみに出現する引用

潜在参照ドメイン —— パターンBのみに出現する引用

05警鐘 —— この実験結果が意味すること

1. 参照要求プロンプトで「AIの全参照マップ」は描けない

2. 一次参照に載ること自体はGEOの目標ではない

3. 二次参照の定点観測がGEOモニタリングの核になる

4. 潜在参照は「AIの知識の広がり」を読み取る補助データ

06では、どう調べるべきか

パターンA・Bの両方を定期的に取得する

二次参照ドメインの変動を追跡する

複数エンジンを横断して比較する

3層を意識した施策設計

御社は、AIにどう参照されていますか？

01問いの設定

02実験 —— 聞き方を変えるだけで引用数はどう変わるか

実験設計

結果: 引用URL数の変化

回答の文字数も大幅に変化する

03落とし穴 —— 引用URLの重複率は8〜12%しかない

期待していたこと

様々なプロンプトを試した

実際に起きたこと

04参照の3層構造 —— 1次・2次・潜在参照という考え方

一次参照ドメイン —— A・B両方に出現する引用

二次参照ドメイン —— パターンAのみに出現する引用

潜在参照ドメイン —— パターンBのみに出現する引用

05警鐘 —— この実験結果が意味すること

1. 参照要求プロンプトで「AIの全参照マップ」は描けない

2. 一次参照に載ること自体はGEOの目標ではない

3. 二次参照の定点観測がGEOモニタリングの核になる

4. 潜在参照は「AIの知識の広がり」を読み取る補助データ

06では、どう調べるべきか

パターンA・Bの両方を定期的に取得する

二次参照ドメインの変動を追跡する

複数エンジンを横断して比較する

3層を意識した施策設計

御社は、AIにどう参照されていますか？

LLMO対策7選｜ChatGPT・GeminiにおすすめされるAI検索最適化

LLMOとは？意味・GEO/AIOとの違いをAI検索の専門家が解説

ChatGPTとGeminiで推薦結果はなぜ違うのか — 5業種×2エンジンの実測比較