Étude AirOps publiée le 13 mars 2026. 548 534 pages consultées par ChatGPT sur 15 000 prompts, 82 108 citations dans les réponses finales. Le verdict tient en un chiffre : 85% des pages que ChatGPT consulte ne sont jamais citées. Lues, évaluées, puis écartées avant que l'utilisateur ne voie la moindre ligne.

Ce chiffre change la nature du problème. Le référencement IA n'est plus une affaire de discoverability (est-ce que ChatGPT vous trouve ?) mais de selectability (est-ce qu'il vous choisit ?). Et la quasi-totalité des articles français sur le sujet, y compris ceux des grosses agences, optimisent encore pour la première étape — celle qui ne décide plus rien.

Diagnostic en 60 secondes : Citora teste automatiquement les 6 dimensions qui font basculer une page de "lue" à "citée" : clarté entité, réponses directes, signaux de confiance, autorité web, accessibilité technique, données structurées. 🔍 Lancer un diagnostic gratuit →

Test en 30 secondes : êtes-vous dans les 15% ?

Avant de continuer, faites ce test :

  1. Prenez votre page la plus importante (celle qui devrait sortir en premier dans votre secteur).
  2. Copiez son titre H1, reformulez-le en question.
  3. Posez la question à ChatGPT, dans une nouvelle conversation, avec le mode recherche web activé.

Trois résultats possibles :

  • ChatGPT cite votre page : vous êtes dans les 15%. Lisez quand même la suite : la moitié des sites qui passent ce test échouent sur des variantes de la même question (le piège du query fan-out, on y revient).
  • ChatGPT cite un concurrent, ou Wikipedia, ou Reddit : vous êtes dans les 85%. Votre page a probablement été lue puis écartée. La suite vous explique pourquoi.
  • ChatGPT cite un site dont vous n'avez jamais entendu parler : signal d'alerte sur votre dimension "autorité" — la majorité du trafic IA de votre secteur passe par un hub que vous ne contrôlez pas.

Ce que dit vraiment l'étude AirOps

L'étude s'appelle The Influence of Retrieval, Fan-out, and Google SERPs on ChatGPT Citations. AirOps a scrapé l'interface ChatGPT (pas l'API) sur 15 000 prompts réels, dans 10 secteurs et 4 typologies de requêtes. Les chiffres bruts :

  • 548 534 pages récupérées, 82 108 citations finales : taux global de citation 15%.
  • 89,6% des prompts déclenchent au moins 2 recherches internes supplémentaires (le mécanisme appelé query fan-out). Une seule question utilisateur génère en moyenne 2 à 15 sous-requêtes parallèles.
  • 95% des sous-requêtes du fan-out ont un volume de recherche nul sur les outils SEO classiques (Semrush, Ahrefs). Optimiser pour des mots-clés Semrush, c'est rater 95% du jeu.
  • Position Google n°1 = 43,2% de chance d'être cité par ChatGPT. Position 10 = 14,2%. L'écart est de 3,5x, ce qui contredit le discours dominant "le SEO est mort" — mais confirme aussi que plus de la moitié des pages en position 1 sont quand même écartées au moment de la synthèse.
  • 74% des citations vont à des sites avec un Domain Authority inférieur à 80. La pondération la plus forte se trouve sur DA 20–40. Autrement dit : les PME et sites de niche ne sont pas exclus par construction.
  • Bonus, donnée d'avril 2026 : depuis la bascule de ChatGPT sur GPT-5.3 Instant comme modèle par défaut, le nombre moyen de domaines cités par réponse est passé de 19,1 à 15,2 (étude RESONEO). Le jeu se durcit en temps réel.

Pourquoi 85% des pages sont écartées : les 3 vraies raisons

C'est ici que la majorité des articles français vous mentent. Ils répètent le même triptyque : "écrivez du contenu de qualité, ajoutez Schema.org, mettez à jour vos pages." C'est utile, mais ça ne suffit plus depuis février 2026. Voici ce qui sépare une page lue d'une page citée, selon les données AirOps :

1. La page ne répond pas à la sous-requête, elle répond à la requête principale

Quand quelqu'un demande à ChatGPT "Quel est le meilleur logiciel de comptabilité pour une PME française qui veut automatiser sa TVA ?", le modèle ne cherche pas cette phrase. Il la décompose en 5 à 15 sous-questions : "meilleur logiciel comptabilité PME 2026", "automatisation TVA France", "tarifs Pennylane vs Sage", "intégration banque logiciel comptable", etc.

La page qui sera citée n'est pas le guide exhaustif de 4 000 mots qui couvre vaguement tout, c'est la page chirurgicale de 800 mots qui répond exactement à une de ces sous-questions. Focus bat exhaustivité, AirOps le démontre chiffres à l'appui : les pages avec la plus forte correspondance titre↔requête sont citées dans 41% des cas, contre ~30% pour les correspondances faibles.

2. La réponse n'est pas extractible en bloc autonome

ChatGPT ne cite pas des pages, il cite des passages. Un paragraphe qui commence par "Comme nous l'avons vu précédemment" ou "Cela dépend de plusieurs facteurs" est inextractible : sorti de son contexte, il ne dit rien. Le modèle l'écarte.

La règle silencieuse : chaque paragraphe doit pouvoir être copié-collé seul, comprendre sa propre réponse, et tenir en 40 à 60 mots. C'est la pyramide inversée du journalisme, mais appliquée au niveau du paragraphe et pas de l'article.

3. L'autorité de la marque sur le sujet n'est pas confirmée hors de votre site

Le facteur le plus corrélé à la citation, selon Ahrefs (décembre 2025) : les mentions de marque sur le web, liées ou non. Une marque qui n'existe que sur son propre site se fait écarter au profit d'un concurrent moins bon techniquement, mais cité par 4 articles tiers, 2 vidéos YouTube et un fil Reddit.

C'est la dimension la plus inconfortable parce qu'elle ne se "fixe" pas en éditant son site. Elle se construit hors site, sur plusieurs mois.

Tableau effort × levier : que faire dès cette semaine ?

Action Effort Levier Dimension Citora concernée
Tester 10 prompts cibles sur ChatGPT et noter qui est cité 30 min ⚡⚡ Baseline audit
Identifier les 5 sous-requêtes de votre prompt principal (query fan-out) 1h ⚡⚡⚡⚡⚡ Réponses directes
Reformuler vos 3 meilleurs H1 en questions exactes (mirror query) 2h ⚡⚡⚡⚡ Réponses directes
Découper vos paragraphes en blocs autonomes de 40–60 mots 4h ⚡⚡⚡⚡ Réponses directes
Ajouter Schema.org FAQPage + Article aux pages stratégiques 2h ⚡⚡⚡ Données structurées
Vérifier robots.txt pour 27 crawlers IA (GPTBot, ClaudeBot, PerplexityBot, Google-Extended…) 30 min ⚡⚡⚡ Accessibilité technique
Obtenir 3 mentions tierces de la marque (Reddit, podcast, listicle) 4 sem. ⚡⚡⚡⚡⚡ Autorité web
Publier ou mettre à jour 1 page sur la sous-requête la moins couverte 1 jour ⚡⚡⚡⚡ Entité / Réponses directes

Diagnostic complet automatisé : Citora teste ces 6 dimensions sur votre domaine et vous renvoie un score 0–100 par dimension, avec les pages à corriger en priorité. [Lancer un audit gratuit]

Le vrai sujet : SEO et GEO ne sont plus deux disciplines

C'est le piège dans lequel tombe la plupart des contenus français sur le référencement IA. On vous explique que le SEO est mort et que le GEO (Generative Engine Optimization) le remplace, ou l'inverse. Les données AirOps disent autre chose, plus dérangeant pour les agences qui vendent deux prestations distinctes :

Le SEO Google reste le ticket d'entrée du retrieval. Sans position top 20, vous n'entrez même pas dans le pool des 100% lues. Position 1 = 43,2% de citation, position 20 = 14,2%, position 21+ = quasiment zéro.

Mais le SEO Google ne décide pas du dernier mètre. Une fois dans le pool, c'est la structure du passage, la correspondance avec la sous-requête, et l'autorité hors-site qui tranchent. Et là, le travail n'est plus du SEO classique — c'est du référencement éditorial pour l'IA, c'est-à-dire du GEO au sens strict.

La bonne équation en 2026 :

Visibilité IA = SEO Google (retrieval) × GEO éditorial (selectability) × Autorité tierce (validation)

Si l'un des trois facteurs est à zéro, le produit est à zéro. C'est pour ça que les "audits GEO" qui ne regardent que les sources citées sur ChatGPT ratent la moitié du tableau : ils mesurent l'output, pas les leviers.

Foire aux questions

ChatGPT cite-t-il vraiment moins de domaines depuis avril 2026 ?

Oui. La bascule sur GPT-5.3 Instant comme modèle par défaut a réduit le nombre moyen de domaines cités par réponse de 19,1 à 15,2 (RESONEO, avril 2026). Concrètement, la concurrence pour les places disponibles a augmenté de 20%. Les sites qui étaient "marginalement" cités passent à zéro citation.

Le llms.txt aide-t-il à passer dans les 15% ?

Pas directement, pas en mai 2026. Voir notre article dédié sur le sujet. Le fichier reste une mise à niveau peu coûteuse (30 minutes) et structurante pour l'avenir, mais aucune étude sérieuse, y compris AirOps, n'a mesuré d'effet causal sur le taux de citation actuel. Priorisez la correspondance titre↔requête et la structure des passages.

Doit-on bloquer les crawlers IA dans robots.txt pour protéger son contenu ?

Si vous bloquez GPTBot, ClaudeBot, PerplexityBot ou Google-Extended, vous sortez définitivement du pool des pages retrievables. Vous protégez votre contenu et vous abandonnez votre visibilité IA dans le même geste. Pour un site dont l'IA n'est pas (encore) un canal d'acquisition, le calcul peut se défendre. Pour tous les autres, c'est un autogoal.

Comment mesurer le taux de citation sans plateforme payante ?

Méthode manuelle, gratuite, fiable : choisissez 20 prompts représentatifs, lancez-les 3 fois chacun sur ChatGPT (avec recherche web activée), Perplexity et Gemini. Comptez les apparitions de votre marque sur 60 réponses par moteur. C'est ce qu'on appelle le Share of Model Voice : votre part de voix dans les réponses IA. Compter 2 à 4 heures de travail. Pour 50 prompts ou plus, ou pour un suivi mensuel, une plateforme automatisée devient pertinente.

Le SEO classique sert-il encore à quelque chose ?

Oui, plus que jamais — mais différemment. Il sert à entrer dans le pool des 100% lues, pas à décider de la citation. Position Google n°1 = 43,2% de probabilité d'être cité par ChatGPT (AirOps, mars 2026), contre 14,2% en position 10 et quasi-zéro en page 2+. Le SEO n'est plus l'objectif, c'est le prérequis.

Citora couvre-t-il les 6 facteurs de citation identifiés par AirOps ?

Oui. Le score 0–100 de Citora évalue les 6 dimensions techniques et éditoriales qui pèsent sur le passage du retrieval au citation : clarté de l'entité (qui êtes-vous ?), réponses directes (vos passages sont-ils extractibles ?), signaux de confiance, autorité web (mentions tierces), accessibilité technique (llms.txt, robots.txt, 27 crawlers IA), données structurées Schema.org. C'est le diagnostic que la méthodologie manuelle ne peut pas faire en moins de 2 jours, et que Citora fait en quelques secondes.

Articles liés

Partager :

Analysez votre site gratuitement

Découvrez votre score de visibilité IA en 60 secondes