En novembre 2025, SE Ranking a scanné 300 000 domaines pour vérifier qui avait un fichier llms.txt à la racine de son site. Résultat : 10,13%. En français, ça veut dire que 9 sites sur 10 n'ont pas ce fichier. Et la vérité dérangeante, c'est que les 10% qui l'ont ne se font pas plus citer par ChatGPT pour autant. Voilà pourquoi vous devriez en créer un quand même, et pourquoi le faire cet après-midi.

Le fichier llms.txt est devenu, en 18 mois, le sujet le plus mal compris du SEO français. La moitié des consultants vous dira que c'est la nouvelle balise meta keywords (citation textuelle de Gary Illyes chez Google). L'autre moitié vous le vendra comme l'arme secrète pour apparaître dans ChatGPT. Les deux ont tort, et c'est précisément pourquoi cet article existe.

On va être directs : aujourd'hui, en mai 2026, llms.txt n'améliore pas mesurablement vos citations dans les moteurs IA. Mais il coûte 30 minutes à créer, il fait partie des signaux que Citora évalue dans la dimension Accessibilité technique, et il vous positionne pour le jour où les principaux acteurs décideront de le respecter. C'est exactement le profil d'action qu'on aime : effort minimal, optionalité maximale.

Avez-vous un llms.txt ? Test en 10 secondes

Avant de continuer, faites ce test :

  1. Ouvrez un nouvel onglet
  2. Tapez votresite.fr/llms.txt (remplacez par votre domaine)
  3. Appuyez sur Entrée

Trois résultats possibles :

  • Erreur 404 ou page d'accueil qui se charge : vous êtes dans les 90%. Lisez la suite.
  • Un fichier texte structuré apparaît : bravo, vous êtes dans les 10%. Lisez quand même la section "ce qu'il faut auditer", la plupart des llms.txt français sont mal construits.
  • Un fichier HTML brouillon apparaît : votre framework SPA intercepte le fichier. C'est le piège le plus fréquent, on y revient plus bas.

Vérifier en 60 secondes : Citora teste automatiquement la présence, la validité et la structure de votre llms.txt parmi 6 dimensions critiques. 🔍 Lancer un diagnostic gratuit →

C'est quoi exactement, ce fichier ?

llms.txt est un fichier Markdown placé à la racine de votre domaine (https://votresite.fr/llms.txt) qui décrit votre site aux modèles de langage. Pensez-le comme une table des matières curatée à destination des IA : voici qui je suis, voici mes 10 pages les plus utiles, voici dans quel ordre les consulter.

La proposition vient de Jeremy Howard (fondateur de fast.ai et Answer.AI), publiée le 3 septembre 2024 sur llmstxt.org. La logique technique est simple : les fenêtres de contexte des LLM restent limitées, et une page web typique contient 80% de navigation, scripts, bannières cookies et CSS qui n'aident en rien un modèle à comprendre votre activité. Le fichier llms.txt règle ce problème en pointant directement vers le contenu utile, en Markdown propre, sans le bruit.

Le format est précis :

# Nom de votre entreprise

> Description en une ou deux phrases. C'est ce que les IA extraient en premier.

Contexte additionnel important : qui vous êtes, ce que vous faites, votre proposition de valeur.

## Documentation principale
- [Comment ça marche](https://votresite.fr/comment-ca-marche) : Description en une ligne de la page
- [Tarifs](https://votresite.fr/tarifs) : Description en une ligne

## Ressources
- [Blog](https://votresite.fr/blog) : Articles sur tel et tel sujet
- [Études de cas](https://votresite.fr/cas) : Résultats clients documentés

## Optional
- [Mentions légales](https://votresite.fr/mentions-legales)

Trois règles non négociables : le titre H1 du nom de votre entreprise, le blockquote (>) de résumé juste en-dessous (c'est ce que les IA citent en priorité), et des sections H2 qui regroupent les liens par type. Le bloc ## Optional est lu en dernier : placez-y ce qui est important pour les humains mais secondaire pour une IA.

L'éléphant dans la pièce : est-ce que ça fonctionne vraiment ?

C'est ici que la majorité des articles français vous mentent. Donnons les chiffres :

  • SE Ranking, novembre 2025 : sur 300 000 domaines analysés, la présence d'un llms.txt n'a aucune corrélation statistique avec la fréquence de citation par les LLM. Mieux : retirer cette variable d'un modèle XGBoost améliore sa précision prédictive. Le fichier ajoute du bruit, pas du signal.
  • ALLMO.ai, janvier 2026 : sur 94 000 URL citées par les moteurs IA, moins de 1% contenaient un llms.txt. Si le fichier avait un impact, on devrait voir au minimum 10% (le taux d'adoption global). On en voit dix fois moins.
  • Codersera, mai 2026 : les logs serveur de sites majeurs confirment que GPTBot, ClaudeBot et les crawlers Google ne récupèrent pas le fichier de manière significative.

Et pourtant, Anthropic, Stripe, Cloudflare, Vercel, Shopify, Cursor et Mintlify ont tous publié leur llms.txt. Pourquoi ?

Trois raisons qui justifient, toujours, de le faire aujourd'hui :

  1. Les agents IDE l'utilisent déjà. Cursor, Continue, Cline et Aider lisent activement llms.txt quand on leur pointe une documentation. Si votre cible inclut des développeurs ou des power users d'outils IA, c'est un canal d'acquisition réel dès aujourd'hui.
  2. L'écosystème MCP commence à le consommer. Les serveurs MCP (Model Context Protocol) de documentation pointent vers llms.txt pour fournir du contexte propre aux assistants. Cet écosystème grossit vite.
  3. L'optionalité. Le jour où OpenAI ou Google annoncent qu'ils respectent la norme, et ça finira par arriver, comme pour robots.txt en 1994, vous serez déjà conforme. Vos concurrents auront, eux, trois mois de retard.

Le calcul est simple : 30 minutes maintenant, contre un risque nul, et une upside qui peut se déclencher à n'importe quel moment.

Comment écrire un llms.txt qui ne fait pas honte

La majorité des llms.txt français qu'on audite chez Citora sont mal construits. Trois erreurs reviennent systématiquement.

Erreur 1 : trop promotionnel

Un llms.txt qui ressemble à une page de vente est immédiatement décoté par les modèles. Le ton attendu est factuel, descriptif, ennuyeux. Pas "Le leader incontesté du secrétariat juridique" mais "Cabinet de secrétariat juridique basé à Lyon, spécialisé dans les SCI et les SAS".

Erreur 2 : le blockquote oublié

Le > qui suit le H1 est la phrase que les IA extraient en premier. La plupart des fichiers que je vois ne l'ont pas, ou le remplissent avec du jargon marketing inutile. C'est l'équivalent de la meta description pour les LLM. Traitez-le avec le même soin.

Erreur 3 : trop de liens

Les meilleurs llms.txt (regardez celui d'Anthropic, de Stripe ou de Vercel) listent 20 à 40 liens maximum, regroupés par thème. Pas tout votre sitemap. La règle : si une IA devait répondre à une question sur ma marque, sur quelles 30 pages devrait-elle s'appuyer ? Le reste n'a rien à faire dans ce fichier.

Bonus : le piège SPA

Si votre site est en React, Vue, Next.js ou tout autre framework JavaScript, testez votre llms.txt avec curl, pas avec votre navigateur. Beaucoup de SPA interceptent les routes inconnues et renvoient le HTML de l'application au lieu du fichier Markdown. Dans le terminal :

curl -I https://votresite.fr/llms.txt

Vous devez voir Content-Type: text/plain ou text/markdown. Si vous voyez text/html, votre fichier n'est pas servi correctement.

Que faire maintenant : 4 actions classées par levier (impact ÷ effort)

Action Effort Levier 1. Créer un llms.txt basique (titre + blockquote + 10 liens) 30 min 6.0 2. Vérifier que le fichier est bien servi en text/plain 5 min 8.0 3. Ajouter un llms-full.txt avec le contenu complet en Markdown 2-3h 2.5 4. Aligner robots.txt pour autoriser ClaudeBot, GPTBot, PerplexityBot 10 min 7.5 Commencez par 2 et 4. Ce sont les actions qui ont un effet immédiat et mesurable en 2026, pas llms.txt lui-même, mais le robots.txt derrière. C'est contre-intuitif, mais c'est la vérité des logs serveur : le levier qui bouge vraiment les citations IA aujourd'hui, c'est l'accès des crawlers, pas le fichier descriptif.

L'action 1 vient ensuite. L'action 3 (llms-full.txt) n'est pertinente que si vous avez une documentation technique dense ou un volume de contenu pédagogique conséquent. Pour un site corporate de 30 pages, c'est de la sur-ingénierie.

Pas le temps d'auditer tout cela ?

L'Audit Stratégique Citora vérifie en 60 secondes la présence, la validité et la structure de votre llms.txt, ainsi que les 5 autres dimensions critiques de votre visibilité IA. [Demander un audit stratégique]

Le vrai sujet : llms.txt n'est qu'un signal parmi six

Si vous avez lu jusqu'ici, vous avez compris le piège : se concentrer sur llms.txt au détriment du reste, c'est optimiser le hublot d'un bateau qui prend l'eau par la coque.

Les six dimensions que Citora évalue (clarté d'entité, réponses directes, signaux de confiance, autorité, accessibilité technique, données structurées) fonctionnent en système. Avoir un llms.txt parfait sur un site sans schéma Organization, sans bios d'auteur, et avec un robots.txt qui bloque GPTBot, c'est mettre un nœud papillon sur un costume taché.

La bonne nouvelle, c'est qu'aucune de ces actions ne demande de refondre votre site. Toutes coûtent entre 10 minutes et 3 heures. La mauvaise, c'est que la fenêtre où on pouvait improviser sa visibilité IA s'est refermée fin 2025, exactement comme la fenêtre SEO s'est refermée vers 2008. Les sites qui n'auront pas posé ces fondations en 2026 mettront 18 mois à rattraper en 2027.

Comment savoir si votre site est prêt

Citora mesure 6 dimensions critiques sur votre site :

  • Clarté d'entité : Google et les IA peuvent-elles vous identifier ?
  • Réponses directes : votre contenu est-il extractible ?
  • Signaux de confiance : bios auteur, schéma Article, alt text
  • Autorité et présence web : liens sortants, identité structurée
  • Accessibilité technique : robots.txt, sitemap, llms.txt, accès des 27 crawlers IA
  • Données structurées : Schema.org Organization, FAQPage, Article, Person

Le score (0 à 100) vous dit en 60 secondes où vous en êtes, et exactement quoi corriger en priorité, classé par levier.

Votre site est-il prêt pour la prochaine vague IA ?

Diagnostic gratuit en 60 secondes. Aucune carte bancaire, aucune inscription.

[Lancer mon diagnostic gratuit]

FAQ

llms.txt améliore-t-il vraiment mes citations dans ChatGPT ?

Pas mesurablement, en mai 2026. Deux études indépendantes (SE Ranking sur 300 000 domaines, ALLMO sur 94 000 URL citées) montrent qu'il n'y a aucune corrélation entre la présence du fichier et la fréquence de citation. En revanche, les agents IDE (Cursor, Continue) et certains serveurs MCP l'utilisent activement. C'est un pari à coût quasi-nul sur l'adoption future de la norme.

Quelle est la différence entre llms.txt et robots.txt ?

robots.txt restreint l'accès aux crawlers. llms.txt guide la compréhension. Les deux sont complémentaires, pas concurrents. Vous devriez avoir les deux, et c'est en réalité robots.txt qui a le plus d'impact aujourd'hui sur vos citations IA, via l'autorisation explicite des User-Agents ClaudeBot, GPTBot, PerplexityBot et Google-Extended.

Faut-il créer aussi un llms-full.txt ?

Seulement si vous avez une documentation technique dense ou un volume de contenu pédagogique conséquent (200+ articles structurés, par exemple). Pour 90% des sites corporate, c'est inutile. Anthropic a un llms-full.txt qui fait 481 000 tokens parce que leur documentation API est massive. Votre site de 30 pages n'en a pas besoin.

Mon CMS génère-t-il automatiquement un llms.txt ?

Certains oui. Mintlify, GitBook, Vercel Docs et Supabase Docs le génèrent automatiquement pour les projets hébergés. WordPress nécessite un plugin (plusieurs existent maintenant, mais aucun n'est dominant). Pour un site custom, vous le créez à la main, c'est en réalité l'option qu'on recommande : la curation manuelle bat l'auto-génération à chaque fois.

Si je publie un mauvais llms.txt, ça peut me pénaliser ?

Non, pas en mai 2026. Comme les principaux LLM ne le lisent pas activement, un fichier mal construit n'a pas d'impact négatif mesurable. Le risque est ailleurs : un llms.txt mal servi par votre framework (HTML au lieu de Markdown) peut donner l'impression à un futur crawler que vous ne respectez pas la norme. D'où l'importance du test curl.

Citora peut-il créer mon llms.txt à ma place ?

Oui. L'Audit Stratégique inclut la génération d'un llms.txt adapté à votre site, ainsi que le robots.txt aligné sur les 27 crawlers IA actifs en 2026. Mais la création manuelle reste l'approche la plus solide : personne ne connaît votre site mieux que vous.

Partager :

Analysez votre site gratuitement

Découvrez votre score de visibilité IA en 60 secondes