Points Clés :
- 43 % des recherches secondaires (« fan-outs ») de ChatGPT pour des prompts non anglophones sont réalisées en anglais.
- 78 % des sessions non anglophones comportent au moins une requête en anglais, aucun marché non anglophone n’étant en dessous de 60 %.
- Les acteurs locaux dominants (comme Allegro en Pologne, marques allemandes, marques espagnoles) sont souvent ignorés ou placés derrière des plateformes mondiales.
- Pour être visibles, les marques non anglophones doivent envisager des stratégies de contenu en anglais et se positionner dans les sources citées par ChatGPT.
ChatGPT et la Préférence pour l’Anglais
Peec AI, une plateforme spécialisée dans l’analytics de recherche via l’IA, a examiné plus de 10 millions de prompts de ChatGPT et environ 20 millions de requêtes de recherche secondaires (« fan-out queries »). Ces fan-outs sont les sous-requêtes générées par ChatGPT pour identifier des sources avant de produire une réponse.
En examinant les sessions où la langue du prompt et le pays de l’IP concordaient (par exemple, polonais depuis la Pologne), Peec AI a constaté que 43 % des fan-outs initiés par des prompts non anglophones étaient en anglais. Cela signifie que près d’une recherche sur deux se déroule sur le web anglophone, même lorsque l’utilisateur utilise une autre langue.
L’étude révèle aussi que 78 % des sessions non anglophones incluent au moins une requête en anglais, avec un minimum de 60 % pour toutes les langues étudiées. Les recherches en turc sont les plus « anglicisées » : 94 % incluent au moins un fan-out en anglais, tandis que l’espagnol est en bas de l’échelle à 66 %. En France, 82 % des requêtes en français génèrent au moins un fan-out en anglais.

Visibilité des Leaders Locaux
Les données de Peec AI illustrent clairement l’effet de ce biais linguistique :
- En Pologne : Pour une requête en polonais du type « Jakie są najlepsze portale aukcyjne ? » (« quels sont les meilleurs portails d’enchères ? »), Allegro.pl, bien que leader national du commerce en ligne, est souvent absent ou derrière eBay et d’autres plateformes mondiales.
- En Allemagne : Une question sur les « meilleures entreprises de logiciels » depuis l’Allemagne met en avant des entreprises reconnues, mais aucune allemande, malgré un écosystème local riche.
- En Espagne : Pour « Quelles marques de vêtements sont recommandées ? », Zara et Mango sont bien mentionnées, mais les sources sont exclusivement anglophones, concentrées sur des marques globales. Pour les « meilleures marques de cosmétiques », aucun acteur espagnol n’apparaît, car les fan-outs privilégient l’idée du « global ».
Dans le cas espagnol sur les cosmétiques, Peec AI montre que le premier fan-out généré par ChatGPT est en anglais (« best cosmetic brands skincare makeup top brands »), favorisant ainsi les sources globales anglophones. Le second fan-out, en espagnol, intègre le terme « globales », terme non utilisé par l’utilisateur, limitant encore plus la visibilité des marques locales.
Ce schéma se retrouve aussi dans des requêtes politiques en polonais, allemand ou français, où ChatGPT cite souvent des médias anglophones (comme Deutsche Welle), utilisant leur contenu en anglais plutôt que des sources locales.
Comprendre Ce Biais dans les Fan-Outs
Pour appréhender cette dérive, il est essentiel de comprendre la mécanique de recherche de ChatGPT. Quand une question est posée, ChatGPT ne fait pas qu’un simple appel web : il reformule et décompose la requête en plusieurs sous-requêtes spécifiques, les fameux fan-outs. Ces requêtes sont dirigées vers différents partenaires de recherche, avec des requêtes supplémentaires pour affiner la réponse.
Selon Peec AI, ChatGPT débute généralement par des fan-outs dans la langue de l’utilisateur, puis introduit des fan-outs en anglais en cours de réponse. Ce mélange donne à l’utilisateur l’impression d’un résultat « localisé », alors qu’une partie des sources est sélectionnée à partir de requêtes anglaises.
Statistiquement, 43 % des recherches pour des prompts non anglophones se font sur le web anglophone, et dans 78 % des sessions non anglophones, au moins un fan-out passe en anglais. Comme le résume Peec AI, ce n’est pas une exception, mais une norme : aucune langue non anglophone ne passe sous la barre des 60 % de sessions contenant au moins un fan-out en anglais.
Pourquoi ChatGPT Privilégie-t-il l’Anglais ?
L’étude émet deux explications majeures, liées à la structure du web et aux choix de conception de l’IA.
- Les signaux d’autorité favorisent les contenus globaux.
Les pages en anglais reçoivent en moyenne plus de backlinks et de citations, ce qui les rend naturellement fiables ou « d’autorité » pour les modèles d’IA. Quand ChatGPT doit choisir rapidement des sources, il est statistiquement plus facile de trouver des sites anglophones répondant à ces critères qu’un acteur local avec moins de liens ou de citations. - Minimisation du risque de mauvaise réponse.
Environ la moitié du contenu en ligne est en anglais, ce qui augmente la probabilité de trouver des informations jugées pertinentes. Pour une IA conçue pour minimiser les erreurs, passer à l’anglais est une stratégie logique : plus de contenu, plus de signaux, moins de risque de manquer une source clé.
Peec AI souligne que l’IA combine systématiquement les fan-outs locaux et anglais pour les utilisateurs non anglophones, alors que les utilisateurs anglophones ne bénéficient que d’une seule face de ce mélange. Ainsi, les contenus en anglais sont éligibles partout, tandis que les contenus en allemand, polonais ou espagnol ne sont pris en compte que sur leur marché d’origine.
Conséquences pour le SEO des Marchés Non Anglophones
Pour les équipes SEO et les marques locales, ce biais linguistique engendre un désavantage structurel qui n’apparaît pas dans les signaux classiques de Google. Les fan-outs en anglais filtrent en amont les sources candidates : seules les ressources déjà bien représentées sur le web anglophone ont une chance d’être considérées, avant même que les signaux de qualité ou de popularité ne soient évalués.
Les résultats observés par Peec AI indiquent que :
- Des leaders locaux comme Allegro en Pologne peuvent être devancés par des plateformes globales dans les réponses de ChatGPT, même si leur domination sur le marché national est évidente.
- Des marques nationales, notamment dans des secteurs comme les cosmétiques ou le prêt-à-porter, peuvent disparaître complètement quand un fan-out interprète la requête comme une recherche de « meilleures marques globales ».
- Sur des sujets sensibles comme la politique, l’IA peut privilégier des médias anglophones, ce qui implique un angle éditorial et un contexte culturel spécifique qui ne reflètent pas toujours les débats locaux.
Plusieurs analyses SEO récentes, telles que dans Search Engine Journal, soulignent que cette dynamique pourrait amener les équipes à intégrer la production de contenu en anglais dans leurs stratégies de recherche assistée par IA, au-delà du référencement traditionnel.
Adaptation des Marques Non Anglophones
L’étude souligne : traduire tout son site en anglais n’est ni réaliste ni nécessairement efficace. L’objectif est d’identifier les types de contenu réellement cités par ChatGPT dans une catégorie, et les sources anglophones souvent utilisées comme références.
Voici quelques pistes :
- Cartographier les sources déjà citées par ChatGPT.
Analyser, par catégorie, les sites et formats de contenu mis en avant par l’IA (Reddit, Wikipédia, blogs experts, comparateurs, listes « top X », etc.). L’idée est de découvrir où vos concurrents sont visibles en anglais… et où vous ne l’êtes pas. - Prioriser certains contenus clés en anglais.
Plutôt qu’une traduction massive, il est conseillé de produire des versions anglaises ciblées de pages stratégiques comme des guides, comparatifs ou pages marque qui ont un fort potentiel d’être citées. Ce sont ces contenus qui sont les plus susceptibles d’entrer dans le champ des fan-outs en anglais. - Chercher à apparaître dans les « listicles » et comparatifs anglophones.
Étant donné que de nombreux fan-outs ressemblent à des requêtes du type « best X brands », être mentionné dans des listes et articles comparatifs en anglais devient un levier concret de visibilité. - Mesurer en continu sa visibilité dans les IA de recherche.
Peec AI met en avant l’importance de suivre l’évolution de sa présence dans les réponses des assistants (ChatGPT, Perplexity, Claude, Gemini), pour identifier les lacunes et prioriser les contenus à créer ou à adapter.
L’idée centrale : il ne s’agit plus seulement de faire du SEO pour Google dans sa langue, mais aussi de penser à la place de la marque dans l’écosystème d’IA qui fonctionne en grande partie en anglais.
Un Problème Structurel Persistant
L’analyse de Peec AI, ainsi que les commentaires de Search Engine Journal et d’autres experts, mettent en lumière une réalité indéniable : les grands modèles d’IA, principalement conçus et entraînés aux États-Unis, produisent un biais systémique en faveur des contenus en anglais et des marques globales. Ce n’est pas une volonté de nuire, mais une conséquence de la dominance de l’anglais sur le web, des signaux d’autorité exploités et des choix implicites de conception des fan-outs.
Pour Peec AI, la solution réside dans un investissement majeur dans des modèles multilingues conçus dès le départ pour servir équitablement les marchés européens, latino-américains, asiatiques ou africains, avec des corpus, signaux et logiques de recherche centrés sur leurs langues et contextes.
En attendant, les entreprises des marchés non anglophones doivent admettre cette réalité : pour ne pas rester invisibles dans les réponses des IA, elles doivent comprendre ce biais, suivre leur visibilité et ajuster stratégiquement une partie de leur contenu et relations médias à l’écosystème anglophone.
L’article « Étude : ChatGPT pénalise les sites non anglophones » a été publié sur le site Abondance.
À lire en complément : Découvrir les attentes de votre audience
À découvrir également : Améliorer le SEO d’un site multilingue
