Volume de recherche SEO : comment les outils le calculent vraiment

Quand vous cherchez « volume de recherche » pour un mot-clé dans Semrush, Ahrefs ou Ubersuggest, chaque outil affiche un chiffre différent. Parfois l'écart est de 20 %. Parfois c'est du simple au triple. Comment est-ce possible ? D'où viennent ces chiffres ? Et surtout : lequel croire ?

Dans cet article, nous allons décrypter les sources de données, les méthodes de calcul et les limites de chaque approche. Vous comprendrez enfin pourquoi les volumes diffèrent — et pourquoi une alternative existe.

Google Keyword Planner : la source primaire (et ses défauts)

La quasi-totalité des outils SEO partent de la même base : le Google Keyword Planner (GKP). C'est l'outil officiel de Google, conçu pour les annonceurs Google Ads. Il fournit des estimations de volume de recherche mensuel pour n'importe quel mot-clé.

Comment fonctionne le Keyword Planner

Google ne donne pas le nombre exact de recherches. Il fournit :

Le regroupement de variantes

Un point crucial que beaucoup ignorent : Google regroupe les variantes proches sous un même volume. Par exemple, « chaussure running », « chaussures running » et « chaussures de running » affichent souvent le même volume dans le Keyword Planner, parce que Google les considère comme la même intention de recherche.

Conséquence directe : le volume affiché pour un mot-clé peut inclure celui de dizaines de variantes. Vous ne savez pas quelle part du volume revient à la formulation exacte que vous ciblez.

Les limites du GKP pour le SEO

Clickstream data : la deuxième source majeure

Pour compléter (ou remplacer) les données du Keyword Planner, les outils SEO utilisent massivement le clickstream data. C'est un concept central qu'il faut comprendre pour interpréter les volumes.

Qu'est-ce que le clickstream ?

Le clickstream désigne les données de navigation collectées auprès de panels d'utilisateurs. Ces utilisateurs acceptent (souvent sans le réaliser) de partager leur activité de navigation via :

Les principaux fournisseurs de clickstream

Plusieurs entreprises se sont spécialisées dans la collecte et la revente de clickstream data :

Comment fonctionne l'extrapolation

Un panel clickstream représente une fraction infime des internautes (typiquement 0,5 à 2 % de la population d'un pays). Pour estimer le volume total, les outils utilisent l'extrapolation statistique :

  1. Observation : sur un panel de 2 millions d'utilisateurs en France, 150 ont cherché « meilleur outil SEO » ce mois-ci
  2. Pondération : le panel est corrigé pour refléter la démographie réelle (âge, localisation, appareil, habitudes de navigation)
  3. Extrapolation : si le panel représente 3 % des internautes français, on multiplie par ~33 pour obtenir une estimation nationale
  4. Croisement : le résultat est croisé avec les données du Keyword Planner pour calibrer l'estimation

Le problème : chaque panel a un biais différent. Un panel constitué via un VPN gratuit surreprésente les utilisateurs soucieux de leur vie privée. Un panel via un antivirus surreprésente les utilisateurs moins techniques. L'extrapolation amplifie ces biais.

Méthodes de lissage et de traitement des données

Les outils SEO ne se contentent pas de croiser GKP + clickstream. Ils appliquent des traitements statistiques pour lisser les données et produire un chiffre « propre ».

Moyennes mobiles

Plutôt que d'afficher le volume brut du dernier mois (trop volatile), les outils calculent une moyenne mobile sur 6 à 12 mois. Cela élimine les fluctuations ponctuelles mais masque les tendances récentes. Un mot-clé dont le volume explose depuis 2 mois affichera encore un volume « moyen » bas.

Désaisonnalisation

Certains outils tentent de corriger la saisonnalité. Par exemple, « cadeau Noël » a un pic énorme en novembre-décembre et quasi zéro en été. Afficher la moyenne annuelle (disons 30 000/mois) est trompeur : le volume réel est de 200 000 en décembre et de 1 000 en juillet.

Chaque outil gère la saisonnalité différemment :

Corrections de panel

Après la fermeture de Jumpshot en 2020, de nombreux outils ont dû changer de source clickstream ou renforcer leurs propres panels. Cela a causé des variations brutales dans les volumes affichés — sans que les volumes réels de recherche aient changé. Un rappel que ces chiffres sont des estimations, pas des mesures.

Pourquoi les volumes diffèrent entre outils : les 5 causes

Maintenant que vous comprenez les sources et les méthodes, voici les 5 raisons concrètes qui expliquent les écarts.

1. Des sources de données différentes

Semrush utilise ses propres panels clickstream + GKP. Ahrefs combine clickstream propriétaire + données de partenaires. Ubersuggest s'appuie principalement sur le GKP. Des sources différentes produisent des estimations différentes.

2. Des panels de tailles et de compositions différentes

Un panel de 5 millions d'utilisateurs n'a pas la même précision qu'un panel de 500 000. Et deux panels de même taille mais composés différemment (géographie, âge, comportement) donneront des résultats différents après extrapolation.

3. Des fréquences de mise à jour différentes

Certains outils mettent à jour leurs volumes mensuellement, d'autres trimestriellement. Quand vous consultez un volume, il peut dater de 1 mois chez l'un et de 3 mois chez l'autre. Pour les mots-clés saisonniers ou les tendances émergentes, l'écart est significatif.

4. Des algorithmes de lissage différents

Moyenne mobile sur 6 mois vs 12 mois, prise en compte ou non de la saisonnalité, méthode de pondération du panel… Chaque choix algorithmique influe sur le résultat final. Deux outils avec les mêmes données brutes peuvent afficher des volumes différents simplement parce qu'ils les traitent différemment.

5. Le traitement différent du regroupement de variantes

Certains outils dédupliquent les variantes (comme le fait Google), d'autres affichent un volume par variante exacte. Ahrefs, par exemple, a longtemps dégroupé les variantes pour donner un volume plus granulaire, alors que d'autres restent alignés sur le regroupement GKP.

Cas concrets : comparaison sur des mots-clés réels

Pour illustrer ces écarts, voici des exemples typés de divergences entre outils sur un même mot-clé.

Mot-clé Google Keyword Planner Semrush Ahrefs Ubersuggest
outil SEO gratuit 1K – 10K 2 900 3 500 2 400
audit SEO site web 100 – 1K 720 550 480
suivi position Google 100 – 1K 390 250 320
comment améliorer son SEO 1K – 10K 1 600 1 900 1 300

Note : ces chiffres sont des exemples illustratifs représentatifs des écarts typiquement observés entre outils. Les volumes réels fluctuent dans le temps.

Plusieurs constats :

Les limites majeures des volumes de recherche estimés

Au-delà des écarts entre outils, les volumes de recherche estimés présentent des limites structurelles qu'il faut connaître.

Les mots-clés longue traîne à volume « 0 »

Le problème le plus criant. De très nombreux mots-clés longue traîne affichent un volume de 0 dans tous les outils. Pourtant, ils génèrent bien du trafic. Explication :

Or, selon Google lui-même, 15 % des recherches quotidiennes n'ont jamais été vues auparavant. La longue traîne représente souvent 60 à 80 % du trafic organique d'un site. Se fier uniquement aux volumes estimés, c'est ignorer la majorité de son potentiel.

Le regroupement de variantes par Google

Comme vu plus haut, Google regroupe les variantes proches. Mais ce regroupement est opaque et imprévisible :

Conséquence : le volume d'un mot-clé peut varier d'un mois à l'autre non pas parce que les recherches changent, mais parce que Google a modifié son regroupement.

Volume ≠ trafic potentiel

Un mot-clé avec un volume de 10 000 recherches/mois ne vous apportera pas 10 000 visites, même en première position. Les SERP features (featured snippets, People Also Ask, Knowledge Panels, publicités) captent une part croissante des clics. Sur certaines requêtes, le taux de clic zéro (l'utilisateur obtient sa réponse sans cliquer) dépasse 50 %.

Le volume de recherche est un indicateur de demande, pas une prévision de trafic.

Ce qu'il faut retenir sur les volumes de recherche

Ce que les volumes font bien

  • Donner un ordre de grandeur de la demande
  • Comparer des mots-clés entre eux au sein du même outil
  • Identifier les tendances générales
  • Prioriser les mots-clés à fort potentiel

Ce que les volumes font mal

  • Prédire le trafic réel que vous obtiendrez
  • Capturer la longue traîne (souvent à 0)
  • Être cohérents d'un outil à l'autre
  • Refléter la saisonnalité en temps réel

L'approche de SEO Pilote : des données réelles au lieu d'estimations

Face à toutes ces limites, SEO Pilote adopte une approche radicalement différente : plutôt que d'estimer des volumes de recherche, il exploite les données réelles de votre Google Search Console.

Impressions réelles au lieu de volumes estimés

En se connectant directement à la GSC via OAuth2, SEO Pilote récupère les impressions réelles de chaque mot-clé sur votre site. Une impression signifie qu'un utilisateur a effectivement vu votre résultat dans Google pour cette requête. C'est une mesure directe, pas une estimation extrapolée à partir d'un panel.

Avantage majeur : vous voyez les mots-clés longue traîne qui génèrent des impressions, même ceux que tous les outils affichent à volume 0.

Clics réels au lieu de trafic prédit

Les outils qui estiment le trafic à partir du volume et d'un CTR théorique se trompent souvent. SEO Pilote affiche directement le nombre de clics réels depuis Google. Vous savez exactement combien de visiteurs chaque mot-clé génère.

CTR et position réelle

Au lieu de deviner votre position avec un rank tracker (qui peut varier selon la géolocalisation, l'appareil et la personnalisation), vous obtenez la position moyenne réelle telle que reportée par Google lui-même, ainsi que le CTR réel de chaque mot-clé.

Suivi d'évolution et détection de problèmes

SEO Pilote vous permet de comparer deux périodes pour détecter automatiquement :

L'outil génère également des rapports IA automatiques (rapport consultant et rapport client) qui analysent vos données et produisent un plan d'action concret.

Pourquoi cette approche est plus fiable

Critère Outils classiques (Semrush, Ahrefs…) SEO Pilote (données GSC)
Source de données GKP + clickstream (estimations) Google Search Console (données réelles)
Couverture longue traîne Souvent à 0 Tous les mots-clés avec ≥ 1 impression
Trafic réel Estimé (volume × CTR théorique) Clics réels mesurés
Position Scraping / rank tracker Position moyenne reportée par Google
Fréquence de mise à jour Mensuelle à trimestrielle À chaque import (vous choisissez)
Coût 99 à 449 €/mois 99€ HT/an

Travaillez avec des données réelles, pas des estimations

SEO Pilote se connecte à votre Google Search Console et vous donne les impressions, clics et positions réelles de chaque mot-clé. Fini les écarts entre outils. Testez pendant 7 jours gratuitement.

Questions fréquentes

Semrush et Ahrefs utilisent des sources de données différentes (Google Keyword Planner, clickstream, panels propriétaires) et des algorithmes de lissage distincts. Chaque outil extrapole à partir de son propre échantillon, ce qui produit des estimations différentes pour un même mot-clé. Les écarts de 20 à 50 % sont courants et normaux.

La source primaire est le Google Keyword Planner, complétée par des données clickstream provenant de panels d'utilisateurs (extensions de navigateur, applications mobiles, VPN gratuits). Les outils combinent ces deux sources avec des modèles statistiques pour produire leurs estimations de volume mensuel.

Le clickstream data désigne les données de navigation collectées auprès de panels d'utilisateurs volontaires (via des extensions de navigateur, des VPN gratuits ou des applications mobiles). Ces données permettent de savoir quelles requêtes les utilisateurs tapent dans Google et sur quels résultats ils cliquent. Les outils SEO extrapolent ces données à l'ensemble de la population pour estimer les volumes de recherche.

Google Keyword Planner regroupe les variantes proches sous un même mot-clé principal et arrondit les volumes en fourchettes larges. Les requêtes très spécifiques tombent sous le seuil de détection et sont affichées à 0, même si elles génèrent quelques recherches par mois. Les panels clickstream, trop petits, ne captent pas non plus ces requêtes rares.

Non. SEO Pilote se connecte directement à la Google Search Console et exploite les données réelles : impressions, clics, CTR et positions. Au lieu de se baser sur des estimations de volume, vous travaillez avec les données de performance réelles de votre site dans Google. C'est plus fiable et cela couvre la longue traîne que les autres outils ignorent.