Volume de recherche SEO : comment les outils le calculent vraiment
Quand vous cherchez « volume de recherche » pour un mot-clé dans Semrush, Ahrefs ou Ubersuggest, chaque outil affiche un chiffre différent. Parfois l'écart est de 20 %. Parfois c'est du simple au triple. Comment est-ce possible ? D'où viennent ces chiffres ? Et surtout : lequel croire ?
Dans cet article, nous allons décrypter les sources de données, les méthodes de calcul et les limites de chaque approche. Vous comprendrez enfin pourquoi les volumes diffèrent — et pourquoi une alternative existe.
Google Keyword Planner : la source primaire (et ses défauts)
La quasi-totalité des outils SEO partent de la même base : le Google Keyword Planner (GKP). C'est l'outil officiel de Google, conçu pour les annonceurs Google Ads. Il fournit des estimations de volume de recherche mensuel pour n'importe quel mot-clé.
Comment fonctionne le Keyword Planner
Google ne donne pas le nombre exact de recherches. Il fournit :
- Des fourchettes larges pour les comptes sans dépenses publicitaires actives : « 1K-10K », « 10K-100K », etc. Ces fourchettes sont tellement larges qu'elles sont quasi inutiles pour le SEO.
- Des volumes plus précis pour les comptes avec des campagnes actives, mais toujours arrondis (100, 140, 170, 210, 260, 320, 390, 480, 590, 720, 880, 1000, 1300…). Ce sont des paliers fixes, pas des chiffres exacts.
- Des données agrégées par mois : le volume affiché est une moyenne mensuelle calculée sur les 12 derniers mois, ce qui lisse complètement la saisonnalité.
Le regroupement de variantes
Un point crucial que beaucoup ignorent : Google regroupe les variantes proches sous un même volume. Par exemple, « chaussure running », « chaussures running » et « chaussures de running » affichent souvent le même volume dans le Keyword Planner, parce que Google les considère comme la même intention de recherche.
Conséquence directe : le volume affiché pour un mot-clé peut inclure celui de dizaines de variantes. Vous ne savez pas quelle part du volume revient à la formulation exacte que vous ciblez.
Les limites du GKP pour le SEO
- Conçu pour les annonceurs, pas pour les référenceurs : les volumes sont calibrés pour planifier des budgets publicitaires, pas pour prédire le trafic organique
- Aucune donnée sur les SERP features : le volume ne tient pas compte des featured snippets, des People Also Ask ou des résultats locaux qui réduisent le CTR organique
- Volumes statiques : la moyenne sur 12 mois masque les tendances et la saisonnalité
- Seuil minimum : les mots-clés avec très peu de recherches sont affichés à 0 ou à 10
Clickstream data : la deuxième source majeure
Pour compléter (ou remplacer) les données du Keyword Planner, les outils SEO utilisent massivement le clickstream data. C'est un concept central qu'il faut comprendre pour interpréter les volumes.
Qu'est-ce que le clickstream ?
Le clickstream désigne les données de navigation collectées auprès de panels d'utilisateurs. Ces utilisateurs acceptent (souvent sans le réaliser) de partager leur activité de navigation via :
- Des extensions de navigateur : certaines extensions gratuites (barres d'outils, bloqueurs de publicité, VPN gratuits) collectent l'historique de navigation en échange de leur gratuité
- Des applications mobiles : des apps gratuites (VPN, gestionnaires de batterie, etc.) qui trackent l'activité web
- Des FAI partenaires : certains fournisseurs d'accès internet revendent des données de navigation anonymisées
Les principaux fournisseurs de clickstream
Plusieurs entreprises se sont spécialisées dans la collecte et la revente de clickstream data :
- Jumpshot (fermé en 2020) : filiale d'Avast, collectait via l'antivirus. C'était le plus gros panel mondial. Sa fermeture a provoqué un séisme dans l'industrie SEO
- SimilarWeb : possède son propre panel de millions d'utilisateurs, complété par des partenariats FAI
- Datos (anciennement SimilarWeb Data) : fournisseur tiers utilisé par plusieurs outils SEO
- Panels propriétaires : certains outils comme Semrush et Ahrefs ont constitué leurs propres panels complémentaires
Comment fonctionne l'extrapolation
Un panel clickstream représente une fraction infime des internautes (typiquement 0,5 à 2 % de la population d'un pays). Pour estimer le volume total, les outils utilisent l'extrapolation statistique :
- Observation : sur un panel de 2 millions d'utilisateurs en France, 150 ont cherché « meilleur outil SEO » ce mois-ci
- Pondération : le panel est corrigé pour refléter la démographie réelle (âge, localisation, appareil, habitudes de navigation)
- Extrapolation : si le panel représente 3 % des internautes français, on multiplie par ~33 pour obtenir une estimation nationale
- Croisement : le résultat est croisé avec les données du Keyword Planner pour calibrer l'estimation
Le problème : chaque panel a un biais différent. Un panel constitué via un VPN gratuit surreprésente les utilisateurs soucieux de leur vie privée. Un panel via un antivirus surreprésente les utilisateurs moins techniques. L'extrapolation amplifie ces biais.
Méthodes de lissage et de traitement des données
Les outils SEO ne se contentent pas de croiser GKP + clickstream. Ils appliquent des traitements statistiques pour lisser les données et produire un chiffre « propre ».
Moyennes mobiles
Plutôt que d'afficher le volume brut du dernier mois (trop volatile), les outils calculent une moyenne mobile sur 6 à 12 mois. Cela élimine les fluctuations ponctuelles mais masque les tendances récentes. Un mot-clé dont le volume explose depuis 2 mois affichera encore un volume « moyen » bas.
Désaisonnalisation
Certains outils tentent de corriger la saisonnalité. Par exemple, « cadeau Noël » a un pic énorme en novembre-décembre et quasi zéro en été. Afficher la moyenne annuelle (disons 30 000/mois) est trompeur : le volume réel est de 200 000 en décembre et de 1 000 en juillet.
Chaque outil gère la saisonnalité différemment :
- Semrush affiche une moyenne nationale sur 12 mois, avec une tendance saisonnière visible dans le graphique
- Ahrefs propose le volume mensuel moyen et une estimation de la plage basse/haute
- Ubersuggest affiche le volume moyen sans toujours distinguer clairement la saisonnalité
Corrections de panel
Après la fermeture de Jumpshot en 2020, de nombreux outils ont dû changer de source clickstream ou renforcer leurs propres panels. Cela a causé des variations brutales dans les volumes affichés — sans que les volumes réels de recherche aient changé. Un rappel que ces chiffres sont des estimations, pas des mesures.
Pourquoi les volumes diffèrent entre outils : les 5 causes
Maintenant que vous comprenez les sources et les méthodes, voici les 5 raisons concrètes qui expliquent les écarts.
1. Des sources de données différentes
Semrush utilise ses propres panels clickstream + GKP. Ahrefs combine clickstream propriétaire + données de partenaires. Ubersuggest s'appuie principalement sur le GKP. Des sources différentes produisent des estimations différentes.
2. Des panels de tailles et de compositions différentes
Un panel de 5 millions d'utilisateurs n'a pas la même précision qu'un panel de 500 000. Et deux panels de même taille mais composés différemment (géographie, âge, comportement) donneront des résultats différents après extrapolation.
3. Des fréquences de mise à jour différentes
Certains outils mettent à jour leurs volumes mensuellement, d'autres trimestriellement. Quand vous consultez un volume, il peut dater de 1 mois chez l'un et de 3 mois chez l'autre. Pour les mots-clés saisonniers ou les tendances émergentes, l'écart est significatif.
4. Des algorithmes de lissage différents
Moyenne mobile sur 6 mois vs 12 mois, prise en compte ou non de la saisonnalité, méthode de pondération du panel… Chaque choix algorithmique influe sur le résultat final. Deux outils avec les mêmes données brutes peuvent afficher des volumes différents simplement parce qu'ils les traitent différemment.
5. Le traitement différent du regroupement de variantes
Certains outils dédupliquent les variantes (comme le fait Google), d'autres affichent un volume par variante exacte. Ahrefs, par exemple, a longtemps dégroupé les variantes pour donner un volume plus granulaire, alors que d'autres restent alignés sur le regroupement GKP.
Cas concrets : comparaison sur des mots-clés réels
Pour illustrer ces écarts, voici des exemples typés de divergences entre outils sur un même mot-clé.
| Mot-clé | Google Keyword Planner | Semrush | Ahrefs | Ubersuggest |
|---|---|---|---|---|
| outil SEO gratuit | 1K – 10K | 2 900 | 3 500 | 2 400 |
| audit SEO site web | 100 – 1K | 720 | 550 | 480 |
| suivi position Google | 100 – 1K | 390 | 250 | 320 |
| comment améliorer son SEO | 1K – 10K | 1 600 | 1 900 | 1 300 |
Note : ces chiffres sont des exemples illustratifs représentatifs des écarts typiquement observés entre outils. Les volumes réels fluctuent dans le temps.
Plusieurs constats :
- Le GKP est trop vague : une fourchette « 1K-10K » ne permet aucune décision
- Les outils payants diffèrent entre eux de 20 à 50 % sur la plupart des mots-clés
- Aucun ne détient la vérité absolue : ce sont tous des estimations
- Les écarts sont plus importants sur les petits volumes : sur un mot-clé à 200 recherches/mois, un écart de 40 % est courant
Les limites majeures des volumes de recherche estimés
Au-delà des écarts entre outils, les volumes de recherche estimés présentent des limites structurelles qu'il faut connaître.
Les mots-clés longue traîne à volume « 0 »
Le problème le plus criant. De très nombreux mots-clés longue traîne affichent un volume de 0 dans tous les outils. Pourtant, ils génèrent bien du trafic. Explication :
- Le GKP ne détecte pas les requêtes en dessous d'un certain seuil (~10 recherches/mois)
- Le clickstream est trop petit pour capturer les requêtes rares : si aucun utilisateur du panel n'a tapé la requête, elle n'existe pas dans les données
- Le regroupement de variantes absorbe la longue traîne dans des volumes de mots-clés plus génériques
Or, selon Google lui-même, 15 % des recherches quotidiennes n'ont jamais été vues auparavant. La longue traîne représente souvent 60 à 80 % du trafic organique d'un site. Se fier uniquement aux volumes estimés, c'est ignorer la majorité de son potentiel.
Le regroupement de variantes par Google
Comme vu plus haut, Google regroupe les variantes proches. Mais ce regroupement est opaque et imprévisible :
- Certaines variantes qui semblent proches sont traitées séparément
- D'autres variantes éloignées sont regroupées
- Le regroupement peut changer dans le temps sans préavis
Conséquence : le volume d'un mot-clé peut varier d'un mois à l'autre non pas parce que les recherches changent, mais parce que Google a modifié son regroupement.
Volume ≠ trafic potentiel
Un mot-clé avec un volume de 10 000 recherches/mois ne vous apportera pas 10 000 visites, même en première position. Les SERP features (featured snippets, People Also Ask, Knowledge Panels, publicités) captent une part croissante des clics. Sur certaines requêtes, le taux de clic zéro (l'utilisateur obtient sa réponse sans cliquer) dépasse 50 %.
Le volume de recherche est un indicateur de demande, pas une prévision de trafic.
Ce qu'il faut retenir sur les volumes de recherche
Ce que les volumes font bien
- Donner un ordre de grandeur de la demande
- Comparer des mots-clés entre eux au sein du même outil
- Identifier les tendances générales
- Prioriser les mots-clés à fort potentiel
Ce que les volumes font mal
- Prédire le trafic réel que vous obtiendrez
- Capturer la longue traîne (souvent à 0)
- Être cohérents d'un outil à l'autre
- Refléter la saisonnalité en temps réel
L'approche de SEO Pilote : des données réelles au lieu d'estimations
Face à toutes ces limites, SEO Pilote adopte une approche radicalement différente : plutôt que d'estimer des volumes de recherche, il exploite les données réelles de votre Google Search Console.
Impressions réelles au lieu de volumes estimés
En se connectant directement à la GSC via OAuth2, SEO Pilote récupère les impressions réelles de chaque mot-clé sur votre site. Une impression signifie qu'un utilisateur a effectivement vu votre résultat dans Google pour cette requête. C'est une mesure directe, pas une estimation extrapolée à partir d'un panel.
Avantage majeur : vous voyez les mots-clés longue traîne qui génèrent des impressions, même ceux que tous les outils affichent à volume 0.
Clics réels au lieu de trafic prédit
Les outils qui estiment le trafic à partir du volume et d'un CTR théorique se trompent souvent. SEO Pilote affiche directement le nombre de clics réels depuis Google. Vous savez exactement combien de visiteurs chaque mot-clé génère.
CTR et position réelle
Au lieu de deviner votre position avec un rank tracker (qui peut varier selon la géolocalisation, l'appareil et la personnalisation), vous obtenez la position moyenne réelle telle que reportée par Google lui-même, ainsi que le CTR réel de chaque mot-clé.
Suivi d'évolution et détection de problèmes
SEO Pilote vous permet de comparer deux périodes pour détecter automatiquement :
- Les progressions et régressions de positions
- Les mots-clés qui entrent ou sortent du classement
- La cannibalisation (plusieurs pages sur le même mot-clé)
- Les opportunités de quick wins (position 5-15, beaucoup d'impressions)
L'outil génère également des rapports IA automatiques (rapport consultant et rapport client) qui analysent vos données et produisent un plan d'action concret.
Pourquoi cette approche est plus fiable
| Critère | Outils classiques (Semrush, Ahrefs…) | SEO Pilote (données GSC) |
|---|---|---|
| Source de données | GKP + clickstream (estimations) | Google Search Console (données réelles) |
| Couverture longue traîne | Souvent à 0 | Tous les mots-clés avec ≥ 1 impression |
| Trafic réel | Estimé (volume × CTR théorique) | Clics réels mesurés |
| Position | Scraping / rank tracker | Position moyenne reportée par Google |
| Fréquence de mise à jour | Mensuelle à trimestrielle | À chaque import (vous choisissez) |
| Coût | 99 à 449 €/mois | 99€ HT/an |
Travaillez avec des données réelles, pas des estimations
SEO Pilote se connecte à votre Google Search Console et vous donne les impressions, clics et positions réelles de chaque mot-clé. Fini les écarts entre outils. Testez pendant 7 jours gratuitement.
Questions fréquentes
Semrush et Ahrefs utilisent des sources de données différentes (Google Keyword Planner, clickstream, panels propriétaires) et des algorithmes de lissage distincts. Chaque outil extrapole à partir de son propre échantillon, ce qui produit des estimations différentes pour un même mot-clé. Les écarts de 20 à 50 % sont courants et normaux.
La source primaire est le Google Keyword Planner, complétée par des données clickstream provenant de panels d'utilisateurs (extensions de navigateur, applications mobiles, VPN gratuits). Les outils combinent ces deux sources avec des modèles statistiques pour produire leurs estimations de volume mensuel.
Le clickstream data désigne les données de navigation collectées auprès de panels d'utilisateurs volontaires (via des extensions de navigateur, des VPN gratuits ou des applications mobiles). Ces données permettent de savoir quelles requêtes les utilisateurs tapent dans Google et sur quels résultats ils cliquent. Les outils SEO extrapolent ces données à l'ensemble de la population pour estimer les volumes de recherche.
Google Keyword Planner regroupe les variantes proches sous un même mot-clé principal et arrondit les volumes en fourchettes larges. Les requêtes très spécifiques tombent sous le seuil de détection et sont affichées à 0, même si elles génèrent quelques recherches par mois. Les panels clickstream, trop petits, ne captent pas non plus ces requêtes rares.
Non. SEO Pilote se connecte directement à la Google Search Console et exploite les données réelles : impressions, clics, CTR et positions. Au lieu de se baser sur des estimations de volume, vous travaillez avec les données de performance réelles de votre site dans Google. C'est plus fiable et cela couvre la longue traîne que les autres outils ignorent.