Rel Canonical : ce que c’est et comment suggérer des URL canoniques à Google

Rel Canonical : ce que c’est et comment suggérer des URL canoniques à Google

Il arrive qu'une page Web soit accessible à l'aide de plusieurs URL ou qu'un site comporte plusieurs pages au contenu similaire (cas typique des versions desktop et mobile, par exemple) : dans ces situations, Google peut avoir du mal à comprendre quel contenu est prioritaire et doit décider de la version à afficher dans la recherche, en tenant compte de toutes les autres versions dupliquées de cette page.

Rel Canonical : ce que c'est et comment suggérer des URL canoniques à Google
Rel Canonical : ce que c'est et comment suggérer des URL canoniques à Google

À partir de là, nous devrions déjà comprendre pourquoi la canonisation est importante, c'est-à-dire le système permettant de signaler au moteur de recherche la priorité d'une URL à partir d'un ensemble de pages au contenu identique ou presque identique, et pourquoi rel canonical est crucial, l'élément de balise avec lequel nous pouvons communiquer concrètement notre choix à Google (qui peut ne pas l'accepter, comme nous le verrons) et suggérer correctement les URL canoniques.

Metadosi optimise votre contenu dupliqué

Nos spécialistes analyse et trouve vos URL dupliquées pour mettre en place des URL canoniques

Qu’est-ce que la balise Rel canonical ?

La balise canonical, rel canonical ou canonical link est un attribut spécifique qui est inséré manuellement dans le code HTML d'une page afin de spécifier une caractéristique prioritaire et d'indiquer aux moteurs de recherche que cette URL spécifique représente la copie principale d'une page, sa version originale et définitive par rapport aux autres pages dupliquées, presque dupliquées et similaires.

L'extrait rel=canonical est un attribut de la balise de lien qui indique aux moteurs de recherche quelle est, parmi les différents contenus similaires disponibles, l'URL la plus représentative pour indexer un site. En pratique, cette commande peut être utilisée pour définir une seule URL comme version canonique, en demandant aux robots d'explorer cette page en premier, tandis que toutes les autres URL similaires sont considérées comme des URL dupliquées et explorées moins fréquemment.

A quoi ressemble la balise rel=canonical

Les balises canoniques utilisent une syntaxe simple et cohérente et sont placées dans la section d'une page Web ; elles ressemblent essentiellement à ceci

<link rel=“canonical” href=“https://example.com/sample-page/” />

et chaque partie de ce code a une signification. Pour être précis, la première partie [link rel="canonical"] est la suggestion, l'indication de la balise, tandis que la seconde partie [href="https://example.com/sample-page/"] indique spécifiquement l'URL que nous voulons signaler comme la version canonique principale de la page.

A quoi ressemble la balise rel canonical
A quoi ressemble la balise rel canonical

Ce que signifie la canonisation et ce que sont les URL canoniques

La canonisation est le processus qui consiste à sélectionner la page et les URL considérées comme prioritaires pour un site particulier, ce qui permet de résoudre tout problème de redondance, c'est-à-dire de duplication de contenu sur différentes URL.

Le terme dérive du latin canon (adopté plus tard également en italien), qui signifie essentiellement règle ou critère à adopter, et donc canonique signifie qu'il est conforme à ce principe.

Puisqu'il est question de définitions, il s'ensuit que nous appelons URL canonique la version de la page que Google considère comme la plus représentative parmi un ensemble de pages dupliquées sur le même site, qui devient la source principale pour évaluer le contenu et la qualité fournis.

Canonical et SEO : pourquoi il est important de signaler l’URL canonique

L'utilisation efficace de la rel canonical permet tout d'abord d'éviter la présence de contenu dupliqué aux yeux de Google, qui peut nuire au classement d'un site web sur les moteurs de recherche, en provoquant l'effet bien connu de la cannibalisation des mots-clés ou, plus précisément encore, de l'URL, une situation qui se produit lorsque le moteur de recherche reconnaît plusieurs pages au contenu similaire - ou, pour mieux dire, un site offre des informations ambiguës au crawler et ne lui facilite pas la tâche pour comprendre quelle est la page principale à crawler et éventuellement à classer ; En outre, si la présence de contenu dupliqué sur plusieurs URL est très fréquente, le moteur de recherche peut également pénaliser le site pour spam.

Par conséquent, la définition de l'attribut rel = canonical et la vérification de la consolidation des signaux par la normalisation des URL et des pratiques de liens internes peuvent également nous aider à faire en sorte que les moteurs de recherche dirigent les utilisateurs vers les pages souhaitées, avec des avantages pour le référencement.

Cependant, la canonicalisation est également utile à Google et aux moteurs de recherche, car elle évite aux robots d'exploration de devoir explorer les mêmes éléments à plusieurs reprises. En effet, Google ne veut pas effectuer inutilement plusieurs explorations ou rendus, ni servir le même contenu proposé dans différentes URL, car cela ne constituerait pas de bons résultats de recherche.

Les principaux faux mythes sur la canonisation

Ce thème a également fait l'objet d'un épisode de SEO Mythbusting season 2, la série YouTube de Google sur les principaux "faux mythes" du référencement, qui a clarifié certains aspects controversés de la canonisation, en précisant tout d'abord qu'il ne s'agit pas d'un regroupement par thème, mais d'un système permettant de hiérarchiser une URL parmi un ensemble de pages au contenu identique ou presque, afin de réduire la duplication.

À cette occasion, l'invité et interlocuteur de l'animateur Martin Splitt était Rachel Costello (consultante en référencement technique chez Builtvisible et ancienne responsable du référencement technique et du contenu chez DeepCrawl, poste qu'elle occupait au moment de l'inscription), qui raconte comment, d'après son expérience, les faux mythes sur ce sujet incluent des doutes quant à savoir si la canonicalisation est un signal ou une directive, si elle peut être utilisée comme une redirection et encore les préférences du site par rapport aux préférences de l'utilisateur et plus encore.

Splitt et Costello parlent de la canonisation

En particulier, il existe deux grandes idées fausses sur la canonisation : premièrement, "les gens pensent qu'il s'agit d'une directive, définissez une balise canonique et elle sera acceptée". En réalité, canonical est une suggestion HTML qu'un site peut définir pour indiquer au moteur de recherche quelle est l'URL principale à utiliser pour une page/contenu.

Un autre cas fréquent de méprise est l'utilisation de la canonicalisation comme redirection : "Si vous avez une page produit qui n'est pas disponible, ajoutez un canonical à cette page catégorie", dit l'expert, ajoutant que "cela ne fonctionne pas vraiment de cette façon", car "les contenus doivent être identiques ou presque", comme le confirme Martin Splitt.

Les explications de Google sur les rel canonical

Tout d'abord, il ne s'agit pas d'une directive - c'est-à-dire d'une instruction que les moteurs de recherche sont tenus de respecter - mais d'un signal, c'est-à-dire d'un indice, d'une suggestion, qui aide les moteurs de recherche à comprendre ce que nous voulons canoniser (ce à quoi nous voulons donner de l'importance et de la priorité dans la recherche), mais que les moteurs de recherche peuvent eux-mêmes décider d'utiliser ou non.

La canonisation n'est pas une directive

Lorsque nous parlons de canonicalisation, explique M. Splitt, "nous parlons de détecter le même contenu ou un contenu très similaire qui existe sur différentes adresses et différentes URL", et Google peut "faire beaucoup de choses différentes pour identifier ces choses". Par exemple, il peut simplement explorer plusieurs pages et vérifier qu'elles traitent du même contenu, ou voir si les URL utilisent les mêmes liens et le même type de contexte, ou simplement utiliser la balise canonique.

En d'autres termes, il faut comprendre que Google utilise de nombreux signaux différents pour "comprendre si quelque chose a le même contenu ou non", et la canonisation par le biais de la balise canonique n'est que l'un d'entre eux. Pour qu'elle soit efficace, il est toutefois nécessaire de bien paramétrer la balise canonique : cela ne fonctionnera pas de " la mettre sur des pages qui n'ont pas le même contenu, mais il n'est pas bon non plus de la mettre sur chaque page identique ".

Comment signaler la canonisation

Utiliser correctement la canonicalisation d'une page évite de laisser à Googlebot le soin de décider quelle est la meilleure page à afficher dans les résultats de recherche : outre la balise spécifique, il existe, comme mentionné ci-dessus, d'autres signaux que Google prend en compte pour combiner les URL au contenu similaire et opérer une déduplication.

Il s'agit notamment des redirections entre les pages, des liens internes, des liens sortants, des indications dans les sitemaps, des hreflang, des URL propres ou raccourcies.

Le miroir canonique de Google

Canonicalisation et redirections, théories et réalités du référencement

Il ne faut pas non plus utiliser la balise canonique pour effectuer une redirection, prévient M. Splitt, car elle ne sert pas de redirection, bien qu'il y ait souvent confusion sur cet aspect. C'est ce que confirme Rachel Costello, qui dit avoir remarqué que les gens s'efforcent de regrouper l'équité des liens en un seul endroit et sur une seule page, et utilisent ensuite le canonical comme une tentative désespérée d'atteindre cet objectif.

Il s'agit là d'une autre erreur, car, comme le répète Martin Splitt, la canonisation n'entre en jeu et n'a de sens que lorsque "vous croisez le même contenu sur différentes plateformes ou canaux à des endroits légèrement différents, quelle que soit la raison pour laquelle vous le faites".

Mais, dans le cas de produits en rupture de stock ou indisponibles, il suffit de faire une redirection "vers quelque chose de similaire qui a du sens pour l'utilisateur à ce moment-là", ou de mettre la page en erreur 404 pour indiquer à Google que "c'est la situation actuelle mais que cela pourrait revenir".

Dans le domaine du référencement, il existe en fait quelques théories invitant à l'utilisation d'une redirection des ressources dupliquées vers l'URL préférée : la redirection 301 transmet en effet des liens d'équité à la page de destination, tandis qu'il n'existe pas de positions officielles sur les balises canoniques. Cependant, face à cet avantage hypothétique, la technique pose quelques doutes, notamment en termes de convivialité et d'expérience utilisateur : avec les redirections, les pages dupliquées sont éliminées, car l'utilisateur est automatiquement transféré vers l'autre ressource et, pour lui (et les crawlers), l'autre page n'existe pas.

Au contraire, rel canonical facilite la vie du robot d'exploration (qui lit le paramètre et analyse les URL comme décrit), tandis qu'en termes pratiques, les utilisateurs peuvent visiter toutes les URL, même celles qui ne sont pas canoniques.

Pour ceux qui souhaitent en savoir plus sur ce sujet, nous vous renvoyons à l'une des leçons de notre Académie avec le conférencier invité Filippo Jatta, qui a traité des méthodes de communication avec Google à travers des indications telles que Canonical, Noindex et Redirect ; pour voir la vidéo, il suffit de s'inscrire gratuitement à l'Académie SEOZoom et de se connecter.

Canonicalisation et gaspillage de budget de crawl

Il est important de faire attention à l'utilisation correcte de la balise canonique, sinon on risque de gaspiller le budget de crawl.

Si nous avons des pages identiques et que nous n'avons pas mis en place (ou que nous l'avons mal fait, ou que nous avons souvent inversé la page choisie) la canonicalisation, Googlebot recommencera à explorer tout le contenu d'une manière inutile et préjudiciable pour l'économie du site, ce qui augmentera également sa charge d'exploration par Google.

Il est encore pire d'utiliser la méthode canonique comme redirection, car dans ce cas, le moteur de recherche est confronté à des pages marquées comme identiques, mais qui ne le sont pas en réalité, et il continuera donc à les explorer toutes.

Duplication et déduplication, les signaux pour Google

La vidéo aborde ensuite les facteurs techniques que Google prend en compte lors de la déduplication des contenus d'un même site : il s'agit de signaux automatiques car le travail de duplication et de déduplication se fait "sans beaucoup d'interaction humaine", explique M. Splitt, mais "Google apprécie l'empreinte du contenu" et essaie de comprendre "quelle est l'essence, quelle est l'information, comment elle est liée à la structure du site, ce qui est écrit dans le sitemap ; en bref, nous sommes confrontés à une série de facteurs différents, principalement techniques".

Dans la pratique, Google procède à des notations en continu, de sorte qu'il ne détermine pas ces questions une seule fois et s'en tient toujours à la même décision : "Nous examinons toujours le contenu frais issu du crawling, puis nous examinons la page - ceci a changé, ceci a changé, maintenant elle est très proche de la version précédente, maintenant quelque chose qui était une duplication n'est plus une duplication, parce que le contenu a été modifié".

Parfois, poursuit M. Splitt, "surtout lorsque presque tout est présenté dans la même structure URL et qu'il s'agit de versions linguistiques différentes d'un même produit, mais avec le même contenu, nous pouvons nous retrouver avec un score très similaire". Si Google voit deux versions, "disons une 0.49 et une 0.51 de ce que nous pensons être un duplicata de l'autre, alors il est vraiment difficile de choisir laquelle sera la page canonique".

Pour compliquer encore plus les choses, la situation peut changer : Google peut crawler d'une manière différente, ou changer la façon dont le crawler récupère les données, et même les pages touchées avant peuvent affecter " avoir une sorte de saut entre ces deux chiffres ".

Et puis il y a le canonical : un signal clair pour aider les moteurs de recherche et ne pas embrouiller les algorithmes engagés dans la compréhension de ce qu'est la duplication entre les contenus analysés. "Car si nous avons deux contenus identiques, comment savoir lequel choisir ?", résume Martin Splitt.

Canonisation et contenu unique

Un autre aspect étudié par cet épisode concerne la quantité de contenu unique sur une page qui est nécessaire pour que Google l'accepte comme une version canonique. Selon M. Splitt, même une petite quantité de contenu original qui n'existe pas sur d'autres pages peut être suffisante.

Cependant, "si le contenu est complètement différent ou suffisamment différent pour que les algorithmes décident qu'il ne s'agit pas d'un duplicata, alors le canonical est inutile", explique le Googler.

Google et le canonical : le moteur de recherche peut choisir une page différente

Cependant, malgré ces indications, Google peut parfois prendre une décision différente et remplacer la page canonique préférée du site par une autre qui est meilleure pour les utilisateurs.

Une autre voix publique de Mountain View (et souvent invitée sur notre blog), John Mueller, en parle en profondeur, répondant dans l'un des événements #AskGoogleWebmasters à une question posée par un utilisateur (@uale75, l'Italienne Mariachiara Marsella) : "Vous pouvez indiquer votre préférence à Google en utilisant diverses techniques, mais Google peut choisir comme canonique une page différente de celle que vous avez définie, pour diverses raisons. Quelles en sont donc les raisons ?", demande le cofondateur de BEM Research.

L'explication de John Mueller commence par les bases : il est courant qu'un site ait plusieurs URL uniques traitant du même sujet, et il cite des cas courants tels que ceux d'un site avec une version WWW et une version non-WWWW présentant le même contenu, d'une page d'accueil accessible en ajoutant /index.html, ou de pages vers lesquelles sont dirigées des versions d'URL utilisant des lettres minuscules et majuscules.

Définition de l’URL canonique

La situation idéale pour Google est de ne pas rencontrer ces versions alternatives, c'est pourquoi il est conseillé de choisir un format d'URL et de l'utiliser systématiquement sur le site web. Pour le système de recherche Google, cela n'a pas de sens d'indexer et d'afficher toutes ces versions de pages pointant vers le même contenu. Google essaie donc d'en sélectionner et de se concentrer sur une seule.

Il s'agit précisément de l'URL canonique, qui peut être indiquée par le webmaster ou choisie automatiquement par le moteur de recherche. Plus précisément, comme le dit le guide officiel exhaustif, Googlebot choisit la page qu'il considère comme la plus complète et la plus utile et la marque comme canonique.

Canonicalisation selon Google

Il existe deux directives que l'algorithme suit pour sélectionner une URL canonique :

  • Quelle URL ressemble à celle que le site veut utiliser, c'est-à-dire quelle est la préférence du site.
  • Quelle URL est la plus utile pour les utilisateurs.
Paramètres de Google sur les fichiers canoniques
Paramètres de Google sur les fichiers canoniques

En ce qui concerne la préférence du site, Google prend en compte différents paramètres, tels que l'annotation rel canonical link que les responsables du site peuvent utiliser, mais aussi les redirections, les liens internes, l'URL insérée dans le sitemap, la présence du protocole HTTPS (préféré à l'ancien HTTP), jusqu'à un critère pour ainsi dire esthétique. En d'autres termes, M. Mueller affirme que Google évalue également quelle URL semble être la plus jolie du point de vue de la structure et de la forme.

Evaluations pour consolider les URLs

Le système du moteur de recherche prend en compte tous ces facteurs pour chaque URL canonique potentielle et décide de la version à canoniser, en analysant celle qui combine le mieux les paramètres.

Ainsi, selon Search Advocate, "si vous êtes propriétaire d'un site et que vous avez une préférence marquée pour les URL que vous voulez montrer aux utilisateurs dans les recherches, vous devez d'abord vous assurer que vous utilisez ces préférences de manière cohérente sur votre site web", conseille M. Mueller.

Méthodes de déclaration de la canonisation

Sur un plan théorique et dans une situation idéale, "les moteurs de recherche ne devraient rencontrer aucune de ces alternatives : si vous avez une préférence, tenez-vous en à celle-ci", ajoute le Googler. À part cela, et pour revenir au monde réel, pour limiter les problèmes, vous devez vous assurer qu'un site a tous ces facteurs de canonisation alignés de manière similaire : que les liens internes utilisent le format d'URL préféré, que le sitemap ne liste que les URL préférées, que les éléments de liens canoniques rel sont assortis.

Comment définir des éléments canoniques sur votre site
Comment définir des éléments canoniques sur votre site

Plus vous serez cohérent, plus il y a de chances que les systèmes de Google suivent vos instructions et choisissent vos URL préférées comme canoniques.

Que se passe-t-il lorsque Google définit une autre URL canonique

Mais que se passe-t-il dans le cas contraire, lorsque Google choisit une autre URL ?

Un cas possible est, par exemple, celui de contenus identiques dans différentes langues : s'il existe une balise canonique pointant vers la version anglaise d'une page, mais que l'utilisateur se trouve en Allemagne, Google affichera la version allemande de la page.

Ces situations n'ont d'impact, comme vous le notez, que sur l'URL affichée dans les résultats de recherche de Google et, selon John Mueller, "si nos systèmes choisissent une URL différente comme canonique, elle sera classée de la même manière dans les résultats de recherche".

Ainsi, "au final, tout dépend de votre jugement : si vous avez des préférences en matière d'URL, indiquez-les aux moteurs de recherche sans risque d'erreur, mais vous pouvez aussi laisser Google choisir". En outre, s'il arrive que le moteur de recherche choisisse une autre URL, "cela n'aura pas d'effet négatif sur le site", rassure M. Mueller.

Canonical et duplication de pages

Le contenu dupliqué est un problème qui peut toucher tous les sites, bien qu'il soit généralement plus fréquent pour les sites de commerce électronique. Tout d'abord, rappelez-vous que pour un moteur de recherche, chaque URL unique représente une page unique, et que la même page d'accueil peut être accessible à partir de différents chemins (avec ou sans www, avec ou sans HTTPS, avec l'ajout de /index.php et ainsi de suite) et devenir une page unique pour les crawlers.

Le phénomène est encore plus évident lors de l'ajout automatique de balises, qui créent plusieurs chemins et URL pour atteindre le même contenu et multiplient les paramètres d'URL pour les recherches, le tri, les options de devise, etc.

Duplication d'URL pour le e-commerce

La situation risque de devenir critique surtout pour les sites de commerce électronique, où un seul produit peut potentiellement être atteint à partir de plusieurs pages différentes en fonction du parcours de consultation des utilisateurs (s'ils cliquent à partir de bannières promotionnelles sur la page d'accueil, s'ils choisissent de trier par prix et ainsi de suite). Sans relation canonique, tous les liens vers ces pages sont divisés plutôt que consolidés, ce qui génère du contenu dupliqué pour les robots d'exploration.

Raisons valables pour avoir des pages similaires ou dupliquées

Cependant, Google indique clairement qu'il existe des raisons valables pour lesquelles un site peut avoir différentes URL pointant vers la même page, ou des pages dupliquées ou très similaires pointant vers différentes URL.

Parmi les situations les plus courantes, le guide signale les usages :

Pour prendre en charge plusieurs types de dispositifs (généralement des ordinateurs de bureau et des téléphones mobiles) :
https://exemple.com/actualites/dechainement-koala

Pour activer les URL dynamiques pour des éléments tels que les paramètres de recherche ou les ID de session :
https://www.exemple.com/products?category=robes&color=vert

Si le système de blog enregistre automatiquement plusieurs URL lorsque le même article est saisi dans plusieurs sections :
https://blog.exemple.com/robe/les-robes-vertes-sont superbes/

Si le serveur est configuré pour publier le même contenu pour les variantes www/non-www et/ou http/https :
http://exemple.com/robes-vertes

http://www.exemple.com/robes-vertes

Si le contenu proposé dans un blog pour être diffusé en syndication sur d'autres sites est copié en partie ou en totalité sur ces domaines :
https://actus.exemple.com/robes-vertes-pour-tous-les-jours-155672.html (billet distribué en syndication)

https://blog.exemple.com/robes/les-robes-vertes-sont-superbes/3245/ (message original)

L’importance SEO des rel canonical sur les URLs

D'après ce qui a été écrit ci-dessus, vous devriez comprendre la valeur de la canonisation et l'importance d'utiliser précisément les balises rel canonical sur les URL de votre site : cette technique permet de définir la priorité de la page pour les crawlers (ce qui vous protège d'une éventuelle pénalisation du contenu dupliqué sur les moteurs de recherche) et garantit que les utilisateurs de la recherche arrivent à chaque fois sur la bonne page.

Il est toutefois vrai que les moteurs de recherche essaient de déterminer quelle page parmi les variantes disponibles pourrait être la page canonique, mais le processus ne fonctionne pas toujours de manière optimale et, par conséquent, du point de vue du référencement, il est toujours préférable de définir une URL canonique en cas de doute.

Google et les URL canoniques

Parmi les outils de Google, il existe également des outils spécifiques permettant de suggérer des URL canoniques pour les pages du site, ainsi que de vérifier si les indications ont été correctement saisies. Par exemple, si vous craignez de ne pas avoir sélectionné la meilleure URL canonique pour votre contenu, vous pouvez vérifier l'adresse de la page avec l'outil d'inspection des URL de la Search Console, qui affichera la canonicisation sélectionnée par Google.

Toutefois, lorsqu'ils sont confrontés à plusieurs copies d'une page sur un même site, les systèmes de Google doivent faire un choix et prendre en compte divers paramètres pour décider quelle est la page canonique : l'un des aspects qui peut faire la différence, comme l'a révélé John Mueller, est la longueur de l'URL, car "une URL plus courte et plus propre" a plus de chances d'être interprétée comme canonique qu'une adresse plus longue et plus complexe, comportant peut-être de nombreux slashs.

Google a supprimé l'info commande

L'outil de contrôle des URL a également été mis à jour au fil du temps et affiche désormais tous les canoniques sélectionnés par Google pour une URL, et non plus seulement ceux des propriétés gérées dans la Search Console ; parallèlement, Google a annoncé il y a quelques années le retrait de "info:command", la commande info qui était une manière alternative de découvrir les canoniques, mais qui était considérée comme peu utilisée et moins complète que le nouveau système.

A quoi a servi la commande info

En tapant la commande "info" dans la barre du moteur de recherche avant un domaine, Google affiche la liste des URL canoniques pour ce site spécifique. En effet, jusqu'en 2017, la commande info n'affichait pas seulement les URL canoniques, mais aussi les liens vers le cache, les pages similaires, les liens et autres informations, possibilités qui ont été supprimées il y a plus de cinq ans.

Désormais, pour connaître les URL canoniques, il faut utiliser la Search Console et l'outil URL Control (et donc effectuer un accès vérifié), et il n'y a plus de possibilité de vérifier les informations dans la barre de recherche publique de Google.

Quand et pourquoi utiliser la Rel canonical

Le guide de Google sur la résolution du contenu dupliqué nous permet de comprendre quand utiliser Rel Canonical : si plusieurs pages ont le même contenu, si elles sont optimisées pour les mêmes mots clés (et donc en concurrence les unes avec les autres), si elles ont certaines propriétés similaires comme les balises méta, les titres ou les liens dans le contenu.

Plus précisément, une page canonique doit être expressément choisie parmi un ensemble de pages dupliquées ou similaires dans ces situations et avec ces objectifs :

  • Pour spécifier l'URL à afficher dans les résultats de recherche. Par exemple, si nous préférons que les utilisateurs atteignent la page sur les vêtements verts via https://www.exemple.com/robes/vert/robesvertes.html au lieu de https://exemple.com/robes/cocktail?gclid=ABCD.
  • Pour regrouper les indicateurs associés aux liens vers des pages similaires ou dupliquées. Il permet aux moteurs de recherche de regrouper les informations dont ils disposent sur les URL individuelles (par exemple, les liens pointant vers les URL) en une seule URL préférée. Cela signifie que les liens d'autres sites pointant vers http://exemple.com/robes/cocktail?gclid=ABCD sont regroupés avec les liens pointant vers https://www.exemple.com/robes/vert/robesvertes.html.
  • Pour simplifier le suivi des métriques liées à un seul produit ou sujet. Des URL différentes rendent plus compliquée la réception de mesures groupées pour un contenu spécifique.
  • Pour gérer le contenu syndiqué. Si vous syndiquez du contenu pour le publier sur d'autres domaines, vous devez vous assurer que votre URL préférée apparaît dans les résultats de recherche.
  • Pour éviter de perdre du temps à rechercher des pages en double. Pour optimiser l'analyse du site, il est préférable que Googlebot analyse les nouvelles pages (ou les mises à jour), plutôt que les versions bureau et mobile des mêmes pages.

Les avantages de la canonicalisation devraient maintenant être clairs : elle signale directement à Google quelle page est la plus pertinente (pour nous !) à indexer, elle évite de gaspiller le budget d'exploration car le robot d'exploration n'a pas à explorer les pages en double, elle simplifie le suivi des mesures liées à un seul produit ou sujet.

Conseils généraux sur le canonical et la canonisation

Pour toutes les méthodes de canonicalisation, Google vous invite à respecter quelques bonnes pratiques simples et intuitives.

  • N'utilisez pas le fichier robots.txt pour la canonisation.
  • N'utilisez pas l'outil de suppression d'URL pour la canonisation, car il supprime toutes les versions d'une URL de la recherche.
  • Ne spécifiez pas différentes URL comme canoniques pour la même page en utilisant des techniques de canonisation identiques ou différentes (par exemple, ne spécifiez pas une URL dans un sitemap et une autre URL pour la même page en utilisant rel="canonical").
  • N'utilisez pas noindex pour empêcher la sélection d'une page canonique, car cette déclaration sert uniquement à exclure la page de l'index, et non à gérer la sélection d'une page canonique.
  • Spécifier une page canonique lors de l'utilisation des balises hreflang, en désignant une page canonique dans la même langue ou la meilleure langue de remplacement si aucune page canonique n'existe pour la même langue.
  • Utilisez l'URL canonique du lien, plutôt qu'une URL dupliquée, lorsque vous définissez des liens sur le site. Le fait de toujours utiliser la même URL pour les liens aide Google à comprendre la préférence pour l'URL canonique.

Metadosi peut vous aider à mettre en place des URL Canoniques afin d'optimiser le référencement de votre site e-commerce. Contactez-nous en ligne ou par téléphone au 06 80 60 77 77, pour voir comment nous pouvons vous aider.

Évaluer ce page

Pin It on Pinterest