SEO, CNAME, URL canonique et redirections 301

Il n’est pas rare d’avoir deux URL qui pointent vers le même contenu. Cela peut être tout à fait accidentel ou voulu. L’exemple le plus courant est www.monsite.com et monsite.com qui doivent normalement être configurées pour pointer vers la home de votre site internet. Avoir le même contenu sur deux URL différentes peut être synonyme de « duplicate content » (contenu dupliqué) qui peut impacter votre référencement. Il existe plusieurs manières de gérer ce problème, nous allons en voir quelques uns et les cas où il faut les utiliser. Pour simplifier, nous utiliserons l’IPV4 pour les notations des adresses, mais la cohabitation IPV4 et IPV6 ajoute un peu plus de complexité.

Duplicate content, qu’est ce que c’est ?

Le duplicate content ou contenu dupliqué, comme son nom l’indique, s’applique à un état dans lequel on retrouve 2 contenus identiques (ou très similaires) sur deux pages différentes (2 URL différentes). Concrètement, on accède à ce contenu par deux chemins (URL) différents. Les moteurs de recherche n’aiment pas ça : comment faire la différence entre 2 pages identiques, quelle est la valeur ajoutée de l’une par rapport à l’autre ? Google a pris l’habitude de pénaliser les pages en duplicate content dans son algorithme de recherche. Il est donc indispensable de régler ces problèmes sur le site.

CNAME/A

Nous nous situons au niveau du paramétrage de votre serveur ou de votre espace d’hébergement. Il y a à ce niveau 2 grands types de redirections pour les URL.

  • les enregistrement A (ou IN A) sont des entrées DNS qui associent une url à une adresse IP. Par exemple monsite.com ==>123.45.67.890
  • les enregistrement CNAME qui sont un peu des alias. Ils associent une url à un enregistrement A ou à un autre CNAME. Exemple: www.monsite.com==> monsite.com

Les URL monsite.com et www.monsite.com sont 2 url différentes. Mais vous devez pouvoir permettre à l’utilisateur de choisir l’une des deux pour arriver sur votre site internet. Dans ce cas, cette redirection doit être mise en place par un enregistrement CNAME. Elle est habituellement paramétrée par défaut sur votre espace d’hébergement.

Il est important de noter que les CNAME ne font pas de redirection web, juste une redirection DNS. Il est donc inutile de les utiliser pour régler un duplicate content qui aurait d’autres causes.

URL canonique

Il n’y a plus beaucoup de sites internet qui ne sont pas générés dynamiquement. Du coup, du duplicate content interne apparait avec la cohabitation d’URL du type monsite.com/index.php?id=35 et monsite.com/ma_jolie_page.html. C’est de la réécriture d’URL (ou URL rewritting). On retrouve aussi un problème récurent dans les sites e-commerce, celui du duplicate content généré par les déclinaison d’un même article (couleur, mais plus souvent taille ou quantité).

Google cite un autre exemple, celui d’un article qui serait placé dans 2 catégories différentes: https://monsite.com/robe/robe-verte-38.html et https://monsite.com/vetements-verts/robe-verte-38.html

Gérer ce type de duplicate content n’est pas difficile, il faut indiquer au moteur de recherche qu’il faut privilégier une URL par rapport aux autres. On utilise pour cela la balise rel= »canonical ». Cette balise se place de cette manière :

fichier : https://monsite.com/vetements-verts/robe-verte-38.html
<head>
(...)
<link rel="canonical" href="https://monsite.com/robe/robe-verte-38.html" />
(...)
</head> 

La redirection 301

Imaginons que vous changiez l’arborescence de votre site internet et que vos articles, qui étaient rangés avant sous une catégorie blog (https://monsite.com/blog/mon-article.html), se retrouvent dans une catégorie articles (https://monsite.com/articles/mon-article.html). Vous mettez votre site en ligne et là, une explosion d’erreurs 404 (page non trouvée) dans vos statistiques. Votre contenu indexé (sous /blog/) n’est plus accessible; du coup les moteurs de recherche envoient vos internautes à une mauvaise adresse.

Nous sommes dans l’un des cas où il faut utiliser une redirection 301. Pour être complet, il s’agit d’une entête renvoyée par votre serveur au navigateur qui demande une page sur votre site. Pour simplifier,l’entête habituellement renvoyée est 200 (ok) suivie du contenu de la page pour affichage. Si la page n’existe pas, l’entête renvoyée par votre serveur sera 404 (non trouvée). Il y a beaucoup d’autres entêtes (403 interdit, 500 erreur serveur …).

On utilise une redirection 301 pour spécifier que le contenu a été déplacé définitivement, que l’ancienne adresse n’est plus valable et qu’il faut maintenant aller chercher une nouvelle adresse. Cette directive se place, dans le cas d’un serveur apache, dans un fichier .htaccess . Attention, ce fichier est particulièrement sensible et peut bloquer votre site s’il est mal rédigé. L’adresse de redirection doit toujours être écrite de manière absolue, l’adresse redirigée peut être écrite de manière relative ou absolue.

Par exemple, dans notre cas, la ligne suivante devra être insérée dans le fichier .htaccess.

Redirect 301 /blog/ https://monsite.com/articles/

Conclusion

Nous avons vu quelques moyens de régler des problèmes de contenus. Il en existe d’autre, mais ceux que je vous ai décris sont les plus utilisés. En général, il faut privilégier la solution qui conserve le mieux votre référencement et toujours réfléchir à vos modifications et à leurs conséquences avant de les mettre en place. Je reste à votre disposition pour échanger sur ces différents points.