Le Guide Complet pour gérer votre contenu dupliqué

Imaginez un instant que, lorsque vous posez vos requêtes à Google, celui-ci vous réponde avec plusieurs contenus identiques ou trèèès similaires.

Tandis que vous recherchiez de la diversité, une vue d’ensemble.

Une expérience assez médiocre, right ?

Eh bien, c’est aussi l’avis de Google, qui prend de bonnes mesures contre ces pages susceptibles de saper notre expérience dans les SERPs.

Qu’est-ce que le contenu dupliqué ? Vos pages web sont-elles impliquées dans une forme de cette pratique ? Quel est l’impact sur le SEO ? Comment détecter le contenu dupliqué ? Comment l’éviter ?

Tout ce qu’il vous faut pour être sauvé, juste dans cet article !

Plongeons dans le vif du sujet…

Définition : quand parle-t-on de duplicate content ?

Selon la définition du géant de la Search lui-même :

Le contenu dupliqué (duplicate content en anglais) désigne des blocs substantiels de texte, identiques ou très proches, présents sur différentes URL.

Autrement dit, si deux pages, d’un même site ou de domaines différents, partagent un contenu quasi similaire, elles entrent dans la catégorie du contenu dupliqué.

Bien qu’il s’agisse dans la majorité des cas de situations involontaires, on peut estimer à 29 % le taux de pages web concernées (étude de Raventools, 2015).

Les types de contenu dupliqué et leurs causes

Quand on parle de contenu dupliqué, on pense tout de suite à du plagiat.

« Vous publiez une page informative et bien optimisée sur les avantages d’un nouveau portefeuille électronique… et deux jours plus tard, un autre site fintech reprend exactement vos mots. »

Mais le contenu dupliqué ne vient pas toujours de l’extérieur. Il peut aussi venir de votre propre site, parfois sans même que vous vous en rendiez compte.

On distingue deux types de contenu dupliqué : le contenu dupliqué interne et le contenu dupliqué externe.

Contenu dupliqué interne : définition et causes habituelles

On parle de contenu dupliqué interne quand plusieurs pages d’un même site affichent des textes très similaires, voire identiques.

Ce phénomène est courant sur les sites e-commerce qui ont des produits qui se ressemblent beaucoup.

Les raisons courantes de cette duplication :

Descriptions copiées entre pages similaires

Un site peut avoir plusieurs produits identiques : différentes couleurs d’un même accessoire par exemple. Les descriptions sont souvent reprises telles quelles – c’est le même produit après tout. Résultat : duplication.

On comprend que dans certains cas il n’y ait pas vraiment d’alternatives. Il existe des moyens d’aider Google à comprendre vos pages. On en parle plus bas dans cet article..

Doublons de titres ou de portions de texte par le webmaster en charge
Navigation à facettes, filtres et URLs multiples

Certains systèmes de navigation (comme les filtres par taille, morphologie, etc.) génèrent plusieurs URLs pour un même produit. Le contenu reste le même, mais Google voit plusieurs pages différentes. Ce type de duplication surcharge inutilement le crawl des robots.

Problèmes techniques ou de paramétrage

Un site peut exister à la fois en version HTTP et HTTPS, avec ou sans www. Cela crée plusieurs versions pour une même page.

Autre cas classique : un site de développement en ligne en même temps que le site officiel.

CMS mal configuré

Certains CMS (Content Management System) créent aussi des doublons de contenus à cause d’un mauvais paramétrage : pages étiquettes, catégories…

Contenu dupliqué externe : quand plusieurs sites publient les mêmes textes

On parle de contenu dupliqué externe quand le même contenu apparaît sur plusieurs sites distincts.

Ce phénomène est courant, parfois involontaire, mais il peut nuire gravement à la visibilité de ton site dans les résultats de recherche.

Voici quelques cas fréquents :

Reprise des descriptions fournisseurs

Il arrive que plusieurs e-commerçants utilisent le texte officiel fourni par le fabricant, leur fournisseur. Après tout c’est la description officielle, et en plus c’est rapide. Mais aux yeux de Google, c’est tout simplement du contenu dupliqué sans valeur ajoutée : les autres ont la même.

D’ailleurs imaginez que sur le site de votre fournisseur, un site d’autorité, il y ait la même… Il sera probablement favorisé par Google au détriment de vous.

Revente d’un même article à plusieurs sites

Certains rédacteurs proposent le même contenu à différents clients. Même si ce n’est pas du plagiat volontaire (venant du propriétaire de site), cela reste une duplication problématique.

Plagiat pur et simple

Certains sites recopient volontairement des contenus d’autres pour essayer de grimper artificiellement dans les résultats de recherche. Google met en garde contre ce genre de pratiques, qui affectent négativement l’expérience des utilisateurs.

Le cas des vendeurs multicanaux (ex. Amazon)

Un commerçant publie son contenu unique sur son site… puis le réutilise tel quel sur un autre dont il est propriétaire, ou sur sa propre boutique Amazon.

C’est tout simplement du duplicate content.

Et devinez quoi, dans le cas de la boutique Amazon, il vient d’offrir son contenu au géant du e-commerce que Google favorisera très probablement dans les résultats au détriment de son site.

Il est vrai qu’ici, le commerçant est propriétaire du contenu dupliqué. Et nous savons tous qu’il peut être fastidieux de reprendre à chaque fois un processus de rédaction de contenus… et pour des objectifs quasiment similaires.

Cependant c’est la démarche recommandée. Cela peut carrément sauver votre SEO.

Dans tous les cas, Google (et tout autre moteur) veut offrir une expérience de qualité à l’utilisateur. Si ton contenu est déjà présent ailleurs, il perd de sa pertinence… et c’est ton référencement qui en souffre.

Quel est le vrai impact du contenu dupliqué sur votre SEO ?

Comme vous l’aurez compris, le contenu dupliqué peut nuire à votre positionnement dans les moteurs de recherche. Un site qui en contient trop risque de chuter dans les résultats de recherche, voire d’être complètement écarté par les moteurs.

En résumé :

→ Contenu dupliqué interne

•         Les moteurs passent plus de temps à explorer des pages identiques, au lieu de découvrir vos contenus récents ou de qualité. Résultat : certains bons contenus peuvent moins bien référencés.

•         Si votre site contient plusieurs pages très similaires, Google ne va pas afficher toutes les versions. Il va choisir celle qui lui semble la plus pertinente pour ses utilisateurs.

•         Les liens entrants (backlinks) se retrouvent aussi dispersés. Au lieu de pointer vers une seule page, ils se répartissent entre plusieurs versions. Ce fractionnement affaiblit l’impact de votre stratégie de link building, pourtant essentielle pour votre SEO.

→ Contenu dupliqué externe (entre plusieurs sites)

Si vous reprenez un texte d’un autre site, même avec quelques changements, Google saura que ce contenu existait déjà. Rappelez-vous que son index contient des milliards de pages, avec les dates de publication et autres infos.

Lorsqu’il se retrouve dans un cas de contenu double, il a tendance à privilégier la version la plus ancienne dans les résultats.

Donc une page qui copie mon contenu ne peut pas être mieux indexée que moi ?

Pas forcément. Google tient aussi compte de la notoriété du site. Si votre contenu est repris par un site très autoritaire (cas de la boutique Amazon), il y a de bonnes chances que ce soit sa version qui remonte en premier, même si vous avez publié avant.

Dans plusieurs de ces situations, votre contenu ne bénéficie pas de la visibilité qu’il mérite sur les moteurs de recherche. Et vous perdez du trafic SEO. Il est donc essentiel de savoir repérer les cas de duplication sur votre site ou ailleurs… Nous en parlons juste dans la section suivante.

Questions fréquentes sur l’impact SEO du contenu dupliqué

Mon site peut-il être entièrement pénalisé par Google s’il contient du contenu dupliqué ?
Oui, si l’ensemble du site est un simple copier-coller, il peut être repéré par Google et désindexé.

Quel est le pourcentage de contenu dupliqué toléré par Google ?
Google accepte jusqu’à environ 20 % de contenu dupliqué. Pour rester prudent, il est conseillé de ne pas dépasser 10 %.

Du contenu dupliqué sur une même page peut-il impacter mon référencement ?
Pas forcément. Tant que cela ne détériore pas l’expérience utilisateur, il n’y a pas de sanction directe.

Le duplicate content pénalisé ici implique plusieurs URLs différentes.

Laisser un commentaire