« Do the right thing » (« faire ce qui est juste »). Tel est le slogan de Google. Cela implique, entre autres, d’éviter le contenu dupliqué quand vous faites de la rédaction web. Explications.
Si vous êtes rédactrice ou rédacteur web, il peut être tentant de reprendre un contenu trouvé sur la Toile et de le reproduire tel quel sur son blog ou son site internet. « Ce n’est pas cher et ça peut rapporter gros », pensez-vous peut-être avec paresse. Et contrairement à l’époque où vous scrutiez la copie de votre voisin à l’école, le contenu dupliqué semble se faire à l’abri des regards indiscrets. Il n’y a pas de Professeur pour vous sermonner d’avoir tricher.
C’est pire.
Il y a Google.
Le contenu dupliqué repéré par Google
En effet, le moteur de recherche est en mesure de détecter le contenu dupliqué (ou « duplicate content » pour les Anglophones).
Ce dernier peut-être défini comme le contenu entièrement repris d’une source identifiable.
En quoi est-ce un problème ?
La question peut paraître incongru tant la réponse semble évidente.
« Ce n’est pas bien », est celle qui vient immédiatement à l’esprit. En reprenant le contenu d’une autre personne, vous vous rendez coupable de plagiat.
Sortons des considérations morales et de droit d’auteur. Pourquoi le contenu dupliqué ne plairait pas à Google ? Car le moteur de recherche s’est donné pour mission de donner la meilleure réponse à votre requête. Pour cela, le retour doit être de qualité. Or, Google a justement défini les critères de qualité d’une page web dans son document Search Quality Rating. Les pages dont le contenu principal est copié sont de mauvaise qualité.
« La note la plus basse est appropriée si la totalité ou la quasi-totalité du contenu principal de la page est copiée avec peu ou pas de temps, d’effort, d’expertise, de curation manuelle ou de valeur ajoutée pour les utilisateurs. Ces pages doivent être notées avec la note la plus basse, même si elles attribuent le crédit du contenu à une autre source ».
Il y a plusieurs cas de contenu dupliqué :
- celui entièrement repris d’une source identifiable sur une page entière, des morceaux de cette page ou plusieurs pages reprises ;
- le contenu légèrement modifié par rapport à l’original. Autrement dit, quelques mots ou phrases ont été changés ou rectifiés . Google appelle cela du contenu « copié avec une altération minimale » ;
- le contenu copié à partir d’une source changeante, comme une page de résultats de recherche ou un flux d’actualités.
Précision : nous parlons ici de contenu textuel. La notion de duplication ne s’applique pas entre un texte et une vidéo. Autrement dit, vous pouvez reprendre vos écrits en vidéos, vous ne serez pas concerné par le Duplicate Content. Ce sont deux formats distincts avec des intentions de recherche qui leur sont propre (lire et regarder).
On considère qu’il y a contenu dupliqué quand plus de 70 % du contenu est recopié. Selon Gary Illyes, analyste des tendances web chez Google, 60 % du contenu web serait dupliqué. En 2013, Matt Cutts, ingénieur logiciel de la firme, estimait la proportion à un tiers.
Problématique du contenu dupliqué
Au vu de ces chiffres, le contenu dupliqué est beaucoup plus courant qu’on peut le penser. Il est même, dans une certaine mesure, inévitable. Par exemple, un certain nombre d’éléments sont similaires d’une page à l’autre de votre site web : le pied de page, le header (le haute de page), les colonnes… Pour autant, cela ne posera pas de problème aux yeux de Google.
Dans le cas du contenu dupliqué tel qu’il a été défini précédemment, il est une nuisance à plus d’un titre. Pour l’auteur original, il s’agit d’une perte non négligeable de notoriété car une partie des internautes peut être redirigée vers le ou les pages où son travail a été repris. En plus de se faire voler son labeur, il se voit spolier les fruits de ce dernier. Pour la lectrice ou le lecteur, le résultat de ses recherches est faussé par la présence de ce contenu dupliqué.
Pour l’administratrice ou l’administrateur d’un site web, la question du Duplicate Content peut se poser sans que cela soit forcément intentionnel. C’est le cas du commerce électronique. En effet, une part non négligeable du contenu de ce type de site est consacrée aux descriptions des produits. Or, à moins de vendre des produits uniques, vous risquez de trouver ces fiches sur de nombreuses autres sites web dont certains à forte autorité. Votre contenu risque donc d’être considéré comme dupliqué avec pour conséquence la dégradation des positions dudit contenu dans les résultats de recherche de Google (nous y reviendrons plus tard).
Il est alors fortement recommandé de réécrire les fiches produits. C’est l’occasion de produire du contenu de qualité, avec de la personnalité et le point de vue d’un expert qui connaît son marché. En somme, il s’agit simplement de faire de la rédaction web en proposant du contenu à forte valeur ajoutée.
Le contenu dupliqué : est-ce grave docteur ?
Si vous vous êtes vraiment rendu coupable de produire du contenu dupliqué, la page sur laquelle s’affiche ce dernier est dégradé par Google dans ses résultats de recherche. Attention : la page est simplement déclassée mais pas désindexée. C’est pourquoi, un certain nombre d’experts (comme Olivier Andrieu) sont sceptiques quand on parle de sanction.
Celle-ci survient dans des cas exceptionnels comme celui où votre site comporte un grand nombre de contenus récupérés d’autres sites web, légèrement réécrits avec très peu d’originalité. Là, il pourra être retiré des résultats de recherche car Google considère qu’il n’est pas utile de gaspiller ses ressources en matière d’exploration en indexant votre site. Cette situation est rare ; elle nécessite une pénalité manuelle. Celle-ci est alors visible dans la Google Search Console.
Pour éviter le Duplicate Content, écrivez vos propres contenus
Nous ne le répéterons jamais assez : rien ne vaut un contenu original écrit par vos soins. Vous êtes alors sûr d’éviter le contenu dupliqué et de produire de la qualité. Comme votre seule bonne foi ne suffit pas aux yeux des moteurs de recherche, il convient de placer une balise rel= « canonical » dans vos pages pour indiquer à Google que votre contenu est bien l’original en cas de copie.
Au contraire, si vous souhaitez reproduire un article qui vous a plu, demandez l’autorisation à son autrice ou auteur. Au minimum, citez-le dans une ancre appropriée avec un lien renvoyant vers le texte. Pour savoir si vous êtes victime de Duplicate Content, vous pouvez utiliser un outil comme Copyscape. Si c’est le cas, il est recommandé de contacter sa rédactrice ou son rédacteur web, l’administratrice ou l’administrateur du site qui l’héberge pour lui demander le retrait du contenu.
Et vous ? Avez-vous êtes victime de contenu dupliqué ? Comment avez-vous géré la situation ? Racontez-nous en commentaire.