CONTENU DUPLIQUE

Le contenu dupliqué représente un réel problème pour les moteurs de recherche. Il consiste à utiliser le même contenu dans plusieurs pages web d’un site ou dans divers sites web. En d’autres mots, cela signifie qu’une copie similaire d’une page web apparaît dans différents emplacements d’une page web, et par conséquent les moteurs de recherche sont confus et incapables de savoir quelle URL positionner sur les moteurs de recherche. Cela peut avoir un impact sur le positionnement de votre site dans la première page des résultats de recherche. Mais les problèmes ne s'arrêtent pas là. Les choses ne font qu’empirer lorsque les utilisateurs commencent à créer des liens vers les différentes copies de votre contenu. Cet article vous aidera à comprendre les motifs du contenu dupliqué et à trouver un remède pour chacun d’entre eux.

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué (contenu en double, duplication de contenu ou duplicate content en anglais) est un contenu qui apparait au moins deux fois sur plusieurs pages web d’un site internet. Il s’agit d’un concept qui est très utilisé en SEO. Il consiste à plagier une partie ou la totalité d’une page sur une autre page web du même site ou d’un autre site. Il y a en effet deux types de duplication de contenu : la duplication interne (DUST) et la duplication de contenu externe.

Le duplicate content est donc un contenu qui est affiché sur plusieurs URLs (ou pages web). Puisque plusieurs URLs présentent le même contenu, les moteurs de recherche n’arrivent pas à savoir quelle url indexer ou classer dans les meilleurs pages de résultats. Cela pourrait donc les amener à déclasser vos pages web sur les moteurs de recherche.

Dans cet article, nous allons nous concentrer sur les motifs techniques du contenu en double et leurs remèdes.

Contenu dupliqué
contenu dupliqué référencement

Les causes du contenu dupliqué

Le contenu dupliqué est provoqué par plusieurs facteurs. La plupart de ces facteurs sont techniques. En effet, il est très rare qu’un humain décide de publier le même contenu sur deux emplacements distincts sans spécifier lequel est l’original, sauf si vous avez reproduit et publié un post sans faire exprès.

Il existe un tas d’autres raisons techniques qui pourraient avoir causé le contenu dupliqué. La plupart du temps, cela est dû au fait que les développeurs ne réfléchissent pas comme un navigateur web ou comme un utilisateur, sans mentionner les robots des moteurs de recherche.

  • Incompréhension du concept d’URL

Les développeurs ne reconnaissent pas qu’ils font de la duplication de contenu. Ils ne comprennent pas le langage des urls.

  • Identificateur de session (ou Identifiant de session)

Les entreprises souhaitent souvent garder une trace de leurs visiteurs et leur permettre de placer des articles dans un panier. Pour ce faire, vous devez leur attribuer un identifiant de session.

Certains systèmes utilisent des identifiants de session dans l’URL. Cela signifie que cet identificateur de session est ajouté à l’URL de l'ensemble des liens internes du site web. Puisque cet identifiant est unique pour chaque session, il crée une nouvelle URL, et donc un contenu dupliqué. La session d’un internaute peut donc générer du duplicate content.

  • Paramètres d’URL et de tracking

L’usage de paramètres d’URL qui ne modifient pas le contenu d’une page web, comme par exemple les liens de suivi, est également une cause du contenu dupliqué. Cela ne s'applique pas seulement aux paramètres de suivi, mais également à tous les paramètres que vous pouvez ajouter dans une URL et qui ne modifient pas la partie essentielle du contenu. Ils génèrent tous du contenu dupliqué : que ce soit pour “modifier la classification d’une série de produits” ou “pour afficher une barre d’outil (une barre latérale ou un sidebar)”. Il faut les éviter car vous ne pouvez pas anticiper leurs conséquences. De plus, ils sont en général mal indexés ou mal classés par google.

  • Scrapers et syndication de contenu

Le duplicate content est souvent causé par vous ou par votre site. Cependant, il arrive que d’autres sites web utilisent votre contenu avec ou sans votre accord. Ils ne mettent pas toujours de liens pointant vers la page web originale, ce qui ne permet pas aux moteurs de recherche de se rendre compte qu’il s’agit d’un contenu plagié et les oblige à explorer le même contenu. La popularité de votre site va entraîner un grand nombre de scrapers (voleurs de contenu), ce qui ne va faire qu'aggraver la situation.

  • Ordre des paramètres

L’ordre dans lequel les paramètres apparaissent dans l’url peut aussi être une source du problème. Un CMS ne gère pas les urls intelligibles, mais plutôt les urls illisibles.

  • Pagination des commentaires

Dans les paramètres de Wordpress, mais aussi dans ceux d’autres systèmes de gestion de contenu, vous pouvez activer une option relative à la pagination des commentaires. Cela permet de diviser les commentaires de votre article en sous-pages. En d’autres mots, cela entraîne la duplication de votre contenu.

  • Pages web printer-friendly (faciles à imprimer ou imprimables)

Le contenu dupliqué est aussi dû aux pages web imprimables. Si votre CMS crée des pages imprimables, et que vous créez des liens vers ces derniers depuis votre site, Google va les trouver comme d’habitude, à moins que vous les bloquer. Maintenant vous devez vous demander quelle version vous souhaitez voir affichée par google, celle avec les annonces publicitaires et le contenu secondaire ou celle qui affiche votre article.

  • WWW ou non-www

C’est l’un des anciens motifs du contenu dupliqué. Cela n'empêche pourtant pas les moteurs de recherche de se tromper : contenu dupliqué avec ou sans www lorsque les deux versions du site sont disponibles.

Comment identifier le contenu dupliqué ?

Vous ignorez probablement si vous avez des problèmes de duplicate content avec votre site ou votre contenu. Utiliser Google est le moyen le plus simple pour détecter le contenu dupliqué. Il existe plusieurs opérateurs de recherche très utiles pour vous aider.

Pour trouver toutes les urls de votre site qui contiennent votre mot-clé, vous devez lancer une recherche sur google en indiquant le nom de votre site et votre mot-clé. Ensuite, google affichera toutes les pages de votre site qui contiennent ce mot-clé. Plus vous serez précis dans vos recherches, plus il sera facile d’éliminer le contenu dupliqué.

Utilisez cette méthode pour identifier le contenu dupliqué sur le web. Google affichera alors tous les sites qui correspondent au titre que vous aurez taper sur la barre de recherche. Il est parfois plus judicieux de chercher une ou deux phrases complètes de votre article puisqu’il arrive que certains scrapers en modifient le titre.

Comment le gérer ?

Pour gérer le contenu dupliqué, il existe des solutions pratiques. Une fois que vous avez sélectionnez une url canonique pour votre page web, vous devez commencez le processus de canonisation. Cela signifie que vous devez indiquer aux moteurs de recherche quelle version de votre page ils doivent afficher dans les résultats de recherche et quelle version doit recevoir du trafic. Il y a quatre solutions pour résoudre votre problème de contenu dupliqué :

  • Eviter le duplicate content grâce à l’attribut rel=canonical
  • Rediriger votre contenu dupliqué vers l’url canonique
  • Ajouter un lien canonique vers la page dupliqué
  • Ajouter un lien HTML pointant vers la page canonique sur la page dupliqué

Conclusion sur le contenu dupliqué

Le contenu dupliqué est un problème commun. On le rencontre dans plusieurs sites web. Il n’existe pas de pages web qui ne rencontre pas de problème de contenu dupliqué. Vous devez toujours rester vigilant. Cependant, il peut être géré et corrigé. Les avantages sont nombreux. Vous débarrasser du contenu dupliqué peut augmenter le positionnement de votre contenu de qualité sur les résultats de recherche des moteurs de recherche. Pour en savoir plus : Le filtrage de contenu dupliqué, qu’est-ce que c’est et comment ça fonctionne ?

REFERENCEMENT GOOGLE, Votre partenaire de référencement web !

Un projet digital, un référencement gratuit ou un désir de battre la concurrence ? Contactez-nous !

© 2010 - 2020 Copyright by Référencement google gratuit | C.G.V. Mentions légales |All rights reserved - Tous droits réservés.

HAUT UA-66142419-3