Le Duplicate content (contenu dupliqué), c’est quoi ?

Lorsque vous recherchez des améliorations techniques pour optimiser le référencement de votre site, l’une des priorités est d’assurer la présence de contenu unique sur vos pages. Le contenu dupliqué est considéré comme un obstacle majeur par les spécialistes du référencement…

Plutôt que de recourir à la duplication de contenus déjà présents en ligne, il est inutile de le faire, car Google est capable de détecter ces duplications. Pour vous démarquer, évitez de suivre le mouvement général et privilégiez la création de votre propre contenu.

 

Duplicate content : définition

Le terme “duplicate content” (DC) fait référence au contenu en double. Cela indique que plusieurs contenus textuels similaires sont présents dans l’index de Google, accessibles via des URLs distinctes.

Il existe deux scénarios de duplicate content :

  • Certains sites peu scrupuleux copient du contenu déjà présent sur un site externe (duplicate externe) et le reproduisent sur leur propre site.
  • Des erreurs humaines (comme utiliser le même contenu pour différentes variantes d’un produit) ou des problèmes techniques de CMS peuvent générer du contenu en double interne sur un même site (par exemple, des URLs automatiques).
    Google pénalise clairement la duplication de contenu.

En ce qui concerne le pourcentage de similarité : bien qu’il n’y ait pas de règles strictes, on estime généralement qu’à partir de 70% de similarité éditoriale, il s’agit de contenu dupliqué selon Google. La tolérance serait jusqu’à 30% de similarité, sans impact négatif selon Google.

C’est quoi le duplicate content externe ?

Le duplicate content externe se réfère à la similarité entre des contenus publiés sur différents sites.

Par exemple, si deux blogueurs échangent du contenu pour enrichir mutuellement leurs blogs, cela constituerait un cas de duplicate content externe.

De même, si un de vos concurrents reproduit exactement vos contenus sur son site, il s’agit également de duplicate content externe.

En ce qui concerne les fiches produits et descriptifs :
Il est fréquent que des sites e-commerce concurrents présentent des pages très similaires en raison des descriptions de fabricants. Si vos pages de produits se contentent de reprendre ces descriptions sans ajout significatif, il est probable que vos concurrents aient fait de même, conduisant à une similarité de contenu entre plusieurs sites.

Lorsque vous publiez des fiches produits sur des marketplaces en plus de votre site, assurez-vous que les contenus diffèrent.

Quelle page sera privilégiée dans les résultats de recherche ?
Dans cette situation, Google mettra en avant un seul de ces contenus identiques, généralement en favorisant le site le plus populaire ou le contenu le plus ancien. Ce contenu identifié comme original est considéré comme le “contenu canonique”, tandis que les autres sont catégorisés comme des contenus dupliqués.

C’est quoi le duplicate content interne ?

Le contenu dupliqué interne se réfère à la similarité entre plusieurs contenus au sein d’un même site. Que cette similarité soit intentionnelle ou non, elle expose à un risque de pénalité de la part de Google, d’où l’importance de la corriger.

Par exemple, si vous proposez 3 séjours de thalassothérapie différents mais dans un même lieu, et que vous avez créé une description identique du lieu sur chacune des 3 pages, vous créez involontairement un obstacle sérieux au référencement de ces pages. Cela peut être préjudiciable, n’est-ce pas ?

Pour résoudre ce type de problème, une solution simple consiste à réécrire la partie dupliquée afin que le texte diffère sur chaque page, même si le sujet reste le même. Alternativement, il existe des techniques pour afficher le texte dans un onglet distinct ou le présenter dans un format différent. En cas de difficulté, il est recommandé de consulter une agence spécialisée en référencement pour obtenir des conseils adaptés à ce problème spécifique.

Idéalement, un site optimisé ne devrait pas présenter de nombreux cas de contenu dupliqué. Cependant, même sur un site correctement optimisé, quelques occurrences de contenu dupliqué peuvent survenir. Malgré la marge de tolérance de Google, il est préférable de les rectifier.

 

Google sanctionne-t-il le duplicate content ?

Étant donné que les moteurs de recherche cherchent à éviter de stocker des contenus similaires, ils s’efforcent de limiter la propagation du contenu dupliqué sur le web.

Pour Google, il est crucial de présenter aux utilisateurs des résultats pertinents et distincts dans ses pages de résultats de recherche (SERP) afin d’offrir une expérience de qualité.

Si deux blogueurs partagent un contenu identique, Google ne mettra pas en avant les deux articles sur la première page de résultats, car cela pourrait perturber l’expérience des utilisateurs.

Google examine si la duplication de contenu est volontaire et intentionnelle, c’est-à-dire si elle vise à manipuler son algorithme de classement. En cas de pratiques délibérées de contenu dupliqué, le site concerné risque une baisse de positionnement (déclassement), où Google le rétrograde dans son index secondaire, voire, dans des cas extrêmes, le retire complètement de ses résultats de recherche.

Il n’est donc pas recommandé pour le référencement de pratiquer le contenu dupliqué.

 

Eviter le duplicate content interne

Voici des recommandations pour éviter le contenu dupliqué sur votre site :

Assurez-vous que votre site est accessible uniquement via un nom de domaine : Si nécessaire, demandez à votre webmaster de configurer une redirection DNS ou une redirection 301 pour corriger tout problème à ce niveau.
Vérifiez que votre nom de domaine est unique : Votre site ne doit être accessible qu’avec ou sans les “www.” (par exemple, www.monsite.com ou monsite.com). Choisissez une version privilégiée et assurez-vous de configurer cela dans Google Search Console en définissant le domaine préféré. Demandez à votre webmaster de gérer la réécriture via un fichier .htaccess.
Mise à jour 2020 : Google a éliminé la fonctionnalité de choix de domaine préféré. Assurez-vous que seul votre domaine préféré est accessible et configurez une réécriture d’URL appropriée dans le fichier .htaccess.
Redirections 301 : Vérifiez avec le responsable de votre site que les redirections 301 sont correctement configurées, surtout après une refonte récente du site.
Sitemap : Demandez à votre webmaster de s’assurer que le plan du site (sitemap) est à jour et correctement configuré.

Indexation : Simplifiez et évitez d’indexer par Google des pages sans valeur ajoutée, surtout si elles sont en double. Utilisez la balise “noindex” et le fichier robots.txt pour contrôler ces manipulations.

URL propres et simples : Gérez les paramètres d’URL via la Google Search Console et surveillez les cas de réécriture d’URL pour éviter le contenu dupliqué.

Pagination : Examinez votre système de pagination, en particulier sur les sites e-commerce où la pagination des listes de produits peut générer des pages dupliquées automatiquement.

Optimisation des contenus : Si vous identifiez des pages en duplication, améliorez-les en rédigeant des contenus uniques et éditoriaux différents. Rendez vos pages uniques pour offrir une valeur ajoutée tant aux utilisateurs qu’à Google.

Outils d’assistance à la rédaction : Utilisez des outils d’aide à la rédaction optimisée qui peuvent vous guider pour créer du contenu unique. Ces outils suggèrent généralement des termes pertinents pour vous positionner sur des mots-clés, même s’ils sont sémantiquement similaires. Ils sont particulièrement utiles pour les sites e-commerce proposant plusieurs produits similaires.

Site multilingue et traduction : Qu’en-est-il du contenu dupliqué ?

Les propriétaires de sites multilingues se demandent souvent si la traduction de leurs pages en différentes langues constitue du contenu dupliqué, et la réponse est non. Google ne peut pas distinguer un contenu traduit.

Dans ce contexte, il ne s’agit pas de manipuler le classement des résultats, mais simplement de rendre le contenu accessible à une audience mondiale, répondant à des requêtes dans diverses langues.

Cependant, est-il acceptable pour un site de simplement traduire les contenus d’un autre site ? Oui, mais avec des nuances.

Il s’agit là d’une question d’éthique et de confiance. Si un site fidélise des utilisateurs en proposant des contenus qui s’avèrent être simplement des traductions d’un autre site, cela peut affecter la pérennité du site. Une fois que la confiance des visiteurs est brisée, il peut être difficile de la regagner.

Résoudre les problèmes de DC externe

Il peut arriver que des pages soient piratées, entraînant du contenu dupliqué. Voici quelques solutions pour remédier à cette situation :

Contacter les sites plagiaires : Contactez les sites ayant copié des parties de votre contenu en les invitant à cesser cette pratique ou à indiquer clairement que votre contenu est l’original.

Améliorer votre référencement : Travaillez sur l’amélioration de votre page pour la positionner devant la page piratée. Cela implique un renforcement du netlinking, c’est-à-dire l’acquisition de liens externes de qualité pointant vers votre page. En augmentant la notoriété de votre page grâce à des liens puissants, vous pourrez surpasser la page copiée.

Intégrer des liens de retour : Incluez des liens vers votre site dans votre contenu. En cas de copie, ces liens renverront vers votre site, démontrant ainsi que votre contenu est l’original (assurez-vous que les liens sont absolus).

 

 

Didacweb est une agence digitale avec pour objectif de valoriser votre marque, améliorer votre notoriété et votre visibilité en ligne.
Horaires : Lun-Ven, 07h30-17h30