Le contenu dupliqué vous stresse ?

Un peu partout sur Internet on lit des histoires effrayantes concernant le contenu dupliqué. Pour ceux qui n’auraient pas suivi, il s’agit de la possibilité d’avoir le même texte ou la même page disponibles sur plusieurs adresses, voire plusieurs sites différents.

En terme de référencement, cette duplicité peut poser des problèmes: en effet, Google et consorts évite de montrer dans les pages réultats plusieurs résultats qui sont la même page. Il est donc nécessaire d’aiguiller Google pour optimiser au mieux le référencement et lui faire afficher la page que l’on veut.

Alors que pour la duplication sur d’autres sites, il est difficile d’agir, il est maintenant possible d’éradiquer totalement tout risque de « duplicate content » sur un même site. La procédure est très simple et est supportée par la majorité des moteurs sont Google, Yahoo et Bing.

colors
Creative Commons License photo credit: banoootah_qtr

Les moteurs supportent depuis quelques mois une nouvelle balise méta: le meta link avec le paramètre canonical. cette balise indique aux moteurs l’adresse d’origine ou l’adresse épurée de la page.

Par exemple:

<link href= »http://www.maboutique.com/produit.php?reference=25″ rel= »canonical »>

peut être ajouté ajouté dans l’entête de toutes ces pages:

http://www.maboutique.com/produit.php?reference=25&id=5645465456   (ID de session)

http://www.maboutique.com/produit.php?reference=25&partenaire=54     (affiliation)

http://www.maboutique.com/produit.php?reference=25&tri=asc    (tri dans la page)

Les moteurs comprendront immédiatement que ces pages sont identiques et proposeront uniquement la version canonique dans les résultats.

Avec cette clarification, j’espère que l’on va finalement arrêter de parler de contenu dupliqué et passer à autre chose.

Articles en relation :

Be Sociable, Share!

19 thoughts on “Le contenu dupliqué vous stresse ?

  1. Bonjour

    Pas mal de webmasters s’en plaignent de cette balise. Pour une raison toute simple : les robots ne sont pas obligés de s’y tenir. Et googlebot, slurp & consorts ne la respectent qu’une fois sur deux…

  2. D’après moi, cette balise ne règle qu’un problème très mineur :/. Le cas des urls canoniques est géré par Google, à peu près correctement, depuis très longtemps.
    Un vrai cas de duplicate content ça peut, par exemple, être pour une boutique, une page catégorie qui reprendrait tout ou partie des descriptions produits. Dans ce cas là il est très dur de faire ressortir cette page dans les résultats des moteurs de recherche.

  3. J’ai mis en place cette balise il y a un mois sur plusieurs sites comptabilisant plus de 400 millions de pages vues par mois. Résultat: zéro.

  4. Bonjour Maxime

    Je pense aussi que cette balise ne règle pas tous les problèmes. J’avoue que je n’ai pas testé cette balise avec résultats à l’appui. Bref, je doute !!!

    amicalement

  5. Si le duplicate content vous fait peur, passez au triplicate content. Comme ca le probleme sera regle. :)

  6. Malheureusement, ça ne répond en rien au problème des scrappers de flux et compagnie.
    Ca c’est une vraie plaie et qui peut avoir des résultats vraiment non souhaités.
    Il m’est déjà arrivé de voir un scrapper passer devant moi dans les SERPs alors qu’il utilisait mon contenu.

    Par exemple, combien de fois on voit dans Google Paperblog avant le blog d’origine ?…

  7. Pingback: Les articles les plus populaires depuis le début | Gourous du Net

  8. D’après mon expérience le duplicate content n’est pas un handicap pour le référencement. Au pire, google ne référencera qu’une des page dupliquée.

  9. Tout dépend de l’objectif de ce contenu, une diffusion large implique
    un référencement efficace

  10. Euh, on parle bien de ces dizaines de milliers annuaires qui tournent tous sur des plateformes generiques avec le meme code html du premier tag jusqu’au dernier, c’est ca ? MDR.