Content Spinning ou comment pourrir le contenu du Pandaranol

Etant donné la forte recrudescence de BH (comprenez Black Hat) pour le concours SEO lancé par seoworldcup, qui pour rappel a choisi le terme pandaranol sur lequel positionner son site, je me devais de publier un article sur l’une de ces techniques obscures qui pollue actuellement un grand nombre de sites, blogs, forums et j’en passe.

Le content spinning

Tout d’abord une petite définition :

Le content spinning est une technique permettant de générer de nombreux contenus, généralement à partir d’un contenu de base, via un script. Ce dernier va remplacer les termes choisis par des synonymes en les remplaçant de façon totalement aléatoire.
Cela aura pour effet de pondre un nouveau texte, qui aura un sens très proche du texte initial, mais en utilisant des termes différents (et c’est la tout l’intérêt).

Mais alors, quel est l’intérêt de faire du content spinning si c’est pour dire la même chose avec d’autres mots autour du Pandaranol ?

Et bien, reprenons les bases du WH (ou White Hat, le référencement dit « propre ») : Les moteurs de recherche Google (on ne va pas se voiler la face, les autres SERP on s’en contrefout) va crawler les sites de la toile via ses petits robots et en récupérer le contenu. Il aura une fâcheuse tendance à mal voir les sites qui vont se contenter de faire du duplicate content, c’est à dire copier du contenu existant et se le réinjecter.
Google va donc comparer le contenu de la page qu’il visite et vérifier si le pourcentage de mots présents n’est pas proche de celui d’une autre page existante (l’ordre des mots est également pris en compte). Cela évite d’avoir un site de 1000 pages similaires entre autre.

Le problème, comme vous aurez pu le constater, c’est que tout le monde n’est pas clean, et surtout, pondre des pages de contenu c’est long.
Les flemmards utilisent des outils qui vont spinner un texte au préalable récupéré sur le net (bah ouais, quitte à pas s’emmerder, autant le faire à fond ^^). Généralement le texte de base est en Anglais, donc il passera par le traducteur, d’ailleurs on préférera un Systran (par exemple) à un Google traduction pour des raisons évidents de paranoïa.

A ce jour, on recense 2 méthodes de travail pour le content spinning : la première pourrait être propre, elle consiste à rédiger du texte avec des synonymes séparés par un pipe (|), le tout mis entre crochet pour que le script détecte les mots à remplacer, voici un exemple :

[notice]{bonjour|salut|coucou} {je suis|je m’appelle|mon nom est} toto[/notice]

L’exemple ci-dessus affichera, bonjour je suis toto, mais salut mon nom est toto, salut je suis toto, coucou je m’appelle toto, etc.
Au final ça dit la même chose, mais les termes utilisés sont différents. Avec un peu d’imagination et beaucoup de phrases, on peut très vite se retrouver avec des dizaines, voire des centaines de pages aux contenus spinnés.

La seconde méthode, un peu plus onéreuse, beaucoup moins propre mais nettement plus automatisée, consiste à utiliser un outil (que vous trouverez en cherchant sur Google, le but de cet article n’est pas de faire grandir la communauté de BH) qui va détecter tous les mots ou groupes de mots d’un texte donné et proposer des synonymes. On peut choisir le pourcentage du texte à remplacer, tout un tas de synonymes pour un mot car le dictionnaire est assez bien fourni, etc. Seul hic, le logiciel est en Anglais.
Donc grosso modo => On récupère un article en Anglais sur le net, on l’insère dans le programme, on le spinn autant de fois que nécessaire, on passe les textes spinnés au traducteur et on injecte les résultats en ligne (généralement dans un blog, enfin un splog pour être plus précis).

Voilà qui devrait déjà bien vous dégrossir la chose.
Notez tout de même qu’il existe de nombreuses autres techniques obscures que nous aborderons au fur et à mesure que le concours avance.

Et vous utilisez vous ce genre de technique pour référencer votre Pandaranol ?

VN:F [1.9.20_1166]
Rating: 0.0/10 (0 votes cast)
Laissez votre avis

*