23 mai 2013

Mise à jour de Google Penguin

Le réveil du Penguin


Voilà plus d'un an que je n'avais rien publié sur ce blog, il était temps que je reprenne la plume pour dépoussiérer le site !

Ce billet va traiter du référencement lié aux changement d'algorithmes de Google, notamment concernant son filtre Penguin (maintenant appliqué de manière continue).

Rappelons que Penguin est destiné avant tout à repérer automatiquement (par traitement informatique) les tentatives de manipulation de l'algo. liées à une sur-optimisation des pages web. On peut donc dire qu'il a dans le collimateur les SEO un peu trop enthousiastes, qui passeraient de SEO à SEOO (Search Engine Optimization à Search Engine Over-Optimization).

Dans sa quête du contenu de qualité que l'internaute va apprécier (http://googlewebmastercentral.blogspot.fr/2012/04/another-step-to-reward-high-quality.html), la webspam team de Moutain View traque le mauvais lien et incite les acteurs du web (éditeurs de site, blogueurs, webmasters, référenceurs...) à faire de même, en se méfiant des techniques quantitatives censées accroître la visibilité d'un site.

Le filtre Penguin est donc sensé scruter et analyser les liens (mais pas seulement) à la recherche de signaux qui en démontreraient la faible valeur-ajoutée pour l'internaute lecteur.

Depuis cette nuit, des légions de professionnels du web se ruent sur leurs outils de monitoring à base de statistiques, et tentent de comprendre, si les positions de leurs sites dans les pages de résultats du moteur ont bougé, comment fonctionne ce drôle de Penguin.

Ce blog dédié depuis 2006 au référencement qualitatif va publier dans les prochains jours une série d'articles analysant d'un côté les messages envoyés par l'équipe anti-spam depuis le premier lancement de son filtre Penguin le 24 avril 2012 (tiens, pratiquement la date de publication de mon billet précédent, faut-il y voir une corrélation ?) et de l'autre côté les conséquences de cette mise à jour algorithmique.

Restez donc à l'écoute pour des faits concrets et argumentés !

18 avril 2012

Referencement monkey business ?

Le référencement depuis 2011

Etat des lieux du microcosme francophone

Les vagues formées depuis le concours de référencement Pandaranol n'en finissent pas ! Épiphénomène ayant suscité un buzz énorme au sein de la communauté des référenceurs, veilleurs, webmasters et éditeurs de sites francophones, le challenge a modifié le paysage du SEO made in France.

En effet, le concours pandaranol a cristallisé les esprits autour de concepts principalement venus d'Outre-Atlantique, visant l'industrialisation de procédés de référencement.

Ce qu'il est resté du concours depuis Juin 2011, c'est que l'approche quantitative donne des résultats capables de dominer les pages de résultats des moteurs de recherche.
Toute une communauté de prestataires en référencement s'est alors engouffrée dans la brèche, à commencer par les forums spécialisés dans les techniques dites avancées de référencement. Un flux de nouveaux membres qui a vu dans l’acquisition de logiciels et de matériels dédiés une voie royale pour écraser la compétition et s'arroger les premières places sur Google.
SEO black Hat
Crédit image : Laurent, OpenClipArt

L'avènement du Black Hat

Partant sur le principe que White Hat et Black Hat n'existaient plus, les deux étant désormais indissociables (Grey Hat) pour tout référenceur pragmatique cherchant avant tout le résultat, cette génération de "bébés Pandaranol" a alors investi dans les outils informatique développés pour automatiser au maximum les tâches impliquées dans une mission de référencement. Achats et codes d'affiliation par ici, abonnements à des services en ligne par là, formations au référencement avancé, etc le business a trouvé puis créé sa niche en France.
Il s'agit de dépenses notables, qui peuvent se monter à plusieurs centaines d'euros par mois en énumérant les postes suivants (liste non exhaustive) :
  • achat de logiciels (recherche de blogs, publication auto. de commentaires, création auto. de profils sur forums et réseaux sociaux...)
  • location de serveur dédié à partir duquel les scripts de programmes achetés sont lancés,
  • location de serveurs de tunnels et de serveurs proxy pour cacher ses traces et rester anonyme,
  • achat/location de services en ligne divers et variés (plugins WP SEO, analyse de backlinks, audit concurrentiel, suivi de positions, achat de fans sur Facebook, de followers sur Twitter, de likes...), 
  • l'achat de video et tutoriels en ligne pour apprendre à se servir des outils, 
  • l'abonnement payant à certains forums SEO spécialisés
  • l'entrée à des séminaires et conférences...
Pandaranol ayant mis en avant l'impact du billet de blog sur le référencement, la formule "référencez votre site sur des annuaires", de par le nombre de caractères habituellement limité sur ce type de site a perdu de la notoriété au profit d'un nouveau faisceau de circonstances. Le logiciel WordPress (largement utilisé pour les participants du concours Pandaranol, cf. "Après Pandaranol, que sont-ils devenus ?"), continuellement enrichi de plugins bien pratiques pour les SEO (et pour les autres) allait ainsi devenir l'outil idéal du site de Communiqué de Presse en ligne, lui-même adopté par le plus grand nombre pour promouvoir les sites web.
On voit ainsi fleurir les sites de communiqués depuis plusieurs années (cf. articles http://cwm-consulting.over-blog.com/article-la-mode-des-sites-de-communiques-de-presse-gratuits-quels-interets--44105132.html) mais avec un recrudescence toute particulière depuis Pandaranol (cf. http://buzz.marketing.free.fr/spip.php?article41)

Des réseaux de sites sont ainsi constitués pour relayer l'information et publier des liens qui contribueront à obtenir un meilleur positionnement.
Même si la plupart des textes sont issus de Master Spin, ces sites CP n'ont rien à se reprocher. Généralement les éditeurs de tels sites imposent une charte éditoriale qui leur évite de se faire blacklister par Google (en interdisant les contenus illégaux ou interdits aux mineurs, en définissant le nombre de liens autorisé en fonction du nombre de mots du Communiqué, en limitant le nombre de catégories et tags, lire à ce sujet un recueil de suggestions pour différencier son site CP).

Mais cela ne suffit pas toujours !
Le business s'adapte, puisque les différentes version du filtre Google Panda ont mis à mal les anciennes formules de fermes de contenus qui jusqu'alors permettaient de générer des revenus en réutilisant et republiant les textes.

Le Spin de texte est alors apparu, portant le nouvel espoir de générer du contenu unique (non dupliqué) sur les sites. Il en sera question un peu plus bas...

A qui profite le SEO Black Hat ?

Aux hébergeurs, aux registrars de NDD, aux éditeurs de logiciels payants qui vont être chargés de pousser ces sites CP en créant automatiquement de nombreux backlinks. Car ces sites de plus en plus nombreux doivent bien, eux aussi, bénéficier d'un peu de notoriété et de visibilité pour pouvoir transmettre du linkjuice aux moneysites... Ce marché profite également aux référenceurs et webmasters persuadés de pouvoir réaliser de belles affaires grâce à l'industrialisation de leur stratégie de publication et de monétisation.

Certains font de l'affiliation et la promotion de logiciels pour lesquels ils touchent une commission sur vente.

Beaucoup parlent de logiciels clairement Black Hat mais ne donnent aucune indication sur leurs propres affaires : quel est le retour sur investissement ?

Comme toujours, ce ne sont pas les "petits" utilisateurs de tools BH les vrais gagnants mais ceux qui vendent ces outils et les formations pour apprendre à les maîtriser (car certains softs sont tellement "puissants" qu'ils peuvent déclencher l'effet inverse : le blacklisting purement et simplement : sortie de l'index de Google sans garantie de retour).

La fin du Black Hat ?

Ces dernières semaines, les annonces de Google se font de plus en plus pressantes sur le fait de ne pas chercher à tromper l'algorithme du moteur de recherche (ne pas forcer sur la densité de mot-clé dans la page, ne pas associer son site à de mauvais sites, éviter l'emploi de balise canonical pour pallier à une mauvaise structure - cf Maile Ohye http://youtu.be/6AmRg3p79pM, etc) au travers de vidéos didactiques comme au travers d'actions bien concrètes (commande link: bridée, keywords "not provided" au moyen du protocole HTTPS, mise à jour du filtre Panda 3.4 et déclassement de sites de type fermes de liens et autres communiqués de presse de bas étage...)

Panda update Google
Crédit image : Laurent, OpenClipArt

La guerre serait-elle donc vraiment déclarée entre le moteur de recherche leader et les référenceurs Black/Grey Hats qui tentent de décrédibiliser la firme Google en mettant en avant les contradictions de ses propos ?

Qui détient la vérité ? Qui détient le pouvoir ? Entre une communauté de spécialistes en référencement technique avancé et le géant américain ?


Tendances du référencement en 2012

Entre 2011 et 2012, beaucoup de référenceurs ont investi dans dans des techniques propres au milieu black Hat. Il suffit de faire un peu de veille sur twitter pour s'en convaincre, car la plupart racontent leurs exploits au grand jour : blast par-ci, bon plan BL par là, nouveau site de CP au sein de linkwheel avec compte auteur VIP prêt à l'emploi...

Ce faisant, le tendance Black Hat a gagné très largement en visibilité, attirant de nouveaux profils intéressés par les "prouesses" réalisées à l'aide d'outils ou pratiques BH. Une partie a cherché à appliquer sans discernement certaines astuces divulguées ci et là, avec certains résultats catastrophiques pour l'ensemble des pratiquants, voire avec des dommages collatéraux pour tous les acteurs du référencement, qu'ils soient black hat, grey hat ou white hat !

Il en résulte qu'en 2012 il faudra faire preuve de plus de subtilité pour continuer à obtenir des résultats en utilisant les même outils. Qu'il s'agisse de la chasse aux spots doFollow ou aux contenus prenant les internautes pour des imbéciles (cf. https://sites.google.com/site/webmasterhelpforum/fr/aide-au-referencement/generer-des-liens-de-qualite), le référencement millésime 2012 va devoir élever son niveau éditorial, stratégique, et... technique pour les puristes du BH.

A ce niveau, le spin de texte est une illusion dans la grande majorité des cas. En effet, produire un article d'un niveau qualitatif supérieur à de la bouillie pour splog et destiné à être lu (entièrement, sinon attention le taux de rebond !) par un internaute requiert une préparation (le MasterSpin) de nombreuses heures et une véritable plume, lire à ce sujet le précédent billet http://referencement-qualitatif.blogspot.fr/2011/11/le-referencement-par-la-production-de.html ! Présenté comme l'arme ultime à la rentrée 2011, le contenu spinné n'aura pas vraiment eu le temps de récompenser les auteurs de logiciels, qui à grand renfort de dictionnaires de synonymes et d'analyses sémantiques poussées ont mis à la disposition (gratuite ou payante) du plus grand nombre une machinerie à passer les détecteurs de Duplicate Content certes, mais certainement pas à tromper facilement les lecteurs humains. Ou plutôt devrais-je écrire "certainement pas à intéresser les lecteurs humains"....

Enfin, il y a fort à parier que les vrais bons plans se trouveront moins facilement, sous peine d'être repris comme une traînée de poudre sur internet (certains évoquent la notion certes altruiste de partage, d'autres tentent de se faire un nom au sein du microcosme en divulguant partout ce qu'ils ont trouvé dans des lieux d'accès restreints) puis repérés facilement avant d'être "annulés" voire pénalisés par Google. Nul doute qu'en 2012 les Black Hat appliqueront à la lettre l'adage "pour vivre heureux, vivons cachés" afin de cacher leurs traces (WhoIs anonyme), brouiller les pistes (cloacking de BL) et garder leurs bons plans.

Et si certains communiquent des informations semblant intéressantes, gardez à l'esprit qu'il s'agira sans doute d'astuces de seconde main sur le point d'expirer, ou de tests grandeur nature. Réfléchissez : couperiez-vous la branche de l'arbre sur laquelle vous êtes assis(e) ?

Le renouveau du référencement passera par un élèvement qualitatif du niveau de ses prestations. Et n'oubliez pas l'aspect innovant : le référencement créatif risque de gagner du terrain !

D'accord, pas d'accord ? Commentez !

23 novembre 2011

Nouveau moteur de recherche Volunia

Volunia est le projet d'un nouveau moteur de recherche internet fomenté il y a plus de 10 ans par Massimo Marchiori, un collaborateur du W3C, professeur d'informatique à Padoue à l'Est de l'Italie, chercheur spécialisé autour des algorithmes de recherche et du web sémantique.

Le moteur Volunia est présenté comme "différent" des outils classiques de recherche actuels.

A suivre en s'inscrivant sur le site de lancement : http://launch.volunia.com/

Les Power Users sélectionnés par l'équipe du moteur auront la primeur de l'information sur les nouveaux modes de recherche en ligne !

02 novembre 2011

Le référencement par la production de contenu textuel

Indexer un site est une tâche aisée. En améliorer le positionnement dans les pages de résultats des moteurs de recherche est autrement plus difficile.

Bien entendu, cet article suit la ligne éditoriale de ce blog depuis 2006 : le référenceur nantais ne s'inscrit donc pas une démarche d'automatisation, et reste sur le terrain de jeu du référencement naturel, dit "White Hat".

Si vous pensiez trouver autre chose que du teasing sur des termes comme "texte spinné", linkwheel, blast, scraping ou encore splogs, vous courrez à la déception ;-)

La production de texte est la moelle de tout effort en référencement (SEO + animation rédactionnelle). Un site dont la fréquence de mise à jour est régulière, avec des textes et des médias correspondant à sa thématique est voué au succès (proportionnel au volume croissant de ses informations dans le temps). L'animation de site est une activité primordiale pour tout entreprise qui souhaite durer et prospérer.

Il devient ainsi vital de publier de nouveaux contenus selon un rythme régulier. Le texte, qu'il soit sous forme de billet de blog, d'article de fond, de communiqué de presse ou de fiche produit doit être autant attractif pour l'internaute que pour le moteur de recherche. Il convient donc de respecter le thème du site, et de développer des idées complémentaires qui permettront d'asseoir (tout en l'élargissant) la base sémantique et lexicale. Progressivement, le site pourra ainsi bénéficier de l'effet de longue traîne maintes fois décrit dans les articles des sites spécialisés sur le référencement naturel.

En mode White Hat, la production d'écrit revêt une démarche classique :

  • Recherche de sujet,
  • documentation,
  • réflexion
  • rédaction,
  • relecture/correction
  • publication
  • .

Ce travail de rédaction peut également intervenir pour différents types de missions, selon que le site est déjà connu ou qu'il est en phase de lancement, selon l'actualité et l'environnement de sa thématique, etc

La production de contenu textuel prend alors une dimension stratégique, puisqu'il ne suffit plus de lancer un site et d'attendre qu'il soit bien référencé, mais qu'il s'agit dorénavant d'en animer les rubriques par des écrits qui génèreront à leur tour des signaux sociaux (commentaires, notations, renvois et re-tweets, j'aime facebook, permaliens etc)

Or, cet aspect du métier de la publication pour internet est on ne peut plus flou : à qui incombe la tâche d'écrire pour le web ? Au journaliste, au pigiste, au rédacteur, au concepteur publicitaire, au webmaster, au responsable de communication ? Depuis l'avènement des blogs, c'est tout un chacun qui peut empoigner son clavier par les touches pour déverser ses idées et sa prose sur nos écrans.

A tel point qu'aujourd'hui de nombreuses plateformes de mise en relation existent sur ce positionnement de production éditoriale. Ces sociétés proposent des missions de rédaction aux inscrits, qui peuvent alors accepter les contrats selon les modalités définies par le donneur d'ordre (un éditeur de sites par exemple, qui souhaite un article ou une série d'articles sur des thématiques diverses) et la plateforme elle-même.

Citons par exemple Redactiweb, et la fiche d'un rédacteur web ou Textbroker, ou encore plus récemment TextMaster.

Ces services en ligne permettent donc de pallier au manque d'inspiration ou de compétences rédactionnelles; plus généralement au manque de temps.

Outre ces plateformes commerciales de mises en relation, citons quelques entrepreneurs indépendants qui proposent directement leur plume, parmi lesquels Chrysalink, rédaction SEO et soumission web, Id-Référenceur et son offre de référencement et rédaction sur mesure, Sitanim et sa rédaction de contenus pour le web...

Cette liste n'est pas exhaustive et le référenceur nantais invite les indépendants en production d'écrit à se manifester dans les commentaires de ce blog. Notez cependant, rédacteurs web de tous bords, que ne seront publiés que les commentaires de prestataires dûment déclarés sur le territoire français.

09 août 2011

Référencement estival et bataille pour le positionnement

Selon l'adage bien connu "
Quand le chat est parti, les souris dansent
", les référenceurs du monde entier sont conscients du caractère primordial des deux mois de vacances des français dans leur course au positionnement.

En effet, avec une rupture dans le flux régulier de mises à jour, de publication, et d'émission de signaux sociaux, le positionnement d'un site internet a naturellement tendance à chuter, à la faveur des concurrents qui ne sont pas en vacances ou qui ont pris leurs précautions. Lesquelles peuvent prendre la forme d'automatisation pour la publication (qu'il s'agisse de logiciels CMS ou de robots twitter), ou encore mieux, de délégation auprès d'un prestataire chargé de l'animation de vos contenus web.

C'est le cas de Sitanim, qui se propose de prendre en charge le suivi et la continuation de vos flux d'information.

Son offre de services de gestion et d'animation de contenu internet est bien résumée dans sa campagne "
N'abandonnez pas votre site web l'été
".

17 juin 2011

Concours Pandaranol à mi-parcours

Le concours de référencement / positionnement Pandaranol suit son cours, et à 15 jours de la fin, la plupart des participants ont donné leur avis et leurs pronostics.

Car il est sûr qu'au jeu des recommandations et du soutien, il est toujours bon de glaner quelques backlinks de ci et de .

Les classements vont bon train, avec des différences énormes entre les outils utilisés, et c'est sur ce point que je voudrais attirer votre attention !

Le beau jeu du référencement est concentré sur l'axe temporel, comme j'ai déjà eu l'occasion d'en parler, notamment dans le billet Comment choisir un prestataire en référencement ?.

Je rappelle brièvement qu'en matière de visibilité internet, il se passe toujours un certain laps de temps entre les actions entreprises et leur impact sur le positionnement d'un site. Cette inertie est variable selon le projet et les techniques employées.

En effet, un site déjà bien indexé par les moteurs et identifié comme publiant de nouveaux contenus régulièrement aura plus souvent la visite des robots de ces même moteurs. Il sera alors plus "réactif". De même, l'usage des réseaux sociaux et autres plateformes web 2.0 est généralement un bon accélérateur de visibilité.

Sur le concours Pandaranol, la difficulté est de pallier à l'absence de critères habituellement pris en compte par Google (puisqu'ici, le but est de se positionner sur l'index français du moteur), comme l'ancienneté du nom de domaine. Lire également à ce sujet l'article "Pandaranol, le concours SEO de trop ?" publié sur le blog d'étudiants en multimédia.

Les notions de "domain ageing" et de "trustrank" (sur les 40 jours que dure le concours, les échanges de liens vont bon train, mais également les créations de liens en masse, puis leur retrait massif (technique Nseo), amenant des fluctuations rapides qui sont moins décelables dans un cursus normal d'évolution de site) sont donc écartés en grande partie des critères permettant à l'algorithme d'établir son classement.

Restent donc l'optimisation in-page et in-site (SEO) et le netlinking pour résumer grossièrement.

C'est sur cette dernière stratégie que les résultats fournis divergent énormément selon les outils.

Car en fonction de la puissance de feu des moteurs de recherche, le web est parcouru/crawlé plus ou moins vite et plus ou moins en profondeur. Là où Bing, Yahoo! et Exalead ne sont pas encore ou partiellement passés, GoogleBot a déjà répertorié les connexions... Lire à ce sujet les différents communiqués sur les datacenters des acteurs du search : Google, Microsoft, Yahoo!, remonter les sources et vous faire votre propre idée de la puissance de calcul des différents opérateurs du Search.

Nous y voilà (enfin). Chaque jour, la plupart des participants à la course au Pandaranol lancent des actions de masse, sur des réseaux de sites plus ou moins visités, plus ou moins bien "notés"...

Résultat : les outils de positionnement sont perdus et n'arrivent à suivre ces grands mouvements de flux. Lorsqu'ils interrogent les différents datacenters, ils obtiennent eux-même une copie à un instant T, qu'ils vont ensuite archiver dans leurs propre base de données. Ce qui nous donne 2 niveaux d'obsolescence.

Or, avec la pression qu'engendre un concours de référencement / positionnement, vous imaginez le stress des concurrents ;-)

Chaque soir à 19h, MyPoseo (un des sponsors du concours) fournit un classement qui sert de base officielle aux organisateurs (Seo World Cup).

De leur côtés, certains participants utilisent leurs propres outils, comme Backlink qui a livré une étude sur l'état de la course avec Majestic SEO.

D'autres utilisent Ranks, et la gazette de Pandaranol livre encore un classement différent...

Pour parachever le tout, n'importe quelle requête manuelle (http://72.14.203.44/search?q=Pandaranol&hl=fr&pws=0) renverra évidemment sa propre image des résultats à l'instant T.

Ainsi par exemple, le Pandaranol 3615seo.fr est classé ce jour 11ème sur MyPoseo, à la position 281 (source : https://www.myposeo.com/fr/contest/seoworldcup alors qu'il n'apparait pas sur la Gazette de Pandaranol (source : http://mind2web.fr/)

L'article hier de Backlinker sur son blog coolioo.fr, intitulé "pandaranol analyses des résultats 2 semaines avant la fin" publie un extrait du classement réalisé avec Majestic SEO, qui donne 3615seo en 321ème position. Il faut préciser que d'après la date notée sur les graphiques publiés, les test ont été réalisés le 15.06.2011, soit il y a 2 jours.
Source : http://www.coolioo.fr/pandaranol-analyses-des-resultats-2-semaines-avant-la-fin/

La requête manuelle, effectuée ce vendredi 17.06.2011 à 13h30 quant à elle l'affiche sur le 27ème page de résultat du datacenter Google visé.

Cet article illustre donc la difficulté à estimer le positionnement d'un site sur un terme à un instant T ;-)

30 mai 2011

Pandaranol

Concours de positionnement démarré la semaine dernière, Pandaranol vise haut et loin des sentiers battus, en proposant un objectif à atteindre très rapidement (fin du concours au 1er juillet 2011). La méthodologie traditionnelle de référencement naturel s'en trouve de fait trop limitée car insuffisante, voire inadaptée.

Les participants (dont le nombre approche la centaine ce jour), principalement des référenceurs indépendants (œuvrant en solo ou en équipe), et des agences de référencement vont donc devoir mettre les bouchées doubles pour atteindre avec Pandaranol la première page de résultat de Google.fr en un mois.

C'est peut-être la raison pour laquelle certaines figures emblématiques du référencement francophone ont décliné l'invitation de se joindre au concours, car quelles que soient les tactiques et indépendamment des outils employés, il va falloir utiliser une large palette de moyens, ce qui va demander, in fine, beaucoup de temps.

Quoiqu'il en soit, le blog du référencement de sites internet à Nantes souhaite la bonne chance aux participants, avec une mention toute spéciale au Pandaranol du site 3615 SEO ;-)