Panda, Pingouin & co : connaissez-vous le zoo de Google ?

Les services de Google sont devenus ces 15 dernières années des outils indispensables dans nos vies numériques. C’est évidemment côté recherche qu’il est le plus difficile de s’en passer (même si des alternatives existent), mais derrière cette pioche indispensable pour creuser le Web se cache une arme qu’il faut absolument savoir manier quand on gère un site Internet. Car en Occident, Google règne sans partage sur ce marché, clé du trafic et donc du business du moindre site qui vise une rentabilité “classique” via la publicité. De nouveaux métiers ont logiquement émergé pour répondre à ces enjeux économiques et décrypter la marche à suivre pour référencer correctement son contenu. Du webmaster au pigiste, Google impose sa loi et a modifié jusqu’à la façon d’écrire des journalistes d’une majorité de sites, qui par ce biais s’assurent de faire figurer leur prose en bonne place sur le moteur de recherche. Ces bonnes pratiques d’optimisation de site obéissent à des règles qui changent régulièrement au gré des optimisations de Google et qui répondent à des noms d’animaux comme actuellement Panda ou Pingouin. Prenez votre ticket et suivez le guide, c’est parti pour la visite du zoo made in Mountain View.

Commençons par expliquer la problématique. Pour un site de contenu comme Geekzone.fr, malgré l’absence de pub, il est important d’être bien classé, tout simplement pour maximiser les chances de faire connaître la marque et le travail effectué. Apparaître le plus haut possible sur les requêtes de mots clés tapés par les internautes dans la barre de recherche est donc un objectif important. Exemple avec le dossier dédié au très controversé Star Citizen, au début du mois d’octobre.

Google Seach SEO 01

Pour parvenir à faire apparaître GZ sur l’expression “Star Citizen”, un travail d’optimisation pour le moteur de recherche a été effectué. On parle de “SEO : Search Engine Optimization. Pour booster ça sur le site, il a fallu différentes actions :

  • Des modifications du code / thème de Geekzone.fr pour répondre à des critères techniques de Google News (merci à MisterP).
  • Une redéfinition des catégories du site Geekzone.fr avec quelques optimisations sémantiques sur les TITLE (titres) et contenus.
  • La publication de papiers et dossiers comme savent le faire Caféine, Faskil et autres contributeurs.

Cette visibilité permet au site d’acquérir de la notoriété sur Facebook et génère également d’autres liens issus de diverses plateformes. Ces “links” depuis d’autres sites sont considérés par Google comme des votes. Ils sont cruciaux pour générer du trafic durablement depuis le moteur de recherche.

Ce cercle vertueux (critères techniques, contenu et liens), certains sites l’ont bien compris et poussent parfois le curseur un peu trop loin :

  • Clickbaiting dans Google News
  • Contenu traduit avec Google Translate
  • Génération de liens via des concours Facebook, ou autres techniques factices

Ces techniques, souvent trop utilisées par les sites des secteurs PPP (Poker, Porn, Pills), sont considérées comme du spam par Google. Le géant de la recherche a souhaité y remédier en réalisant un travail important de mise à jour de son algorithme, et de communication via son porte-parole historique, l’irascible Matt Cutts.Google Seach SEO 02 Matt Cutts

L’enjeu pour Google : des résultats de qualité

Pour limiter ces actions de spam qui permettent de gagner en visibilité en trichant sur la qualité du contenu (voire sa nature), Google modifie régulièrement sa façon de faire le tri, pour corriger la surpondération de certains critères SEO, comme les votes par exemple. Sur Geekzone.fr, vous avez certainement déjà entendu parler du Google bombing : il existe un sujet dédié sur le forum ! Mais demandons à Google ce que désigne ce terme pour que les choses soient claires pour tout le monde :

Le bombardement Google (anglais : Google bombing) (ou bombardement de Google) est une technique de référencement visant à influencer le classement d’une page dans les résultats du moteur de recherche Google. (Source)

Il s’agit donc de faire des liens en masse vers une URL afin de la faire remonter dans Google sur un mot clé “non pertinent”. Voici quelques exemples historiques :

Google Seach SEO 03

Pour éviter donc ce genre de pratiques, Google a depuis quelques années initié un double mouvement :

  • Sortie d’un correctif pour nettoyer ses pages de résultats
  • Communication importante auprès des webmasters, éditeurs de sites, responsable e-commerce, etc.

C’est là que les algorithmes Panda et Pingouin rentrent en jeu. On y arrive enfin !

Les terrifiants Panda et Pingouin de Google…

Google Seach SEO 04

La première communication forte de Google est apparue dans un billet intitulé Finding more high-quality sites in search le 24 février 2011, publié par l’équipe en charge de la lutte contre le spam. Ce filtre Panda est orienté contenu, et a permis à Google de retirer de ses résultats des pages de faible qualité. En ligne de mire de Panda, peu de bambou, mais plutôt des sites comme les agrégateurs de flux RSS, les comparateurs de prix et autres sites de questions-réponses.

Google Seach SEO 05

Un truc simple à corriger pour éviter de se prendre un coup de patte de Panda, c’est de soigner ses tags par exemple ! Imaginez la situation suivante :

  • http://www.geekzone.fr/tag/jeux-video : cette page est ok
  • http://www.geekzone.fr/tag/jeu-video : celle-ci a existé, et n’est plus d’actualité depuis le nettoyage de printemps mené par Caféine et MisterP
  • http://www.geekzone.fr/tag/jeux-videos : ce tag n’est pas possible, on est sur GZ, on sait qu’il n’y a pas de s à vidéo !

Comme vous le voyez, c’est une vraie plaie, car les URLs sont généralement très proches, et cela génère du contenu dupliqué, synonyme de risque Panda. Mais diantre, pourquoi utiliser le terme Panda pour cet algorithme ?

En février 2011, la communauté SEO avait nommé cet algorithme “Farmer”, en référence aux fermes de contenus. À ce sujet Google nous dit :

Une ferme de contenus est un site Web qui publie du contenu de peu de valeur dans le but de générer des revenus publicitaires. Parce qu’ils sont conçus et réalisés pour être bien référencés sur le Web, riches en publicité et à bas coût de production de contenu, ils sont faciles d’accès mais pauvres en contenu. (Source)

Oui, la qualité d’écriture de Wikipedia FR est… discutable, mais ce n’est pas le problème. En interne, Google avait nommé cet update Panda, en référence à Biswanath Panda et Navneet Panda, qui sont deux ingénieurs travaillant à Mountain View et certainement à l’origine de cet algorithme luttant contre le contenu de mauvaise qualité.

Dans les semaines qui suivirent le lancement de l’update, Google retiendra le terme de Panda dans ses communications. Et ce bon Panda deviendra un as du Kung Fu pour exploser les vils sites proposant un contenu de faible qualité. Ou alors je confonds avec un film…

L’heure des Pingouins

Google Seach SEO 06

En 2012, Google Search va se lancer, avec Pingouindans une lutte contre les effets pervers des liens entrants. Nous l’avons vu avec le Google bombing cité plus haut, les liens sont considérés par Google comme des votes, et peuvent être puissants pour positionner un site ou une URL sur certaines requêtes. Le 24 avril 2012, un billet intitulé Another step to reward high-quality sites annonce la fin de la récré.

Ce nouveau patch aux petites ailes va plus précisément annihiler les effets de tout ce qui est technique de suroptimisation pour les moteurs de recherche, comme les liens non naturels.
Pour garder Geekzone en exemple, imaginez Caféine ou Faskil en train de linker un mot clé spécifique depuis un article qui n’a rien à voir. “Crédit” qui balancerait vers un charmant établissement d’endettement bancaire, voilà qui vous ferait plaisir !

Google Seach SEO 07

Sortie de son contexte, ce genre de liens ne serait pas naturel, c’est simple à comprendre. Et pourtant ! Il y a 4 ans ces pratiques pullulaient encore :

  • Les réseaux de sites publiant de simples communiqués de presse (dont l’audience se limitait aux personnes travaillant dans le SEO…) utilisaient ça pour faire remonter leurs infos inintéressantes.
  • Les footers ou bas de page des sites qui ressemblaient à des guirlandes de Noël avec des pelletées de liens à base de crédit pas cher, assurance auto, voyage pas cher, etc.
  • De véritables régies ont été fondées dans les années 2000 pour faire de la location de liens, contre de vraies pièces d’or. Ces business models sur l’achat de lien ont quasiment cessé depuis le débarquement du Pingouin.

Autre technique de sur-optimisation qui se fait repérer par le radar de Pingouin : le contenu rédigé avec trop de mots clés. L’exemple ci-dessous proposé par Google est assez parlant :

Google Seach SEO 08

Depuis 2012, différentes versions de Pingouin sont sorties pour limiter les effets de bord de ces pratiques infâmes. Plus récemment, le 23 septembre 2016, Google Search indique avoir intégré la technologie Pingouin dans ses facteurs de ranking, et que celui-ci s’applique en temps réel. Au fait, il faut parler de Pingouin en anglais. Ce qui prouve qu’un Penguin n’est pas forcément méchant…

Google Seach SEO 09

30 millions d’amis

Google utilise régulièrement d’autres noms d’animaux dans ses différents projets Google Search. Ainsi le 26 septembre 2013, nous avons eu le plaisir de découvrir Hummingbird (Colibri).

Cet algorithme présenté par Google en 2013 permet de mieux comprendre les requêtes réalisées par les utilisateurs. Hummingbird est capable de cerner le sens des questions naturelles des internautes. Exemples classiques :

  • Qui sera le prochain président ?
  • Comment gagner plein d’argent ?
  • Comment faire pour acheter un iPhone 7 ?

Hummingbird apprend donc chaque jour à afficher de nouveaux résultats et affine sa compréhension via les requêtes web classique mais aussi via Google Now. Il permet de lever certaines ambiguïtés et tente de couvrir les possibilités les plus pertinentes : si vous recherchez foot, vous souhaitez peut être connaître son équivalent en centimètres et pas forcément le nom du dernier ballon d’or ! Autre exemple avec Lion, pour lequel Google affiche des photos de l’animal, et propose aussi des informations sur l’horoscope.

Google Seach SEO 10

Même si Hummingbird n’est pas à la base un filtre contre la sur-optimisation, les nouvelles possibilités offertes constituent des axes de réflexion et de visibilité pour le SEO.

Pigeon, Poney, Opossum : la ménagerie de Google pour vous faciliter la vie

Les mises à jour des critères de classement Google sont courantes. Très courantes ! Johann Godey (Search Quality Manager) déclarait en 2012 :

Pour parvenir à conserver une expérience utilisateur de qualité, Google a procédé à environ 700 mises à jour de l’algorithme en 2012. De quoi rendre encore plus paranoïaque certains experts SEO qui vérifient leurs positions tous les jours. (Source)

Quand celles-ci sont visibles, les personnes travaillant dans le SEO leur donnent des petits noms. Cela permet de prendre du recul sur les baisses de visibilité, de comprendre les variations de trafic. C’était par exemple le cas avec le Poney de novembre 2012. A cette date, beaucoup de sites ont vu leur visibilité évoluer sur des requêtes très recherchées. Et il ne s’agissait pas d’un énième Panda ou Penguin, selon les “non commentaires” de Google.

Google Seach SEO 11

La semaine du 21 juillet 2014, des mouvements sur les requêtes locales ont été observés aux États-Unis. Il s’agissait de la mise en place d’un ensemble de modifications baptisées Pigeon, impactant aussi bien les résultats Google Maps, que des expressions génériques pouvant être géolocalisées comme restaurant, ou location de voiture. En fonction de votre IP de connexion, ces résultats sont maintenant personnalisés dans tous les services Google, de Search à Maps !

Dans la continuité de Pigeon, des modifications ont été observées à la rentrée 2016 sur les résultats Google Maps, qui se mettent à jour beaucoup plus régulièrement. La validation des adresses semble également beaucoup plus stricte. Ces évolutions furent baptisées Google Opossum. Je n’invente rien !

Loin de lasser le visiteur, le zoo de Google permet de mieux appréhender la somme de travail colossale nécessaire pour proposer des résultats pertinents. Des résultats capables de résister aux petits malins qui dédient leur vie à tenter de trouver des raccourcis d’escrocs pour gagner facilement des montagnes de dollars. Malheureusement, il va encore falloir rajouter un paquet d’animaux pour contrer les “vous ne devinerez jamais” et autres “5 raisons de donner le Nobel de Physique à Kim Kardashian”. Ces tonnes de news vides d’information, qui n’existent que pour occuper le terrain et faire tourner les affichages de pub. Espérons que l’arche de Google (et de ses concurrents) soit terminée avant que les internautes ne deviennent définitivement des oies gavées à la rumeur de rumeur, incapables de se rappeler de ce qu’était un contenu de qualité…

 


Note : cet article est l’équivalent d’environ 6 pages de magazine. Il n’est possible de rédiger (ou plutôt écrire / réécrire / corriger / intégrer) des papiers de cette taille que grâce à nos soutiens PayPal, mais surtout à nos patrons. Oui, on sait, ce n’est pas le bon terme. Mais nous, ça nous fait rire. Et quand on reçoit des sous aussi, d’ailleurs. Du coup, merci à vous, qui mettez la main à la poche pour nous inciter à bien bosser ! Et si vous n’avez pas encore franchi le pas, pensez à soutenir Geekzone pour que nous puissions augmenter la cadence !

Vous devriez également aimer…