Décryptage 17/05/2011 à 13h10

Pour nettoyer le Web, le Panda de Google sort les griffes

Jean-Baptiste Allemand | Journaliste


Montage photo d’un panda armé dans une rue (Teamstickergiant/Flickr)

L’animal a bouleversé le référencement de nombreux sites web aux Etats-Unis, il débarquera bientôt en France et personne ne sait vraiment à quoi s’attendre. Ce Panda qui fait si peur, c’est le nom du nouvel algorithme de Google, le système mathématique au cœur du moteur de recherche.

Les sites web se livrent une guerre sans merci pour avoir les faveurs de l’algorithme de chaque moteur de recherche, cet outil mathématique qui classe les sites à chaque recherche effectuée par un internaute. Etre parmi les premiers résultats affichés après une recherche, c’est l’assurance d’attirer le plus d’internautes, comme le confirme une étude récente.

Surtout en Europe, où Google occupe une position de quasi-monopole. Alors quand les Californiens annoncent qu’avec Panda, c’est l’algorithme du moteur qui a été refondu en entier, l’ensemble des sites Internet tremble et redoute le coup de bambou.

Google espère améliorer la « qualité » des résultats des recherches, c’est-à-dire leur pertinence au regard de l’information recherchée par l’internaute. Dans le collimateur du moteur : les « fermes de contenu », des sites groupant des milliers d’articles à faible valeur ajoutée, mais bourrés de mots-clés pour attirer les clics.

Autres cibles : les agrégateurs (qui dupliquent le contenu d’autres sites), les comparateurs de sites et les sites sur-référencés grâce à des techniques frauduleuses (ce qu’on appelle le « black hat SEO »).

Le brûlant besoin de communiquer

Google, d’habitude si avare en informations concernant son algorithme tellement secret, a dévoilé plusieurs de ses critères de conception :

  • proportion de pub sur le site
  • temps passé par l’internaute sur le site
  • fréquence de partage du contenu sur les médias sociaux

Les ingénieurs californiens ont en même temps révélé qu’il se sont appuyés sur des « tests humains », à travers des questions envoyées à un panel d’internautes.

Olivier Duffez est consultant en référencement et tient le site WebRankInfo. Pour lui, cette mise à jour va dans le bon sens :

« Un paquet d’internautes sont contents. Aujourd’hui en France, quand on analyse les résultats de milliers de mots-clés liés au voyage, on voit que sur les dix premiers sites trouvés, huit sont des comparateurs. Il faut que ça change. »

Les mises à jour, Google en fait régulièrement. Mais celle-ci est majeure et, surtout, Google communique dessus, ce qui est inédit.

Sans doute parce qu’il est la cible de critiques croissantes des internautes, qui lui reprochent d’être incapable de lutter contre le spam. Cela a poussé Blekko, un moteur concurrent, à proposer un filtrage des fermes de contenu.

Pour Frédéric Montagnon, responsable marketing de l’agrégateur Wikio, Google veut récupérer « le leadership de l’image », qu’il aurait perdu :

« Google, ce n’est plus la start-up californienne sympa des débuts. Aujourd’hui, c’est Facebook qui monopolise l’attention des
journalistes. Avec Panda, Google cherche à montrer qu’elle continue à faire évoluer le Web. »

Certains sites ont perdu 98% de leur visibilité

Lancée dans le monde anglo-saxon depuis plusieurs semaines, Panda a eu une incidence sur 12% des requêtes, d’après Google. Les premiers résultats sont ravageurs sur de nombreux sites, certains ayant vu une perte de référencement de 98%, selon des premières mesures à prendre avec du recul, comme l’indiquent les spécialistes contactés.

Au Royaume-Uni, le portail Wikio.co.uk, qui agrège les articles provenant de sites d’information et de blogs, est une des principales victimes du nouvel algorithme. Pas de quoi bouleverser Frédéric Montagnon :

« Les activités du groupe se sont diversifiées, Wikio ne représente que 3% de notre chiffre d’affaires. Au contraire, on salue ce changement. Il a permis d’améliorer nos résultats sur d’autres sites. »

En France, on ne sait pas exactement quand le Panda va débarquer. Olivier Duffez, dans le cadre de ses formations, côtoie de nombreux responsables de sociétés qui attendent avec une certaine fébrilité :

« Ce n’est pas la panique, mais il y a de réelles interrogations. Y compris de la part de sites offrant des contenus de qualité, et qui ne devraient pas s’inquiéter. »

Zones d’ombre et dommages collatéraux

Il semble que dans le monde anglo-saxon, le système Panda ait dégradé de manière injustifiée le résultat de plusieurs sites proposant pourtant un contenu original et de qualité. Pour Olivier Duffez, « vu l’ampleur de cette mise à jour, certains effets de marge étaient inévitables. »

Ce qui le gêne plus, c’est le flou qui entoure certains nouveaux critères. Pris entre désir de communication et préservation des secrets de son algorithme, Google n’a peut-être pas trouvé l’équilibre parfait :

« A Google, on nous dit que désormais, si une partie d’un site est considérée comme étant de mauvaise qualité, alors c’est le site entier qui sera affecté. Mais on ne sait pas de quelle proportion on parle.

Si seulement deux pages d’un site peuvent faire cet effet, imaginez le casse-tête pour un site de plusieurs milliers de pages. Du coup, les rumeurs circulent... »

Et selon Olivier Duffez, certaines précisions de la part de Google ont été pour le moins troublantes :

« Sur les sites de questions-réponses [du type du fameux Yahoo Answers, ndlr], lorsqu’une question est posée et qu’il n’y a pas encore de réponse, Google recommande de ne pas indexer la page pour éviter qu’elle apparaisse dans les résultats et que le site soit pénalisé. Mais alors, comment font les internautes pour répondre à la question ? »

Et les intérêts personnels de Google, dans tout ça ? En faisant apparaître dans les résultats un certain nombre de ses propres produits, la firme californienne se pose en juge et partie.

Un complot pour éliminer les concurrents ?

En février dernier, elle a admis qu’elle a mis une place une « white list » de sites qui seraient non soumis à certains critères algorithmiques. Microsoft a fait de même pour son moteur Bing.

Selon Google, il s’agit de corriger manuellement les effets indésirables de certains de ses outils, comme SafeSearch, qui filtre les sites pour adultes. La firme prend comme exemple le site essex.edu, le site d’une université du New Jersey, bloqué par SafeSearch qui y voyait le mot « sex ». Google affirme également qu’aucune « white-list » n’existe spécifiquement pour Panda.

Pourtant, ces listes éveillent les soupçons, à l’heure où Google, déjà impliqué dans des polémiques liées à l’utilisation de données personnelles, fait l’objet d’enquêtes aux Etats-Unis et en Europe pour abus de position dominante.

« Google a tendance à vouloir déclasser les produits des sites qui font le même métier que lui », dénonce Frédéric Montagnon en prenant l’exemple de Google Actu, un agrégateur concurrent de Wikio, qu’il considère comme « moins complet » :

« L’an dernier, Google a fait une mise à jour qui a fait baisser le référencement des comparateurs. Or, juste après, ils ont lancé la version française de Google Products... qui est un comparateur. »

On peut aussi citer le cas de YouTube. Propriété de Google, la plate-forme de vidéos a profité du nouvel algorithme malgré un contenu qui est loin de correspondre aux requêtes des internautes, avec certaines pages bourrées de spams. Olivier Duffez :

« Voilà le genre de pages que Google nous demande de ne pas indexer ! C’est un peu perturbant de voir que YouTube a gagné en référencement avec ça... »

Un vaste plan anti-concurrence ? Frédéric Montagnon ne croit pas une minute à cette hypothèse :

« Je ne suis pas sûr que Google puisse se permettre de biaiser son algorithme comme ça. Si c’était avéré, ce serait dangereux. La pertinence d’un moteur est avant tout liée la confiance qu’on lui accorde. »

Illustration : montage photo d’un panda armé dans une rue (Teamstickergiant/Flickr)

Mise à jour à 15h28 : Rectification. Les chiffres liés aux pertes de certains sites anglo-saxons concernent leur référencement, et non leur trafic.

  • 63950 visites
  • 101 réactions
Vous devez être connecté pour commenter : or Inscription
  • Yaumegui_from_Paris
    Yaumegui_from_Paris
    « Il ne suffit pas d'être (...)
    • Posté à 13h27 le 17/05/2011
    • Internaute 8001
      « Il ne suffit pas d'être (...)

    Personnellement, depuis quelques années, je trouvais qu’il y avait de plus en plus de bruit inutile dans les recherches avec Google. Des sites parasites apparaissaient systématiquement en premier dans les résultats de recherches.

  • asselin
    • Posté à 13h47 le 17/05/2011
    • Internaute 62896

    C’est une bonne chose pour l’utilisateur, et surement pas une tromperie pour les opérateurs de référencement ! Google a toujours privilégié la pertinence (c’est d’ailleurs ce qui a permis à cette petite start-up de pulvériser Yahoo, MsnSearch et autre), son client n’étant pas une poignée de gros annonceurs, mais un multitude immense d’utilisateurs (cf La Longue Traîne, de Chris Anderson).

    Par ailleurs, peut être certains riverains se demandent pourquoi et comment se font les évolutions sur le web ? Il est géré, jusqu’à présent, sur le double mode de l’évolution coopérative et de la neutralité du net, qui n’est pas l’objectivité des contenus, mais le principe d’intervention de « bout-en-bout » sur un réseaux distributif où tous les contenus ont autant de chance de circuler (d’où le marché pharaonique de Google, la méfiance permanente des états, et les tentations de certains gloutons...)

    Sur la neutralité des réseaux (par son théoricien) :
    LienNETWORK NEUTRALITY, BROADBAND
    DISCRIMINATION

    Sur le w3c :
    W3C

    Autre lien passionnant sur le sujet :
    Lien

    Pour se repérer, un petit historique résulé du web (je prèche pour ma chapelle là !) :
    Lien

  • gounzor
    gounzor
    en lutte
    • Posté à 14h04 le 17/05/2011
    • Internaute 129458
      en lutte

    Les problèmes avec Google c’est surtout qu’il est impossible d’obtenir un contact humain, avec un interlocuteur humain, tout est pensé pour limiter au maximum les effectifs humains chez google, et du coup toute forme de solutions individuelles à certains problèmes.

    Ce qui crée une sorte de totalitarisme incroyable dans la gestion de google avec les webmasters, les créateurs de contenus, ou les éditeurs de pubs (sauf si on est un énorme acteur du web...).

    Alors que ceux qui font vivre google ce sont ceux là justement, en créant du contenu intéressant qui fait venir du monde, puis en affichant des pubs à coté de leur contenu, il rendent possible et lucratif le marché.

    Mais ils sont, grâce à ce système unilatéral total et absolu de décision, complètement mis à l’index, considérés comme des petits ouvriers payés une misère et déconsidérés par le grand patron du web, google.

    Pour moi c’est d’abord cette position de google qui est la plus inquiétante et qui justifie beaucoup de méfiance.
    Cela dit ça n’est pas uniquement lié à eux, Microsoft, Apple, Yahoo, Facebook.... tous ces groupes seraient à surveiller de la même façon, car ils ont tous ce même appétit totalitaire.

  • raphael.w
    • Posté à 14h20 le 17/05/2011
    • Internaute 65284

    Et c’est plus ou moins normal ! Avec le temps, la technique pour arriver à referencer tout et n’importe quoi s’affine. Resultat, on arrive à référencer de la merde comme étant intéressante.
    C’était la même chose au départ avec les balises méta, dans lesquelles il suffisait de rentrer ses mots-clefs, qui pour certains n’avaient aucun rapport avec le site en question mais permettait de faire du trafic. Google l’a capté et a minimisé l’impact des balises meta !

    Aujourd’hui rebelote avec les comparateurs en ligne. Il n’est pas normal quand on fait une recherche sans le mot « comparateur » de tomber sur 8 liens de site de comparaison.
    Google s’adapte est c’est plutôt bien, après si certains sites se reposent sur google pour leur buisness model grand bien leur fasse, mais il faut s’attendre à un retour de bâton si leur stratégie est pourrie.

  • daddycork
    daddycork
    employé du privé
    • Posté à 15h08 le 17/05/2011
    • Internaute 87153
      employé du privé

    Cela va peut-être contribuer à l’émergence de nouveaux moteurs de recherche ou de moteurs de recherche alternatifs.

    Quoi qu’on pense de Google par rapport à la neutralité du web, elle reste une entreprise privée qui gère ses intérêts.

    Dans le futur, il faudra sûrement recouper ses recherches sur le web avec plusieurs moteurs de recherche. Je parierai même sur la création de logiciels comparant les résultats des différents moteurs pour proposer la recherche la plus pertinente (vous rappelez-vous de Copernic ce méga-moteur de recherche délaissé du grand public pour Google ?).

    Le web évolue ...

Verbes thématiques