Making of 06/10/2012 à 13h05

L’algorithme de Google, sur Rue89 et dans « Place de la Toile » sur France culture

France Culture"

Algorithme : Wikipédia nous informe que le mot vient du nom latinisé du mathématicien arabo-musulman Al-Khawarizmi, surnommé « le père de l’algèbre ». Mais il est une formule algorithmique qui constitue un secret aussi bien gardé que la recette du Coca Cola : celle de Google, pour le classement des sites internet dans les pages de résultats du moteur de recherche.

C’est par une discussion autour de cet algorithme, mais pas seulement, que Rue89 et l’émission « Place de la Toile » de France culture inaugurent ce samedi un nouveau partenariat.

Ce partenariat nous réjouit car l’émission conçue et animée par Xavier de la Porte s’intéresse intelligemment à l’impact, la philosophie et les usages de la révolution numérique, avec une approche qui rejoint celle de Rue89.

Nous concevrons et animerons donc régulièrement des émissions ensemble, sur des thèmes choisis en commun et qui feront l’objet d’un traitement à l’antenne de France culture et en ligne, sur les deux sites.

La première, enregistrée cette semaine à Poitiers, dans le cadre des Assises du journalisme qui se sont tenues dans cette ville, porte donc sur les algorithmes. Animée comme chaque semaine par Xavier de la Porte, elle réunissait :

  • Pierre Haski, cofondateur de Rue89 ;
  • Eric Scherer, responsable de la prospective à France Télévisions et auteur du livre « A-t-on encore besoin des journalistes ? » (éd. PUF, 2011) ;
  • Olivier Ternes, responsable du Search Engine Optimization (SEO) au groupe Sud-Ouest à Bordeaux.

Le Panda de Google

SEO ? C’est justement la « science » qui cherche à percer les secrets de l’algorithme de Google, et permettre à des articles de se retrouver sur la première page des requêtes du moteur de recherche, étant entendu que la plupart des internautes vont rarement au-delà...

Une tâche d’autant plus difficile que Google modifie son algorithme en permanence, parfois pour des détails imperceptibles, mais de temps en temps avec un « big bang » qui modifie sérieusement la donne pour les sites web. L’an dernier, par exemple, le programme Google Panda a été lancé pour lutter contre les « fermes de contenus », ces agrégateurs de liens qui ne produisent pas de contenus originaux mais étaient particulièrement bien référencés.

Le Panda a fait son effet, et certains sites ont perdu jusqu’à 90% de leur trafic car les modifications de l’algorithme les ont fait disparaître du chemin du « robot » Google.

On le voit, l’enjeu est énorme pour les sites, qui multiplient les adaptations supposées Google-compatibles, avec mots-clés répétés, titres sans jeu de mots, et des tas d’ajustements techniques destinés à séduire le robot. Au point de formater l’écriture web dans une certaine mesure, pour entrer dans le moule du moteur de recherche quasi-hégémonique en France (plus de 90% du marché), bien plus qu’aux Etats-Unis.

C’est cet enjeu qui sera abondamment décrit et discuté au cours de l’émission « Place de la Toile », France culture et Rue89, diffusée ce samedi à 18 heures sur l’antenne de France culture et « podcastable » ensuite sur le site de l’antenne.

« #geonpi »

L’émission parlera également des Pigeons qui ont défrayé la chronique cette semaine, avec la participation de Benoît Thieulin, un entrepreneur du Web qui fait entendre une autre musique que celle de la volaille révoltée.


Le logo de l’émission « Place de la Toile » (FranceCulture.fr)

Publié initialement sur
France Culture
Infos pratiques
Place de la toile

Une émission de France culture diffusée le samedi de 18h10 à 18h56. Podcastable après la diffusion. La page de l'émission. Ce samedi, en partenariat avec Rue89.

  • 9942 visites
  • 12 réactions
Vous devez être connecté pour commenter : or Inscription
  • Knawkyball
    Knawkyball
    http://www.pentakonix.fr
    • Posté à 13h57 le 06/10/2012
    • Internaute 157499
      http://www.pentakonix.fr

    Attention à la déformation des propos et à la récupérations des mots encore une fois on utilise des expressions à tord et à travers : Un Algorithme n’est pas une formule magique secrète ... La recette de Coca Cola n’a rien d’une formule algorithmique.

    L’algorithme est le découpage de la résolution d’un problème en instruction élémentaire et non ambiguës, point barre.

    L’algorithme de Google n’a d’algorithmique que de sens que d’un point de vue « Programmation/développement/modèle mathématique » et n’a aucun sens avec la vue que vous mettez en avant « pertinence » des résultats et surtout « formule secrète ». « vous » mélangez des termes en les utilisant dans n’importe quel sens et instaurez la confusion dans la tête des quidams.

    • zatura
      zatura répond à Knawkyball
      en voyage sur le net
      • Posté à 18h49 le 06/10/2012
      • Internaute 192251
        en voyage sur le net

      Et qu’est ce donc qu’une recette si on l’observe assez précisément ? Je vous le donne en mille, une suite d’instruction élémentaire et non ambiguë.

      Prendre des oeufs
      Les casser dans un saladier
      Ajouter X grammes de farine
      Mélanger

      Ce sont des actions élémentaires. On peut donc pour le non-instruit utiliser l’analogie de la recette de cuisine pour expliquer le principe d’un algorithme. Et l’algorithme de Google entre également dans cette définition. Comme dans une recette de cuisine l’ordre d’ajout des ingrédients est important et on ne sait aujourd’hui pas à quel attribut google donne le plus d’importance.

  • vieilanarfatigué
    vieilanarfatigué
    Changer le monde, c'est se (...)
    • Posté à 14h29 le 06/10/2012
    • Internaute 125168
      Changer le monde, c'est se (...)

    J’ai rien compris !

    • islamiste
      islamiste répond à vieilanarfatigué
      Don't panic, I'm not me ...
      • Posté à 19h55 le 06/10/2012
      • Internaute 83149
        Don't panic, I'm not me ...

      Une question de fric comme d’hab, et on brode autour ... science, journalisme, culture.

      En gros on veut savoir comment arriver en haut de la liste pour attirer les annonceurs .... Bah l’indépendance économique de l’information ne sera pas au programme.

      • vieilanarfatigué
        vieilanarfatigué répond à islamiste
        Changer le monde, c'est se (...)
        • Posté à 09h14 le 08/10/2012
        • Internaute 125168
          Changer le monde, c'est se (...)

        merci de ton aide. ça n’a aucun intérêt sur le plan disons, intellectuel....le bordel ambiant ordinaire quoi !

  • Hurz
    Hurz
    -
    • Posté à 14h33 le 06/10/2012
    • Internaute 110884
      -

    « mathématicien arabo-musulman »
    non, il était Perse

    • yabon
      yabon répond à Hurz
      Cyborg marxien en service
      • Posté à 16h05 le 06/10/2012
      • Internaute 98602
        Cyborg marxien en service

      Ouf !

  • Taladris
    Taladris
    Ancien observateur
    • Posté à 16h25 le 06/10/2012
    • Internaute 141499
      Ancien observateur

    L’intro est un peu vaseuse : il n’y a pas que Google qui utilise des algorithmes. Votre ordinateur en utilise des dizaines (et probablement beaucoup plus) à chaque instant.

    Quand vous faites une addition avec des nombres à plusieurs chiffres, c’est aussi un algorithme ; -)

    • sandy keelow
      sandy keelow répond à Taladris
      développeur
      • Posté à 09h13 le 07/10/2012
      • Internaute 131307
        développeur

      Le simple fait de se lever de son lit pour aller pisser est un algorithme (et attention à respecter l’ordre d’exécution des instructions ^^)

  • egide
    egide
    Littéral
    • Posté à 01h48 le 07/10/2012
    • Internaute 45067
      Littéral

    L’activité principale de Google, c’est le «  search  » comme dit Mme Fleur Pellerin sous-ministre à l’économie numérique, c’est à dire la recherche d’information sur Internet.

    Google a commencé ses activité sur le web en 1998, il y a 14 ans.
    Sur la page d’accueil de google, on saisit quelques mots clé et on obtient en retour une liste de page web dont le contenu a quelque chose à voir avec la signification des mots de la demande de recherche d’information.

    Souvent, la liste des pages web que google propose en réponse à une recherche est plutôt pertinente. Voire très pertinente.

    Aussi google détient plus de 80 % de part de marché sur le peu concurrentiel secteur des moteurs de recherche.

    Aucune industrie que l’industrie informatique ne permet des positions aussi dominantes que celle de Microsoft pour les systèmes d’exploitation d’ordinateur et les logiciels de bureautique, que celle d’Intel pour les microprocesseurs ou que celle de google pour la recherche d’information sur le web.

    Mme Fleur Pellerin qui ne s’y connait guère en numérique comme n’importe quelle personnalité politique d’ailleurs dit que le «  search  », il faut pas y aller.

    Plus la bêtise énoncée est énorme, mieux ça passe surtout pour le numérique. Les français, en général, ont horreur du numérique, ça tombe bien pour Fleur Pellerin qui peut débiter ses âneries de bête à concours surfaite des écoles de l’élite exceptionnelle nationale.

    Pour pouvoir répondre aux demandes de recherche d’information sous forme de la liste des pages web qui proposent des contenus sur un sujet donné, google scrute en permanence tous les sites web qui souhaitent être référencés par les moteurs de recherche.

    Des programmes, sortes de robots logiciels qui fonctionnent automatiquement lisent les pages web et les classent selon diverses techniques dans des bases de données gigantesques. Celles que l’on consulte lors d’une recherche sur le web.
    On appelle ces programmes des bots justement.

    Le programme qui gère les demandes d’information est le fameux algorithme dont on ne sait pas grand chose, tellement secret car on ne peut pas consulter les sources (la liste des instructions qui traitent la demande d’information et proposent la liste des réponses dans l’ordre décroissant de la pertinence).

    Finalement, c’est plus facile de ne rien décrire de la manière dont procède les moteurs de recherche, et faire comme si c’était évident. Un truisme  :

    - Qu’est-ce tu veux savoir ?
    - T’as qu’à taper dans google pour connaitre les réponses.

    D’ailleurs quand je me pose la question ontologique sur moi-même, je sais dans quel état j’erre en tapant mon prénom et mon nom patronymique, le tout entre deux guillemets anglais pour savoir tout sur moi mieux que je ne le sais moi.

    De plus, on ne dis plus «  connais toi toi-même  » mais plus justement  :
         « googlelise-toi toi-même  ! »

    Si google n’a pas inventé le principe du moteur de recherche, il l’a propulsé au rang d’une redoutable efficacité industrielle et offert l’accès à l’information le plus exotérique qui soit.

    Pour utiliser google, il n’est aucunement besoin d’un diplôme ou d’un permis ou d’une licence ou d’un statut. Il suffit juste d’un accès à Internet pour demander n’importe quoi sur tous les sujet possibles et imaginables qui ont fait l’objet de pages web.

    Comme par hasard, n’est-ce pas, google est le premier industriel de la numérisation des savoirs et de l’information.

    Non seulement google examine sans faillir tout ce qui paraît sur le web mais contribue à ce que tous les objets de la connaissance fasse l’objet d’une information sur Internet.

    L’élite française est bien embêtée qui assoit sa domination dans la culture en grande partie par la rétention d’informations et se réserve l’usage des savoirs et de la pensée.

    Et pendant ce temps là, les pigeons du web français volaient, volaient, volaient .... Et la Hadopi surveillait, surveillait, surveillait le désert numérique des français

    • sandy keelow
      sandy keelow répond à egide
      développeur
      • Posté à 09h26 le 07/10/2012
      • Internaute 131307
        développeur

      « Pour utiliser google, il n’est aucunement besoin d’un diplôme ou d’un permis “

      Non mais il faut quand même maîtriser un minimum l’outil sans quoi on n’obtient souvent que des liens commerciaux d’intérêt douteux voire même des sites de phishing (je me souviens d’un cas d’école ou quand on tapait ‘open office’ dans google.fr le premier lien qui sortait était un site proposant le téléchargement après paiement par sms à une société en argentine LOL)

      Le plus ennuyeux restant les liens sur des fermes de contenu (et autres innombrables comparateurs de prix...) dont ‘l’algorithme’ de Google même dans sa nouvelle version ‘Panda’ ne s’est pas encore débarassé ...

  • Gralisto
    Gralisto
    bonne
    • Posté à 02h47 le 07/10/2012
    • Internaute 186611
      bonne

    Bonsoir,
    Propager la légende du secret de la recette du Coca-Cola, c’est pas très reluisant : vous savez très bien qu’avec la chromatographie (phase liquide ou gazeuse) et la spectrométrie de masse, il n’y a pas de secret de fabrication ou de formulation qui tienne. Donc vous contribuez à cette légende, qui est en fait une publicité inespérée pour Coca-Cola. Les lieux communs ont la vie dure chez les journalistes. Dommage.