à lire sur Visualizing.org 06/08/2012 à 13h08

Cartographie de Wikipédia

Une carte interactive, développée en collaboration avec l’Oxford Internet Institute, propose de géolocaliser les articles de Wikipédia selon leur langue et leur sujet. Elle met en évidence des zones à forte concentration et de véritables déserts virtuels.

L’outil n’indique pas le lieu de rédaction des articles, mais la situation géographique des sujets traités : endroits, sites historiques, batailles, etc. Grâce à un portfolio, on peut jeter un œil à quelques exemples : nombre d’auteurs et nombre d’images pour telle ou telle zone linguistique.

Lire sur Visualizing.org
  • 3490 visites
  • 4 réactions

Les autres vigies

Vous devez être connecté pour commenter : or Inscription
  • féric
    féric
    entre 40 et 41
    • Posté à 19h35 le 06/08/2012
    • Internaute 58677
      entre 40 et 41

    Magnifique visualisation et très beau travail technique. Pour les 700000 articles anglais, Firefox m’a tout de même alloué 600Mo.

    Maintenant, reste à savoir ce que nous dit cette carte... L’intensité est-elle lié à l’importance historique du lieu ou reflète-t-elle les personnes qui prennent le temps d’écrire sur ce lieu avec tous les biais que cela implique ?

    • Camille Polloni
      Camille Polloni répond à féric
      Journaliste Rue89
      • Posté à 19h50 le 06/08/2012
        rédacteur
      • Journaliste 62825
        Journaliste

      Je pencherais pour les biais, même si le résultat est intéressant.

    • Spool
      Spool répond à féric
      ici
      • Posté à 00h08 le 07/08/2012
      • Internaute 52054
        ici

      si je comprends bien, l’intensité est le nombre d’occurences du mot décrivant un lieu (ou le nombre d’articles citant ce lieu) ; si le mot Paris (la ville, le lieu) apparaît 10 fois plus dans le wikipedia que Bordeaux (la ville aussi), le point géographique Paris sera 10 fois plus intense ; d’ailleurs c’est un peu ce qui semble se passer comme quoi le vin ne fait pas tout :)
      Il y a peut être (probablement) quelques raffinements, je n’arrive pas à trouver de description précise de ce qu’ils ont fait
      L’intensité qu’on voit, c’est l’importance que donnent « la communauté non concertée des rédacteurs » au lieu (c’est bizarre a dire, mais si chacun décide de citer le même lieu anecdotiquement, le lieu en question prend une importance énorme alors que tout le monde s’accorderait à dire que c’est juste un exemple).
      Ce qu’on appelle importance historique, comme une bataille décisive, semble inaccessible directement à ces méthodes informatiques fût ce avec raffinements ; compter est juste un indice, peut être suffisant, il faudrait comparer le classement que ça donne avec un jugements d’experts (mais lesquels ? !).
      Difficile ensuite de savoir quels facteurs construisent cette intensité, c’est à dire la fréquence de ces références. On devine que plus le lieu est ancien, son influence étendue dans l’espace, le temps et les caractéristiques autres que le lieu, et sa symbolique profonde, plus il est cité. Mais on n’est pas à l’abri de mettre sur un même niveau un sujet important mais peu cité car peu connu ou compris, et un autre ayant connu une popularité ponctuelle un peu comme Paris Hilton pour rester près des lieux. Dans les plus fortes intensités, je serais quand même étonné qu’il y ait des trucs superficiels et populaires comme le lieu de tournage de Harry Potter.

      • féric
        féric répond à Spool
        entre 40 et 41
        • Posté à 19h55 le 07/08/2012
        • Internaute 58677
          entre 40 et 41

        Pour l’intensité, c’est exactement ça.

        La description de ce qu’ils ont fait est assez simple : ils parcourent les articles de wikipedia et à chaque fois qu’un lieu apparait comme cité dans un article, ils comptent un de plus pour ce lieu.

        Ils n’ont pas besoin d’être concerté, si un lieu est cité par de nombreuses personnes c’est qu’il a de l’importance, à moins que mille personnes ne s’amusent à créer un article qui pointera vers un lieu sans intérêt. Cela n’arrive que trop rarement pour être considéré.

        Pour les batailles historiques, en langue anglaise, le résultat est bien plus blanc aux Etats-Unis qu’en Europe alors que cela devrait être l’inverse. Il y a là clairement une prédominance de la langue anglaise et celle-ci influence le résultat/rendu. Si l’on ignore cela, on voit très bien que l’Europe, l’Inde et la Chine sont très fournis en terme de références.

        Les lieux de fortes intensités sont clairement révélateurs d’importance, mais il faut savoir le lire avec discernement pour ne pas se méprendre. La connaissance est toujours nécessaire et cette très belle cartographie ne doit pas le faire oublier.

Verbes thématiques