mardi 12 février 2008

Provenance des contributeurs anonymes

J'étais en train de regarder le site WikipediaVision, qui permet de visualiser sur une carte d'où proviennent les éditions sous IP dans Wikipédia, et je me suis demandé s'il était possible de comptabiliser ces éditions anonymes par pays. Il se trouve que c'est parfaitement possible : les modifications récentes permettent de ne retourner que les éditions sous IP et, en traficotant l'url, on peut en visualiser 5 000 à la suite, ce qui correspond à peu près à 24 heures consécutives. En combinant ça avec un fichier de géolocalisation d'IP disponible chez MaxMind, on obtient les résultats suivants :

France 3529 70,58%
Canada 376 7,52%
Belgique 224 4,48%
Suisse 185 3,70%
Allemagne 121 2,42%
Italie 107 2,14%
Maroc 62 1,24%
Etats-Unis 57 1,14%
Algérie 47 0,94%
Espagne 37 0,74%
Royaume-Uni 22 0,44%
Pays-Bas 21 0,42%
Japon 16 0,32%
Tunisie 16 0,32%
Turquie 14 0,28%
Luxembourg 12 0,24%
Portugal 11 0,22%
Côte d'Ivoire 10 0,20%
Russie 9 0,18%
Finlande 8 0,16%
Brésil 7 0,14%
Malaisie 7 0,14%
Suède 7 0,14%
Taïwan 6 0,12%
Argentine 5 0,10%
Australie 5 0,10%
Chili 5 0,10%
Hong Kong 5 0,10%
Irlande 4 0,08%
Israël 4 0,08%
Polynésie française 4 0,08%
Roumanie 4 0,08%
Arabie saoudite 3 0,06%
Autriche 3 0,06%
Biélorussie 3 0,06%
Hongrie 3 0,06%
Mexique 3 0,06%
Sénégal 3 0,06%
Andorre 2 0,04%
Corée du Sud 2 0,04%
Grèce 2 0,04%
Indonésie 2 0,04%
Madagascar 2 0,04%
Mongolie 2 0,04%
Norvège 2 0,04%
Pérou 2 0,04%
Satellite
2 0,04%
Burkina Faso 1 0,02%
Cameroun 1 0,02%
Danemark 1 0,02%
Europe 1 0,02%
Inde 1 0,02%
Islande 1 0,02%
Kenya 1 0,02%
Lituanie 1 0,02%
Malte 1 0,02%
Maurice 1 0,02%
Mauritanie 1 0,02%
Pologne 1 0,02%
Proxy anonyme 1 0,02%
Qatar 1 0,02%
Serbie 1 0,02%
Slovénie 1 0,02%
Swaziland 1 0,02%


Ca permet de vérifier que les éditions sous IP proviennent essentiellement de la Francophonie (à presque 90%), d'Europe en général (à plus de 85%), voire même de façon écrasante du bloc France-Belgique-Suisse-Luxembourg (80%). Bon, ça vaut ce que ça vaut, et je ne pense pas que ce soit intégralement fiable, mais c'est éclairant : pour les contributions indépendantes, Wikipédia en français est essentiellement éditée dans des parties du monde bien précises.

Maintenant, ce que je trouve pas mal, ce sont les deux contributions référencées comme mongoles (un type qui râle visiblement sur « Empire mongol » et sa page de discussion) et celle qui proviendrait du Swaziland (curieusement, sur « Casseurs de pub »... Un expatrié français ? :D). C'est peut-être avec des contributeurs comme ça, localisés en dehors des aires de chasse traditionnelles, que Wikipédia construit des articles sur des sujets peu connus.

4 commentaires:

Anonymous a dit…

Tiens, aucune contribution de PoulpiLand. Bizarre, ça.

^^
RM77

Boréal a dit…

Ça me semble assez révélateur que dans cet échantillon l'écrasante majorité des contributeurs soient français et que le premier groupe non-européen soit québécois. Il y a régulièrement un genre de clash sous-jacent entre, disons, des "attitudes" différentes nord-américaines et européennes (sans vouloir faire de généralisation abusive). Si la wikipédia francophone était moins homogène, elle ferait certainement montre de plus d'ouverture. (Je fais référence à un récent sondage quant à l'ouverture aux particularités linguisitiques non-hexagonales)...

Anonymous a dit…

il y a des gens qui contribuent depuis l'espace (si si). Il serait intéressant de faire le compte sur une semaine. Ca serait plus représentatif (sachant qu'il doit y avoir pas mal d'interwikis).

Poulpy a dit…

@RM77 : c'est parce que les contributeurs du Poulpistan sont en wikibreak. :D

@boréal : j'ai tenté de le faire sur en:. Le problème, c'est que vu le nombre de contributions, on ne peut remonter que quelques heures. Quand je l'ai fait (vers midi UTC), il n'y avait pas un tel écart entre la première origine géographique et la suivante (en gros, 1/5 depuis les USA, puis depuis le Royaume-Uni) et les contributeurs semblaient plus provenir d'un peu partout que sur fr:. Bien sûr, il faudrait faire la même chose quand les contributeurs américains sont levés.

@anonyme : ça serait très intéressant. Le truc, c'est que je ne sais pas comment obtenir plus que les 5000 dernières modifications d'IP, ce qui limite forcément la chose. Il faudrait sûrement passer par les dumps, mais j'ai un peu la flemme (sans compter qu'ils ne sont pas à jour).