dimanche 12 mai 2013

Partitions

Sur les projets Wikimedia, certaines évolutions passent assez inaperçues. C'est le cas de la nouvelle extension Score. Elle permet de générer des partitions de musiques en entrant une sorte de code, ainsi qu'une sortie audio.

L'entrée se fait en utilisant la syntaxe LilyPond. Ce n'est pas très facile au premier abord, mais c'est finalement assez rigoureux et logique quand on a comprend le truc (mais ça ne pardonne aucune erreur, ce qui peut donc être rapidement décourageant quand on débute). Le rendu final est très agréable et permet, si on le désire, de jouer la partition, ce qui est tout de même ce qu'on en attend ; bien sûr, c'est robotique et dénué de toute sensibilité, mais c'est parfaitement illustratif. Tenez, un exemple.

Bref, c'est cool. Le seul problème, c'est que cette extension de Mediawiki ne fonctionne pas. Ou plutôt, elle ne fonctionne plus dès qu'on dépasse une certaine taille et nous fait rapidement un Joseph II. Ça ressemble fortement à un problème annexe (mémoire, droits d'écriture, place disque, va savoir) et ça n'ennuie pas que moi. En attendant, ben, ça marche po. C'est dommage, il y avait une sacrée opportunité encyclopédique.

En attendant une éventuelle correction (va savoir si ça se fera un jour, j'imagine que la priorité allouée doit être très faible), rien n'empêche d'utiliser tout ça en dehors de Wikipédia. Histoire de vous donner une idée de ce qu'il est possible de faire, voici le début du premier mouvement de la sonate « Dürnitz » de Mozart :



Je ne sais pas pour vous, mais franchement, je trouve que ça en jette.

LilyPond a été créé il y a près de 20 ans par deux lycéens qui avaient envie de pouvoir générer informatiquement des partitions classiques qui soient agréables à l'œil. L'utilisateur se contente d'entrer ce qu'il doit y avoir sur la partition et le logiciel se charge de la gravure, plaçant tous les éléments comme il faut sans avoir à se faire prier. La documentation est bien fichue. Pour les amateurs, c'est également un projet libre et tout. Histoire de ne pas avoir à tout lancer en ligne de commande, vous pouvez utiliser un éditeur de texte dédié comme Frescobaldi, qui remplit parfaitement son rôle. Le projet Mutopia utilise la syntaxe LilyPond pour produire une bibliothèque de partitions libres, si vous voulez des exemples (ou juste des partitions).

Tout ceci est très intéressant. En matière de musique, si l'offre légale commence maintenant à bien exister (et par là, je veux dire : pas à des prix et des conditions de requins), je n'ai pas l'impression que l'offre de partitions existe. Je me souviens de mes années de piano, où il fallait acheter des partoches dans des magasins spécialisés (un ou deux par ville, à tout casser) à des tarifs prohibitifs y compris (surtout, même) pour les auteurs déjà dans le domaine public... Est-ce que ça a changé, tout ça ? (ne trouvant pas la date de décès d'Ernest Van de Velde, impossible de savoir si la Méthode Rose est dans le DP ; ça aurait sûrement intéressé mes parents à l'époque).

Pour ceux qui se sentent concernés, j'ai regardé également les OCR musicaux : ça existe. On en trouve du libre, mais ça ne fonctionne que difficilement. J'ai essayé une version de démo de SmartScore qui, par contre, déchire son flux vectoriel dans une matrice inversible.



Maintenant, tout ça ne concerne que les formes classiques de partitions, dédiées à la musique, euh, classique. Si on y réfléchit un peu, cette histoire de partitions, c'est essentiellement un truc de bons élèves qui essayent de se conformer aux idéaux bourgeois en matière d'encyclopédicité de la musique (la traditionnelle égalité : musique = musique avec des partitions) où le paraître (ici, les notes écrites dans un style codifié par l'élite européenne) prend le pas sur l'essentiel (la musique jouée et écoutée).

Si vous voulez passer outre, si vous ne voulez pas vous laisser enfermer par les conventions stériles, si vous n'êtes pas tétanisés par l'angoisse de la partition, vous pouvez essayer des trucs comme ça, qui ne sont jamais eux-mêmes que des partitions :


John Cage, Aria, for voice (1958)


SuperCollider (1996)



Karlheinz Stockhausen, Cosmic Pulses (2006)

Scream Tracker 3.21 (1994)


Ableton (1999)


John Stump, ''Faerie's Aire and Death Waltz'' (2006)

dimanche 5 mai 2013

Statistiques wikipédiennes



La nuit dernière, alors que je n’arrivais pas à m’endormir, je cherchais un sujet pour occuper mon esprit malade et le distraire des soucis habituels qui y tournaient en boucle depuis un certain temps[1] . Je repensais donc à des statistiques mathématiques un peu débiles[2] du genre si on voulait compter jusqu’à 1 milliard, il faudrait plus de 30 ans[3].
Puis je me suis dit que je pouvais mixer ça avec un de mes autres sujets de prédilection, Wikipédia. J’ai donc décidé de faire un rapide calcul mental du temps qu’il faudrait à une personne qui voudait lire tous les articles de la Wikipédia francophone (à la grosse louche). Comme le résultat m’a amusé, je me suis dit que je pouvais aussi amuser le monde [4], en le partageant via twitter le lendemain [5].
Puis j’ai réfléchi, je me suis dit que ce que je voulais dire tenait difficilement en 140 caractères, ou même en 280. Surtout que derrière j’ai pris conscience d’un autre paramètre dans mes statistiques, encore plus troublant. J’ai donc décidé de  faire plutôt un billet de blog, en demandant à emprunter un blog wikipédien. Voici donc mon rapide calcul, un peu plus affiné que ce que j’avais fait mentalement :
  • supposons donc qu’une personne veuille lire tous les articles francophones de Wikipédia  ;
  • supposons qu’elle passe 5 minutes par page  (ce qui est beaucoup pour certains articles, et très peu pour d’autres) ;
  •  l’encyclopédie francophone compte à l’heure où j’écris ce billet 1 383 534 articles ;
Cette personne devra donc passer 1 383 534* 5 minutes = 6 917 670 minutes, soit 115 294,5 heures, ou 4 804 jours, donc environ 13 ans et 2 mois.

  À ce niveau c’est déjà énAUrme ; oui parce que ces 13 ans et 2 mois, c’est en ne faisant que ça, c’est-à-dire en zappant les activités aussi futiles que dormir, boire, manger[6], avoir un boulot, forniquer, ou contribuer à Wikipédia.
  Mais c’est là qu’intervient un facteur que je n’avais pour l’instant pas pris en compte : la croissance de Wikipédia dans le même temps[7].

 Ordoncques,  la page« statistiques » de la Wikipédia francophone nous montre un graphe du nombre d’articles par an. On y voit que si la croissance à ses début était exponentielle, elle est, grosse merdo depuis 2007, linéaire, avec, à la (grosse) louche 150 000 articlés créés par an. Si on rapproche ça du calcul précédent, durant les 13 ans et 2 mois que le valeureux volontaire va passer à lire la wikipédia francophone[8], si on suppose un rythme de croissance équivalent à ces dernière années, 1 974 221 auront été créés[9].
Si on reprend le calcul précédent, il faudra donc au valeureux lecteur 18 ans et 9 mois supplémentaires pour lire les nouveaux articles créés. 18 ans et 9 mois durant lesquels X articles auront été créés[10]. On se retrouve avec un comportement de type exponentiel ; le résultat est donc qu'il est, dans ces conditions, physiquement impossible pour un humain de lire tous les articles de la Wikipédia francophone (et je ne parle même pas de l’anglophone).

En conclusion ? Eh bien on va tous mourir.  Et en plus on n’aura pas le temps de lire tous les articles de Wikipédia.

Rhadamante

[1] oui, moi quand j’ai une idée dans le crâne, bonne ou mauvaise,  elle tourne des heures et des heures, jusqu’à la concrétiser,  la remplacer par autre chose, ou avoir une grosse migraine. C’est pénible.
[2] c’est ça ou rêver que je tue Justin Bieber (ou tout autre artiste/personnalité pénible) à coup de figues molles – je vous avais prévenu que j’étais un esprit malade
[3] au rythme (rapide) d’un nombre par seconde, il faudrait 1 milliard de secondes, soit environ 277 777 heures ou 11 574 jours, soit 31,7 années. 
[4] oui je suis quelqu’un de bon et généreux, la preuve, je participe à Wikipédia
[5] oui j’essaie de planifier mes meilleurs tweets –et non, on voit que je n’en ai pas planifié beaucoup
[6] on peut avoir des réserves pas loin mais elles ne dureront pas 13 ans
[7] l’idée m’a traversé l’esprit, mais de toutes façons je ne pouvais pas la concrétiser, je ne connais pas les chiffres de wp par cœur – mon esprit malade a aussi ses limites
[8] s’il n’est pas mort d’ici là de faim, de soif, ou de privation de sommeil
[9] statique inquiétante en elle-même pour les compétiteurs de wp, avec ce chiffre, en plus de 13 ans à ce rythme fr : n’arrivera péniblement qu’à 3 357 000 articles, soit 80% du nombre actuel d’articles sur la Wikipedia anglophone 
[10] et ainsi de suite, mais bon, je pense que vous avez compris le principe...

samedi 23 février 2013

Densité de population

À la fin du mois dernier, j'ai vu passer un tweet dans ma timeline Twitter, parlant de carroyage. Il pointait vers le site de l'INSEE, sur les données carroyées à 200 mètres de la population française. En clair, ça signifie que l'INSEE avait découpé le territoire français en petits carrés de 200 m de côté et recensé dans chacun d'entre eux le nombre d'habitants. Plutôt cool, non ?

Là, je me dis : « mon bonhomme, y'a moyen de faire une carte trop top avec ces données ». Je commence par télécharger les archives pour chacune des 22 régions de France métropolitaine[1] (quelques centaines de Mo, une broutille). Chacune comprend un fichier .dbf stockant les données, un format que, par chance, Excel lit[2]. Première action de ma part, sélectionner trois colonnes : les coordonnées géographique de chaque carreau et la population correspondante. Je copie-colle cette sélection dans un fichier texte. 22 ouvertures de fichier .dbf plus tard, j'obtiens un beau fichier texte de 2 272 481 lignes. Sur chacune, la coordonnée x d'un carré de 200 m de côté, sa coordonnée y et sa population. Bon début.

Il est temps de passer ces données à la moulinette. Je ponds rapidement un petit programme en C++[3] qui parcourt ce fichier texte et recherche les extremums de coordonnées ; comme je sais que chaque carré est espacé de ses voisins par 200 unités de coordonnées (un système simple), je constate que l'ensemble tient dans une carte de 5 371 pixels de large sur 5 524 de haut, où chaque pixel correspond à un carré de 200 m de côté. Je farfouille un peu parmi les cartes de densité de population sur Commons, tombe sur celle du Maine et décide d'en utiliser les couleurs. Je modifie mon programme pour qu'il me génère l'image suivante :


Projection ETRS89

Première constatation : c'est über-cool, mais la projection rend la carte un peu inhabituelle. C'est parce que les coordonnées utilisent le système ETRS89, une projection azimutale équivalente de Lambert. Elle a le bon goût de conserver localement les surfaces (ce qui est indispensable pour les données de l'INSEE), mais pas les angles (normal, il est impossible de conserver les deux dans une projection cartographique).

Je décide que ça serait sympa d'avoir la projection de Mercator correspondante. OK, c'est une projection naze, mais elle parle un peu à tout le monde.

Première étape : convertir les coordonnées ETRS89 en latitude et longitude. La géométrie elliptique est notoirement complexe, mais par chance, ce pdf a déjà fait les calculs sordides et donne le mode d'emploi pour passer des unes aux autres (page 72, pour les intéressés). Les formules font un peu peur au premier abord, mais il suffit de les suivre avec rigueur, l'une après l'autre, pour obtenir le résultat. Modification du programme, donc. En projetant naïvement la latitude et la longitude de façon linéaire, convertissant à chaque pixel en ETRS89 et regardant la population correspondante, j'arrive à la carte suivante :


Projection naïve

Ah, oui, c'est un peu aplati. C'est parce que la projection de Mercator nécessite une correction supplémentaire en fonction de la latitude. Remodification du programme : pour chaque pixel, je convertis tout d'abord les coordonnées en longitude/latitude, puis en coordonnées ETRS89. Voici le résultat :


Projection de Mercator

Là, c'est bon. Je suis content de moi, je charge le résultat sur Commons.

Quelques temps plus tard, je me rends compte que j'ai trop réduit la définition du fichier final (4 000 pixels de large) et qu'on perd des détails importants. Je regénère la carte en plus grand (5 371 pixels de large). Malheureusement, le fichier final compte plus de 25 millions de pixels et Commons est incapable d'afficher un aperçu d'une telle image PNG. Tant pis.

Pour finir, je change les couleurs pour la palette Solarized. Le résultat final ressemble à ces vues de la France la nuit (ce qui est normal, après tout, quand on y réfléchit) :


Projection de Mercator (fond sombre)

Le résultat est assez fascinant, la résolution est suffisante pour discerner la forme des cours d'eau, des vallées, des forêts. Dans certains cas, on distingue les routes. La dichotomie ouest/est est évidente. La diagonale du vide fait des zigzags. Les Landes sont presque complètement inhabitées. La limite entre le Nord et le Pas-de-Calais apparait. La Sologne également. Et puisque les données initiales ne comprennent que les carrés de 0.04 km² qui sont habités et qu'on en a le nombre exact, on en déduit que 83% du territoire français métropolitain est inhabité. Impressionnant, non ?

Pour finir, je tiens à mettre l'accent sur un point : je n'ai fait qu'écrire un petit programme qui lit un fichier texte, place les données en mémoire puis assigne à chaque pixel d'une image une couleur en convertissant ses coordonnées. Je n'irai pas jusqu'à dire que c'est du niveau d'« Hello World », mais ce n'est pas d'une algorithmique bien complexe. La seule difficulté est initiale : se convaincre qu'avec ces données, on a la capacité de produire quelque chose. Vous aussi, vous pouvez.


[1] J'ai laissé tomber les deux départements d'outre-mer disponibles ; c'est mal, je sais.
[2] On ne répètera jamais assez à quel point Excel permet d'effectuer tout un tas de manipulations de données. Et si votre religion (ou les circonstances) vous interdit d'utiliser du Microsoft, vous pouvez toujours utiliser les équivalents libres et gratuits (je les apprécie moins, mais c'est juste moi).
[3] J'utilise le C++ parce que c'est le langage dans lequel je programme le plus facilement, même pour réaliser un p'tite moulinette à données. Je suis vieux, que voulez-vous.

lundi 3 décembre 2012

Metrics

Le week-end passé, Wikimedia France tenait son assemblée générale. Visiblement, un leitmotiv : les métriques. Quantifions nos performances.

Alors j'ai pondu les miennes, de métriques. Voici ce que j'ai fait sur Wikipédia au mois de novembre 2012.



PS : j'ai piqué la carte sur Commons, il s'agit du fichier Fuller projection.svg par Sting.

mercredi 31 octobre 2012

Compte-rendu d'expédition

L'une de mes photos vient de se placer à la 8e place de l'édition française du concours Wiki Loves Monuments. C'est plutôt cool, je trouve.


L'image représente la Pierre Droite, un menhir du sud de l'Essonne. Ça me fait plaisir, parce que c'est justement une photo dont je suis satisfait et que j'ai délibérément conçue pour le côté artistique plus qu'illustratif. On m'a fait remarquer que j'ai plutôt respecté la règle des tiers, mais je dois avouer que le cadrage a plus été déterminé par la verticalité du menhir, la présence de son ombre au sol et celle des nuages sur la droite. Je trouvais également que la perpendicularité entre la pierre et l'horizon rajoutait à la chose.

Ce n'est pas la seule photo dont je suis artistiquement satisfait que j'ai chargée pour le concours : il en existe trois-quatre autres, comme celle-ci du regard de Saux :


Chouette contraste entre la façade de l'immeuble au fond et l'édicule de pierre devant. En plus, il flottait et la pluie est visible sur la photo, et ça m'amusait d'éviter le cliché du beau temps (même s'il est plus facile de prendre une photo par grand soleil, c'est sûr).

Dans un autre genre, et sous un ciel dégagé, cette vue en plongée de la tour nord de Notre-Dame de Paris :


Curieusement, personne ne l'avait encore prise sous cette angle, sur Commons.

De façon plus mineure, j'ai également photographié à la fois la tour Eiffel et le Louvre :


En revanche, je n'ai pas tenté de charger cette photo du Louvre sous la pluie sur Commons, je sens confusément qu'on m'aurait fait des réflexions à base de NOFOP :


La majeure partie de mes contributions à Wiki Love Monuments (175 en tout, visiblement) ne sont toutefois pas aussi arty : il s'agit de photos illustratives que j'ai chargées parce qu'elles ajoutent des infos sur un édifice, pas parce qu'elles feraient bien sur DeviantArt. C'est d'ailleurs un aspect intéressant du concours : on peut y participer pour plusieurs raisons, comme le critère artistique ou la simple volonté parfaitement wikimédienne d'ajouter sa pierre à l'édifice. Pour ma part, par contre, un point essentiel : je ne serais probablement pas allé chercher ces photos si le concours n'avait pas existé.

Voici grosso-modo mon modus operandi pour le concours : regarder les listes départementales de monuments historiques, cliquer sur le lien Google Maps tout en bas, étudier la carte localisant cette sacrés monuments et trouver un plan d'attaque. Je me suis par exemple tapé la remontée complète de l'aqueduc Médicis de cette façon.

Pour la photo gagnante, j'ai avisé le sud de l'Essonne, un petit coin autour de Buno-Bonnevaux. Pas de photos sur Wikipédia malgré la présence de six monuments protégés dans la zone, dont cinq liés au mégalithisme. Profitant du dézonage de mon pass Navigo le week-end, me voilà donc un samedi matin à la gare de Lyon à attendre un RER D qui me conduira dans le sud de l'Île-de-France. Je dépasse les merveilles d'architecture que sont les gares de banlieue franciliennes (ah la gare d'Évry Génépole en sous-sol, sporadiquement éclairée !) ; les passagers descendent presque tous ; je roule désormais en pleine cambrousse, seul dans le wagon quand j'arrive à la gare de Buno - Gironville, paumée entre le centre de Gironville et celui de Buno-Bonnevaux. Un train par heure dans chaque sens. Paris est à 60 km au nord, le Loiret à 5 bornes au sud.

Sortie de gare, remontée le long d'une départementale quasi sans bas-côtés, à ma gauche une carrière de sable : premier arrêt à la chapelle de Bonnevaux, malheureusement inaccessible derrière la grille du terrain.


La photo dans la boite, j'oblique vers l'est sur un chemin interdit aux véhicules non-riverains. Et tout d'un coup, ça grimpe : je gravis la côte qui sépare le plateau de la vallée de l'Essonne, 50 m de dénivelé en 500 m de chemin. Des deux côtés, la forêt et des vues agréables sur les pentes. C'est bientôt l'ouverture de la chasse ; les panneaux indiquent régulièrement qu'elle est privée ; les abris sont installés, prêts à l'utilisation. Et tout d'un coup, je débarque sur le plateau, les arbres s'effacent et laissent la place à l'immensité plate des champs. Le menhir de la Pierre Droite s'élève tout seul au beau milieu de rien.


C'est une belle bête, de 3,50 m au garrot. Je le photographie un peu de tous les côtés et continue ensuite mon chemin vers le sud, par une petite voie entre les champs. Peu de monde : quelques cyclistes se demandant ce que je fais là, un joggeur au loin (mais que fait-il là ?). Dans le ciel, des planeurs : le coin possède un centre de vol à voile. Dépaysement. J'arrive près de mon troisième check-point et un tracteur fait des allers-retours dans le champ d'à côté ; j'ai le sentiment que son conducteur me regarde d'un œil bizarre... Je synchronise la traversée des pieds de tournesols avec le moment où il s'éloigne de moi, vite vite.


Le polissoir de Grimery. Une longue pierre portant des traces de taille et de polissage. Soigneusement placée au coin d'un bosquet, comme si les parcelles cultivées suivaient une sorte d'héritage néolithique. C'est à la fois émouvant et un peu ridicule. Là encore, photos. Je reviens sur mes pas sur un bon kilomètre et m'engouffre dans une avancée d'arbres sur ma gauche à la recherche d'un hypogée que je ne trouverai pas (aucune indication claire pour le rejoindre et il est impossible d'explorer des sous-bois à la recherche d'un rocher de ce type sans savoir où on va). Mais le coin est sympathique. J'aboutis dans un chemin creux tout vert. Reste de bocage ? Je regagne progressivement la civilisation, maisons de moins en moins espacées, arbres de plus en plus absents. Au pied du clocher de l'église, mon dernier rendez-vous : un autre polissoir.


Celui-ci est affublé d'un grandiloquent « des sept coups d'épée de Roland ». Car Roland, comte des Marches de Bretagne mort dans les Pyrénées, est très certainement passé dans le coin pour affuter son arme dessus. On ne prête qu'aux riches. Après ça, je remonte vers la gare, attends mon train cinq minutes, m'offre le luxe de pouvoir choisir parmi un bon millier de places assises et débute ma remontée vers la capitale.

Et cette balade là, mes amis, sans Wikipédia ou le concours Wiki Loves Monuments, jamais je n'en aurais eu l'idée. Ça aurait été triste, non ?

lundi 1 octobre 2012

Comparaisons linguistiques

1 300 000 articles sur Wikipédia en français, 4 065 000 en anglais. en: possède donc 2 765 000 articles de plus que fr:. Soit donc 2,1 fois fr: elle-même. Les Anglophones n'étant pas des gens stupides (même si les Francophones ont parfois tendance à le penser), si on voulait vraiment augmenter la visibilité de fr:, la solution rationnelle consisterait à traduire de l'article anglais à tour de bras.

À chaque fois que j'ai évoqué cette idée, les mêmes ritournelles sont revenues : ces articles ne sont pas forcément bons, d'ailleurs y'a plein d'articles en français qui sont meilleurs qu'en anglais et de toute façon nous n'avons pas la même culture alors c'est pas vraiment possible. J'imagine que si la roue avait été inventée en Angleterre, la France persisterait à ne pas l'utiliser pour cause d'exception culturelle. Ce ne sont que des excuses minables pour éviter d'agir, bien sûr, et sans aucun lien avec la question qui plus est.

Là, j'ai essayé un truc : j'ai pris la liste des capitales du monde, son équivalent anglais et j'ai tout simplement comparé la taille de chacun des articles (capitales + pays) dans les deux langues. Certes, la taille n'est pas un argument qualitatif rigoureux, mais j'ai estimé que de façon générale, plus un article est long, plus il est développé (sur ce genre de sujet, ça me semble cohérent). Pourquoi les capitales ? Parce que ce sont des articles à bonne visibilité et qu'ils forment un groupe homogène tout en couvrant des possibilités d'édition multiples. Histoire d'augmenter un peu la dose d'articles, j'ai tout considéré (États indépendants, territoires d'outre-mer, pays séparatistes, etc. En plus, je n'avais pas envie de me prendre le chou à définir ce qu'est un État ou une capitale).

Ah, et j'ai pris en compte le fait qu'un texte en français est plus long que son équivalent en anglais. À la louche, j'ai estimé ce surplus à 25%.

Si ça vous intéresse, j'ai compilé les résultats dans ce tableau.

En résumé :

Sur 268 articles de capitales :
  • 2 n'existent pas en français
  • 1 n'existe pas en anglais
  • 22 sont d'une taille similaire, de l'ordre de 20% en plus ou en moins (10 concernent des territoires francophones)
  • 19 sont plus grands en français (13 concernent des territoires francophones)
  • 224 sont plus grands en anglais ; parmi ceux-ci, 80% font plus du double.

Sur 249 articles de pays ou territoires :
  • 13 sont d'une taille similaire (5 territoires francophones)
  • 12 sont plus grands en français (9 territoires francophones)
  • 224 sont plus grands en anglais, dont 80%, là encore, font plus du double en taille

Dans une optique purement qualitative, sur ce sujet parfaitement bateau, en: enfonce donc complètement fr:. Je n'ai aucune raison de penser que la chose ne se reproduit pas de façon similaire sur le reste des deux encyclopédies — et mon expérience d'utilisateur de Wikipedia me confirmerait nettement cette impression.

Perso, vue la visibilité de Wikipedia sur Internet, si je voulais faire quelque chose pour la francophonie, j'irais de toute urgence embaucher des traducteurs.

samedi 15 septembre 2012

Le laisser-faire est le meilleur allié des suppressionnistes

Connaissez-vous Know Your Meme ? Selon les termes de Wikipédia, Know Your Meme est un site documentant les mèmes Internet. Bref, c'est une encyclopédie spécialisée dans ce que le monde produit de plus anecdotique. Je la consulte de temps en temps quand je sens qu'une référence m'échappe (c'est plus pratique que d'aller demander à 4chan). J'y songe également dès que je vois passer sur Wikipédia une phrase du genre : « ce sujet n'a absolument aucun intérêt, il n'y a rien à en dire, on ne peut absolument pas le traiter de façon encyclopédique ». Oh, si vous saviez comme on peut, quand on veut...

Bref.

Paris compte quelque chose comme 6 000 voies de ciculation. La plupart disposent d'un article dédié sur Wikipédia. Mais tout ça ne s'est pas fait en un jour, houla non ! Il a fallu des années pour en arriver là.

Commençons par le plus central : la liste des rues parisiennes (qui a subi son content de renommages). L'article naît le 23 juin 2004 ; il comporte alors 22 voies parisiennes. Quelques noms sont rajoutés assez vite, suffisamment pour nécessiter un découpage alphabétique dès le lendemain. Les choses vivotent pendant deux années, quelques rues étant rajoutées à la liste quand l'envie s'en fait sentir. Et puis, les 7 et 8 septembre 2006, une IP réalise des ajouts systématiques, faisant passer le texte de 15 751 à 113 065 octets. Pourtant, la liste n'est pas encore exhaustive. Ce n'est que le 18 mai 2008 que je tente de résoudre ce problème (faisant passer le texte à plus de 152 000 octets). L'article culmine le 25 janvier 2010 à 167 731 octets, avant que je ne me décide à tout scinder dans des articles par arrondissement, vu que ce n'était clairement plus possible. Depuis, l'article est stable.

Je résume : 2 ans d'ajouts marginaux avant une première tentative de complétion, 4 ans avant un essai d'exhaustivité, 6 ans avant d'obtenir une mise en forme lisible et utilisable. Clairement, les voies de Paris ne sont pas la priorité des Wikipédiens.

Mais je n'ai parlé que de la liste : qu'en est-il des articles spécifiques ? Eh bien, disons qu'au début 2011, 10 ans après les débuts de Wikipédia, on pouvait estimer que moins de la moitié des voies parisiennes y figuraient, sans véritable plan, créées au petit bonheur la chance. Le 15 avril 2011, doublement incité par la politique d'opendata parisienne et une absence complète de perspective d'activité au boulot, je décidais de dégainer AutoWikiBrowser et de créer les 3 000 voies restantes.

Je vais vous faire un aveu : je ne referai plus ça. J'ai cru devenir dingue. Contrairement à ce que certains affirment, je ne dispose pas du flag bot, donc AWB me demande confirmation avant chaque édition. C'est un truc à se fondre le cerveau. Et la main qui tient la souris. Mais bon, au moins, c'était fait.

Régulièrement, les rues parisiennes sont proposées à la suppression : manifestement, la perspective d'écrire une bafouille sur des voies de circulation est choquant. Je me souviens de ma première PàS sur le sujet, le passage du Sud. À l'époque, l'article avait été conservé par absence de consensus. La dernière concerne la rue Paul-Strauss et aboutira vraisemblablement à la conservation de l'article. Mais je voudrais citer ici l'argument de suppression : « Si on continue à citer sans raison particulière n'importe quelle rue de n'importe quelle ville, wikipedia ressemblera à mappy en moins bien. » Cher contributeur, je comprends très bien ta peur que Wikipédia finisse par avoir beaucoup trop de contenu (je ne la partage pas, ceci dit). Mais tu n'as pas à t'en faire : les rues de Paris ne représentent même pas 0,5% de la Wikipédia francophone et il a fallu une décennie pour aboutir à un ensemble à peu près complet d'articles. À moins d'un changement radical dans les possibilités d'éditions, Wikipédia ne ressemblera jamais à Mappy. Et tu sais pourquoi ? Parce que c'est méga-ennuyeux à faire.

Je ne comprends pas pourquoi on voudrait s'acharner à pondre des critères sur ce genre de sujets. Il est bien plus efficace de se contenter de dire aux gens la même chose que pour le reste : « faites ce que vous avez envie de faire. »

PS : je n'ai pas envie de discourir sur le pourquoi du comment de l'utilité d'avoir un article spécifique sur chaque rue de Paris, ni ici, ni dans les commentaires. Le concept wikipédia n'est plus tout neuf et vous avez eu amplement l'opportunité de vous y familiariser depuis le temps.