dimanche 28 février 2010

La Guerre des encyclos

« Bigot, en Italien Bigontia, est la mesure pour les liquides, dont on se sert à Venise. Le bigot est la quatrième partie de l’amphora, & la moitié de la botte. »


« Bigot, (Commerce.) en Italien bigontia ; mesure pour les liquides dont on se sert à Venise. Le bigot est la quatrieme partie de l’amphora, & la moitié de la botte. »


Hu hu hu. :)

(Mais comme le Trévoux est édité à partir de 1704 et l'Encyclopédie à partir de 1751, il est où, le copyvio ?)

jeudi 25 février 2010

Notability, crowdsourced

À l'initiative de mon frangin, j'ai utilisé récemment last.fm, qui me permet de me la jouer en montrant au monde les trucs bizarres que j'écoute (ou pas, vu que personne ne me connait).

OK, ma vie, vous vous en moquez comme de votre première clé USB. Mais il y a un truc que j'ai trouvé intéressant : last.fm enregistre le nombre de fois qu'un titre a été écouté par ses clients, ce qui permet de faire des stats agrégées (par artiste, par album, par date, par nombre d'écoutes, etc.). Si vous allez , par exemple, vous constaterez que les Beatles ont été écouté plus de 200 millions de fois en cinq ans, par deux millions d'utilisateurs distincts.

Et c'est là que je me dis que c'est utile pour mon autre passe-temps : au lieu d'aller se pignoler avec des critères complexes et forcément voués à l'échec puisque ramant après le train (cette image me semble tout de même étrange), autant aller voir la fiche correspondante sur last.fm : plus de XXX écoutes ? C'est bon, c'est notable. Après tout, ça concentrerait le problème sur l'essentiel : la musique dont on parle, là, elle est connue ou pas ?

Oui, je sais, trompeur, faussé, pas fiable, etc. Personnellement, je ne vois qu'un seul vrai problème à cette approche : il ne serait plus possible de se réfugier derrière des critères arbitraires afin de dégager au maximum les articles qu'on n'aime pas. Bref, le drame. :)

PS : Pour être honnête, avant qu'on ne m'accuse de faire le jeu des fossoyeurs de Wikipédia inféodés à l'argent et à la stupidité des mass-medias, je précise que je ne préconise pas vraiment cette méthode. C'est juste une idée en l'air, comme ça.

mardi 23 février 2010

vendredi 19 février 2010

Histoires nationales

Monprésident a déclaré un beau jour à Dakar que « l'homme africain n'est pas assez entré dans l'Histoire. » J'y repensais tout à l'heure dans le métro, en entendant un jeune cadre bien mis expliquer à sa collègue qu'en Afrique, mis à part la Colonisation, y'a jamais rien eu.

Plutôt que de tenter de réfuter cette affirmation absurde, ça m'a donné l'idée d'aller comparer un peu la taille des histoires nationales sur Wikipédia. La taille des articles, bien entendu. Quelques petits scripts plus tard, voici le résultat :



Plus c'est rouge, plus l'article dédié à l'histoire du pays est grand. Pour info, le plus grand concerne l'Afrique du Sud (178 111 octets) et le plus petit le Guyana. Sept pays, les Bahamas, le Kirghizistan, les Marshall, la Micronésie, Saint-Christophe-et-Niévès, les Salomon et Trinité-et-Tobago, n'ont aucun article. Il y a quelques anomalies : par exemple, si l'Égypte semble posséder un article historique aussi petit, c'est parce qu'il s'agit d'une liste de sous-articles (et j'avais la flemme d'aller tous les compter).

Maintenant, je n'ai aucune idée de comment interpréter tout ça. C'est un blog en kit : vous devrez vous faire vos propres analyses par vous-mêmes. :)

mercredi 17 février 2010

Jeux olympiques

En France, le curling est l'archétype du sport de beauf imposé aux Jeux olympiques par les Anglo-saxons dans leur processus de domination culturelle du monde. La réalité est évidemment plus contrastée, mais une chose est sûre : dans mon pays, où les gens savent être dignes et ne pas qualifier de sport un passe-temps visiblement débile, le curling a bien mauvaise presse.

Personnellement, j'ai découvert ce sport en 1992, lors des Jeux d'Albertville, alors qu'il était encore sport de démonstration. Bien entendu, L'ORTF nous le présentait comme un truc à la con. Pour ma part, je me suis tout de suite dit que des types capables de jouer à la pétanque sur la glace avec des blocs de granit de 20 kg, ces types là avaient tout compris à la vie. Bref, je conserve une certaine affection pour le curling, à moitié parce que j'aime bien les sports inhabituels, à moitié par pur esprit de contradiction.

Pour les Jeux de 2010, j'ai décidé de m'occuper un peu de l'article correspondant sur Wikipédia, vu qu'il semblait être un peu délaissé. Ce ne fut pas très dur : les anglophones avaient déjà fait tout le boulot et y'avait plus qu'à copier-coller, séparer les compétitions féminines et masculines dans des articles dédiés, préremplir les tableaux en prévision des différentes manches et c'était bon. Facile.

Dans les articles sportifs, 90% du contenu est constitué de tableaux. Les esprits chagrins y voient, j'imagine, la preuve que Wikipédia a totalement dévoyé son concept et se concentre sur l'accessoire. Je ne suis pas d'accord : en sport, même si la participation est certes importante, ce qui compte est de gagner. Donc il faut un classement. La mention de ce classement (et des détails pour l'obtenir) est, à mon sens, fondamental dans les articles correspondants. Donc, tableaux. (Bien sûr, il y en aura toujours pour contester la pertinence intrinsèque des articles de sport, mais nous supposerons qu'ils n'ont rien dit.)

Je pensais devoir me farcir la mise à jour des tableaux au gré des compétitions (elles s'étendent sur 12 jours), mais des gentilles IP sont venues le faire toutes seules, sans rien dire. Si ça se trouve, mon boulot se sera limité à fournir le squelette. On ne pense jamais assez à l'importance des squelettes d'article.

Et puis, l'équipe française, c'est une bande de potes. :)

lundi 15 février 2010

Quid ?

Le Quid se définit comme une encyclopédie.

Je me demande si des pigistes du vénérable pavé se sont déjà cassés en hurlant que la liste des objets par prix au kilo n'est pas encyclopédique

dimanche 14 février 2010

No More Links!

Parfois, on trouve des choses amusantes à l'intérieur du code wiki, sur Wikipédia. Par exemple dans le corps de l'article anglais sur la région de Darién, à la section « External links », on trouve l'avertissement suivant, en commentaires afin de ne pas apparaitre dans l'article proprement dit :


==========================({{NoMoreLinks}})============================
| PLEASE BE CAUTIOUS IN ADDING MORE LINKS TO THIS ARTICLE. WIKIPEDIA |
| IS NOT A COLLECTION OF LINKS NOR SHOULD IT BE USED FOR ADVERTISING. |
| |
| Excessive or inappropriate links WILL BE DELETED. |
| See [[Wikipedia:External links]] & [[Wikipedia:Spam]] for details. |
| |
| If there are already plentiful links, please propose additions or |
| replacements on this article's discussion page, or submit your link |
| to the relevant category at the Open Directory Project (dmoz.org) |
| and link back to that category using the {{dmoz}} template. |
=========================({{NoMoreLinks}})=============================


Un contributeur en avait gros sur la patate, visiblement. :)

samedi 13 février 2010

La Peur du vide ?

Hier soir, j'ai retrouvé quelques collègues wikipédiens autour d'une bière, comme ça m'arrive quelques fois (on parle de la cabale admin, de la cabale IRC, mais personne n'a encore songé à mentionner la cabale bibine). Et hier soir, donc, entre deux cassages de sucre sur le dos des absents, mon voisin de gauche a prononcé une phrase. Et il a résumé un point que j'ai toujours eu sur le bout de la langue, mais que je n'avais pas vraiment conceptualisé.

Sur Wikipédia, tout le monde se fout sur la gueule pour savoir ce qu'on place sur le site. Tout le monde a sa propre opinion, éventuellement teintée de mauvaise foi, mais plutôt basés sur des critères logiques (vous pensez certainement que la logique de votre adversaire est illogique, mais vous voyez ce que je veux dire). Et puis il y a ce courant qui n'est lié à aucune logique, à aucun critère, à aucune raison, qui n'est même pas lié à un sujet à proprement parler : la peur du chiffre.

La peur du chiffre, on l'a tous rencontré un jour ou l'autre. Très probablement, on l'a même déjà éprouvée (surtout quand on est frais arrivé sur WP). C'est celle qui fait dire : « mais il y a déjà XXX articles sur le sujet : on ne va quand même pas en rajouter d'autres ! » Ici, il n'est pas question de se demander si les autres articles sont admissibles ou pertinents (quand on en arrive là, c'est en général qu'ils le sont) ou même si ça va poser des problèmes de maintenance (c'est pertinent, mais assez peu critique) : c'est une vraie angoisse totalement déconnectée de toute réalité, complètement irrationnelle, une angoisse qui n'a rien à voir avec un quelconque contenu. C'est l'angoisse d'ajouter du contenu à ce qui existe déjà. L'angoisse d'avoir plus d'articles. Ce n'est pas la peur que la quantité prenne le pas sur la qualité : c'est la peur de la quantité pour elle-même. C'est, en quelque sorte, la peur des grands espaces version wiki. La tétanisation devant l'infini.

Je trouve cette peur étrange. S'il y a bien quelque chose qui n'a aucune espèce d'importance sur Wikipédia, c'est précisément la quantité. Qu'on rajoute dix, mille, un million d'articles, ça ne changera rien au reste, ça ne le pourrira pas, il n'en sera pas lésé. Alors pourquoi cette peur ?

mardi 9 février 2010

Contributeur = louzeur

Il est courant, dans le monde professionnel (enfin, disons, le monde professionnel français, il est possible que ce soit différent ailleurs ; et puis c'est un blog perso, pas un papier rigoureux destiné à une revue de socio ; en plus, je fais des parenthèses trop longues ; eh béh) de dénigrer le programmeur. En très gros, le programmeur, c'est l'extension de l'adolescent boutonneux introverti pré-pubère (peut-on seulement être à la fois adolescent et pré-pubère ?) dans le monde du travail : le louzeur, celui qu'on rigole dessus quand on le voit parce qu'il n'a pas su évoluer en chef de projet ou en manager ou en entrepreneur ou en consultant senior ou en n'importe quoi qui nécessite de passer son temps à faire des putains de réunion toute la journée pour pouvoir organiser le taf des programmeurs (qui sont incapables de rien comprendre vu que boutonneux introvertis pré-pubères ; dans le monde de l'entreprise, un vrai homme (car il n'y a pas de femmes programmeuses, c'est comme ça), c'est un homme qui baise, donc pas un ado, donc pas un programmeur ; je crois que c'est vraiment aussi con que ça). Essayez de dire à votre DRH lors de votre entretien annuel que vous, les réunions, vous vous en foutez complètement et que ce qui vous fait tripper le matin, c'est de coder toute la journée à l'écran et que je vous aimeriez bien persister dans cette voie : vous venez de vous inscrire pour la prochaine charrette ANPE avec autant de succès que si vous avouiez un penchant naturel à violer des jeunes femmes dans les caves du 93 (j'exagère : il vaut mieux avouer être un violeur en série dans le 93).

Cette après-midi, tandis que je tentais de camoufler mon manque total d'ambition professionnelle (je ne suis pas programmeur, mais c'est tout comme du point de vue de la hiérarchie sociale) en procrastinant comme un ouf-malade, j'étais en train de lire ce texte qui semble faire le tour de la twittosphère et qui décrit précisément ce léger problème d'appréciation de la société française qui se lève tôt. Et c'est là que mon subconscient me titille et me susurre : « Poulpe, est-ce que ça ne te rappelle rien ? » ce à quoi je réponds : « Non. » (mon subconscient et moi, on a des conversations passionnantes). Il insiste : « tu es sûr sûr sûr ? » Je contre : « monsieur, je ne vois pas de quoi vous voulez parler » tout en tentant d'ignorer à la fois IRC, Twitter et le site de Wikipédia afin de faire vraiment genre je vois pas. Là, il abandonne et se casse à la plage draguer mon ça, me laissant seul devant mon boulot, snif. 'foiré de subconscient.

Sur Wikipédia, le contributeur de base, c'est le louzeur. Tout être un peu impliqué va d'abord s'investir dans les tâches annexes : buter du vandale, truffer de l'IP, répondre sur sa pdd, probablement monter du projet. Et puis ça va dériver : balai d'admin, implication dans la communauté. Bientôt, le contributeur va se retrouver à discourir exclusivement dans les pages de parlotte et, forcément, à laisser complètement tomber la contribution réelle. Bon, soyons honnête : si ça plait, c'est tant mieux. Le truc, c'est qu'on sent que c'est une sorte d'obligation naturelle. Il n'est pas vraiment sérieux de vouloir continuer à contribuer comme dans sa jeunesse alors qu'on approche du stade de vieux croulant (combien de fois me suis-je fais reprocher à demi-mot mon absence totale d'ambition adminesque, comme quoi c'était clairement immature de ma part de me consacrer exclusivement à ces, euh, ces broutilles ?). Bref : si à 50 000 édits tu es toujours à 60% dans Main, tu as raté ta vie.

Avouons-le nous : à la base, Wikipédia est un projet d'informaticiens. Il est donc normal qu'il évolue comme toute société d'informaticiens, non ?

mardi 2 février 2010

Elles sont où, les photos de Commons ?

On a légèrement parlé, il y a peu, du cap des 6 millions de fichiers franchi par Commons, grâce au concours du projet Geograph British Isles.

Ce projet consiste à prendre au moins une photo par kilomètre carré dans les îles britanniques. Du coup, j'ai regardé un peu ce qu'on avait d'équivalent sur Commons. J'ai fait ça à la barbare : téléchargement du dump de Commons (juste le texte, hein, pas les images) et un bon vieux grep des familles pour choper le modèle Location.

Voilà le résultat :



Vous avez un point noir dès que j'ai trouvé un résultat dans le coin. Vu la méthode employée, vous pouvez être certain que ça ne correspond pas vraiment à la réalité (j'ai récolté trop de coordonnées), mais c'est parlant.

EDIT : à la demande générale de Popo, j'ai réalisé une carte un peu plus grande. Pour la voir dans toute la beauté de ses 5 000 pixels sur 2 500, il faut me demander, parce que je ne sais pas où la stocker (Blogger casse la résolution, donc je ne peux pas la charger ici).