mardi 30 septembre 2008

Un autre univers

(Attention, ce post n'a pas grand chose à voir avec Wikipédia.)

Villes ou agglomérations de plus d'un million d'habitants situées sur le cours du Yangzi Jiang :
Panzhihua, Luzhou, Chongqing, Yichang, Jingzhou, Yueyang, Wuhan, Ezhou, Huangshi, Huanggang, Chaohu, Chizhou, Anqing, Wuhu, Hefei, Chuzhou, Ma'anshan, Taizhou, Yangzhou, Zhenjiang, Nankin, Nantong, Shanghai. Plusieurs dépassent les cinq millions d'habitants.

Vous en connaissiez combien, vous ?

lundi 29 septembre 2008

La demoscene, ou comment la sourcer

Au début de mon adolescence, vers la fin des années 1980, alors que je commençais à me servir des bestioles qui servaient d'ordinateur personnel à l'époque (oui, je sais, vous avez tous appris l'informatique à l'époque de l'ENIAC, je suis arrivé là dedans sur le tard), je suis tombé sur le phénomène des démos. Si vous ne savez pas ce que c'est, c'est un peu coton à expliquer. En gros, c'est un programme qui n'a pour pour but que de montrer de façon esthétique les capacités programmatrices d'un ou plusieurs individus, en mettant en scène des séquences graphiques et musicales, sans interaction de la part du spectateur. Ça serait un peu comme de l'art vidéo, mais conduit par et pour le code (et réalisé par des adolescents, essentiellement). Bon, allez plutôt voir l'article de WP sur la scène démo, ça sera aussi simple.

Alors, pourquoi je parle de ça, moi ? Béh, c'est un sujet que je connais relativement bien (en tout cas pour la décennie 1988-1998), mais où le sourçage d'info est assez rock'n'roll. M'étonnerait qu'on trouve beaucoup de sources secondaires sérieuses sur le sujet. Bon, y'a bien eu quelques sujets dans Tilt et Joystick, si on veut se limiter au support papier, mais sinon, les infos se pêchent surtout dans le monde électronique et incertain des forums en ligne, des BBS ou, pire, des disk magazines créés spécialement pour l'occasion. Typiquement, on est constamment à la limite de ce qui est acceptable sur Wikipédia (les Pokémons, à côté, c'est du sujet traité par Britannica). Sur fr:, il n'y a guère d'article que sur Second Reality, et il est bien exécrable.  Sur en:, State of the Art et Crystal Dream 2 sur présentes, et c'est à peu près tout. Rien sur Voyage, Odyssey, HumantargetSquare ou Paper, par exemple.

C'est assez étonnant, puisqu'il s'agit d'un sujet monstrueusement, entièrement, intégralement geek, dont on attendrait le traitement sur Wikipédia, le refuge de tout ce que la terre comporte comme boutonneux aux lunettes et aux doigts carrés. Et pourtant non. Il faut avouer que le traitement de la chose est un véritable challenge, ne serait-ce qu'en terme d'admissibilité.

Il y a pire si on commence à s'intéresser aux MOD, ces modules musicaux utilisés (pas exclusivement ceci dit) dans les démos de l'époque... Je me souviens d'un titre, intitulé Klisje På Klisje, et je pense qu'il doit rappeler des trucs à d'autres personnes de mon âge (enfin, j'espère). Je sais qu'il fut assez connu dans le milieu, mais à part qu'il fut composé en 1991 par un certain Walkman des Cryptoburners, nada. Ça fait peu, pour ce morceau, certes musicalement mauvais, mais qui me rappelle toute une partie de ma vie... Hors critères, forcément hors critères...

Lorsque je disparaitrai, cette étrange expertise partira avec moi. Je sais bien que Wikipédia n'a pas pour vocation d'accueillir toute la misère du monde, mais, quand même, c'est un peu bête, non ?

Les infoboxes, ou le fléau des temps modernes

À la base, le wiki, c'est un peu fait pour simplifier l'édition ; le truc, c'est que c'est parfois un peu cru. Du coup, on a rajouté deux machins histoire de rendre le bouzin un peu plus puissant : les catégories et les modèles. Les catégories, parce qu'il manquait un moyen simple de regrouper des articles par thèmes. Les modèles, parce qu'il est parfois intéressant d'automatiser certaines tâches.

Si les catégories ne posent pas trop de problème, malgré leur statut de pièce rapportée à l'arrache, il n'en va pas de même pour les modèles. Certes, écrire « {{e}} » au lieu de « <sup class="exposant">e</sup> » est plus simple, mais parfois, ça en devient complètement illisible. Pire, presque inéditable. Je ne vais pas détailler, cette personne l'a fait mieux que moi (mais en anglais, désolé).

Concrètement, un article possède bien souvent, de base, les modèles suivants :
  • En haut, un bandeau d'ébauche.
  • Tout de suite, sur la droite, une infobox.
  • En bas, une palette de navigation.
  • Juste dessous, un bandeau de portail.
Bon, je sais qu'il y en a pas mal qui sont totalement opposés à ces modèles (ou seulement à certains, les autres étant jugés utiles pour des raisons qui me dépassent un peu). Généralement, c'est l'infobox qui provoque le plus de haine. Pour ma part, je la trouve très utile et je l'utilise souvent car elle me permet d'avoir un aperçu synthétique du sujet sous un autre angle que le paragraphe d'introduction. Enfin, pas sur tous les sujets, quand même. Pour un sujet dont les informations sont quantifiables et systématiques, c'est intéressant. Si on se retrouve à paraphraser la phrase d'intro, je suis sceptique. En gros, je trouve l'infobox très utile sur les objets du système solaire, mais assez peu sur les personnalités.

Je serai cependant honnête : je trouve que le concept d'infobox est pertinent. Parce que son implémentation actuelle, euh, moins. C'est pas forcément évident, faut remplir des paramètres, comprendre que certains affichent des trucs et pas d'autres, y'a rien de standardisé et ça pourrit les vingt premières lignes d'un article. Et puis, bon, parfois, c'est moche. Et ça, c'est juste pour utiliser une infobox. En créer une, c'est la panique assurée.

Il se trouve que je sais créer des infoboxes (pas tous les types, cependant). C'est une forme d'expertise assez curieuse et j'ai de temps à autre des commandes (je ne sais pas comment nommer ça autrement). Qu'on juge de ce qu'il me faut faire :
  •  Je crée l'infobox de test dans une sous-page utilisateur. À l'aveugle, puisqu'il s'agit d'un modèle qui ne prend sa véritable envergure qu'appelé avec les paramètres adéquats. Pour prévisualiser, je suis obligé de sauver cette page, de l'appeler depuis une autre sous-page de test, et de recommencer l'opération pour chaque modification.
  • Je dois utiliser une syntaxe bizarre à base de parser functions, de {{!}} ou de {{!-}} et mélanger tout ça à la gestion des tableaux sous wiki (alors que, conceptuellement, il ne s'agit pas d'un tableau).
  • Une fois à peu près sûr de mon coup, je peux créer la page du modèle, puis la page de documentation qu'il me faudra transclure dans la première. Au passage, quand on éditera l'infobox, on n'éditera pas ce qu'on voit à l'écran, mais on ne verra pas à l'écran ce qu'on éditera.
Au final, je me retrouve avec un truc super complexe que je serai certainement le seul à savoir éditer, dans la mesure où je me souviendrai de ce que j'ai fait six mois après.

En résumé, c'est un peu la louze.

Le pire, c'est que ce système est réellement plus simple que les palliatifs originaux. Le besoin d'infoboxes (et de palettes, et de catégories, etc.) s'est fait très tôt sentir : un article, ce n'est pas seulement du texte, c'est aussi de la navigation et de la classification. Sauf qu'à l'époque, les infoboxes étaient codées en dur dans le texte (vous pouvez regarder l'infobox originelle de l'article « France », en 2003 ; on en trouve toujours parfois de ce genre, par exemple sur ce satellite naturel de Saturne). Comme il n'est pas très raisonnable de prôner la suppression totale de ce genre de modèles (même si l'idée est en l'air et possède ses zélateurs), il faudra bien, un jour, se demander comment on pourrait faire pour simplifier tout ça. Parfois, on frôle l'asphyxie textuelle.

mercredi 24 septembre 2008

Wikipédia ou l'éternel recensement de tout

C'était une question que je me posais depuis un moment. Combien de subdivisions administratives existe-t-il dans le monde ? Vous savez, les régions, les départements, les provinces, ce genre de choses.

Grâce à ce magnifique tableau des subdivisions administratives par pays, j'ai la réponse : environ 550 000.

On a encore du boulot.

Wikipédia comme porte-voix à travers les siècles

Tiens, hier, mû par un besoin irrépressible, j'ai tenté d'améliorer l'article sur le calendrier julien (qui n'était quand même pas top avant).

(En apparté, je sais qu'il est d'usage parmi les vieux de la vieille de prétendre ne plus jamais contribuer à Wikipédia, mais il se trouve que j'aime toujours autant ça, comme au premier jour il y a bientôt cinq ans.)

Alors, mon problème, c'est que si je comprends assez bien les problèmes calendaires, je suis moins calé sur la méthode historique et je ne connais pas convenablement la civilisation romaine. Bon, j'espère ne pas avoir trop rédigé ça avec les pieds (même si je suis bien conscient que, si, un peu, quand même).

Il se trouve que ce calendrier a introduit un jour bissextile qui, à terme, à donné naissance à notre 29 février à nous. Malheureusement, c'est un peu le bordel à l'origine et personne ne semble très bien savoir où il était précisément, au début, ce jour bissextile. Il semble que César a négligé de rédiger le manuel d'utilisation de son calendrier, se contentant d'un pot avec les autres pontifes pour leur parler du bouzin, ou alors que l'annexe explicative relative au jour intercalaire se soit autant perdu que l'erratum d'un magazine Ikea d'il y a deux ans (celui où on vous apprend que la housse bayadère de l'Ektorp n'est disponible qu'en taille trois places). Bref, ce point, c'est un peu la zone.

Il m'apparait donc indispensable qu'on case le maximum de choses dans Wikipédia, même des trucs cons, même des trucs évidents, et qu'on les explicite de façon claire et précise. C'est la meilleure façon pour que les types qui viendront dans quelques siècles puissent comprendre facilement ce qu'on avait à dire.

jeudi 18 septembre 2008

J'apostrophe !...

Sur Wikipédia, on passe beaucoup de temps à discuter de ce qu'il faudrait faire (dans la mesure où il faudrait le faire, bien sûr, ce qui donne lieu à d'autres discussions tout aussi fondamentales). On appelle ça le processus de prise de décision. Ça consiste en gros à parler pendant des mois pour finalement ne rien décider. C'est l'équivalent des commissions gouvernementales dans l'encyclopédie en ligne.

Actuellement, il y a une discussion en cours sur l'usage de l'apostrophe typographique (si vous ignoriez jusque là ce qu'est une apostrophe typographique, ou simplement qu'il puisse y avoir lieu de se poser la question de son emploi dans une encyclopédie en ligne grand public, vous êtes un contributeur heureux). La page de discussion atteint 298 073 caractères, soit la longueur d'un petit livre de poche. Depuis sa création à la fin mai 2008 (oui, la discussion sur ce sujet fondamental court depuis près de quatre mois sans arriver quelque part), elle a été éditée 711 fois, soit en moyenne toutes les 3 heures 30, par 41 contributeurs différents. Grosso modo, elle est vue 40 fois par jour. Des chiffres dignes d'un article significatif dans l'espace encyclopédique.

Messieurs, toutes mes félicitations. Bravo.

Wikiborg

Wikipédia est une entreprise à visées hégémoniques, tendant à absorber l'intégralité de ce que la terre compte comme sites persos. Vous êtes fan de chemins de fer, de breakbeat hardcore, de jansénisme ou des jeux vidéos publiés sur la Vectrex en 1983 ? Avant, vous auriez monté votre site dans votre coin, galéré pour trouver une présentation potable et abandonné devant le nombre de pages à rédiger ; en plus, vous auriez fait ça tout seul. Désormais, Wikipédia vous offre une excellente plate-forme de publication. Grâce à elle, vous n'avez aucun problème à expliciter votre hobby à la face du monde. Moyennant quelques petites restrictions contractuelles (neutralité, travail inédit, ce genre de choses), vous bénéficiez d'un hébergement gratuit, d'une interface robuste et d'un système hypertextuel simplifiant l'architecture de votre projet. En plus, vous ne serez plus jamais seul et vos connaissances seront liées aux sujets connexes d'une façon dont vous n'auriez jamais rêvé si vous étiez resté dans votre coin.

Bon, maintenant, comment est-ce qu'on pourrait bien assimiler un truc comme ça ?

mardi 16 septembre 2008

Infodisiac

Infodisiac est un nouveau blog anglophone, tenu par Erik Zachte, la personne chargée des stats pour la Foundation. Cool.

mardi 9 septembre 2008

Geotag everything!

J'imagine que tout le monde ici connait le petit modèle {{coord}}. Il se place en haut à droite des articles et permet d'en donner la localisation géographique. Bien sûr décrié, parce qu'intrusif, conduisant à des liens externes, pas encyclopédiques, etc.

Si ça se trouve, ce petit machin tout bête est l'une des plus grandes réussites de Wikipédia, parce qu'il est facilement réutilisé par des applications tierces. Par exemple, Google Maps donne la possibilité d'afficher directement sur sa carte des liens vers les articles correspondants, offrant une dimension supplémentaire à cet atlas en ligne. Pour Google Maps, ça permet d'offrir des informations sur ce qui est affiché à l'écran, sans avoir à se retaper le boulot de Wikipédia. Pour Wikipédia, ça permet de visualiser les articles différemment, sans réinventer la roue.

Récemment, je me suis offert un iPhone. Il possède un GPS, pas toujours très précis mais globalement suffisant. Forcément, quelqu'un a programmé GeoPedia, un utilitaire qui regarde où je suis et me retourne la liste des articles de Wikipédia correspondant à des lieux proches de moi. Encore une autre façon d'organiser les articles dont l'existence est possible parce qu'on s'est cassé à les géolocaliser. Bien sûr, les esprits chagrins me diront que ce n'est qu'un gadget et que la qualité et la quantité et tout ça : et alors ?

jeudi 4 septembre 2008

Défense de la veuve et de l'orphelin

Je suis tombé ce matin sur un article de Télérama concernant les orphan works. Les « œuvres orphelines », ce sont en gros ces œuvres dont le détenteur des droits est introuvable, ou très difficile à contacter. Il existe tout un mouvement visant à accroitre les possibilités d'utilisation de ces œuvres par des tiers — ce qui est, pour l'instant, plutôt illégal, même si par nature très difficile faire respecter (le Congrès américain, par exemple, a tenté il y a peu de faire passer une loi visant entre autre à les placer directement dans le domaine public).

Donc, je lisais cet article et me disais en mon for intérieur : « purée, qu'est-ce que ça simplifierait notre vie de wikipédiens, un truc pareil ».

Évidemment, l'article avait un avis assez différent du mien, qui mélait anti-américanisme de base (« ce machin, c'est encore un truc des impérialistes gougeuliens pour se faire du fric sur notre dos et ces grands enfants d'Amerloques ne font rien contre ») et défense de la pureté du territoire (« nous, on ne vole pas les auteurs, monsieur »). Bref, c'est pas gagné.

(Ah, et faut que j'arrête de lire Télérama, je ne suis pas — plus ? — assez bobo parisien pour ça. En plus, le journal était carrément mieux quand il était encore tenu par des cathos.)

mercredi 3 septembre 2008

Facho de base

On va continuer longtemps à tolérer les sociopathes qui naviguent en permanence entre l'insulte et le mépris ? Ceux pour qui Wikipédia n'est qu'un vaste terrain de jeu pour leur égo ? Ceux qui n'hésitent pas à tout désorganiser, par petits bouts ? Ceux qui provoquent des volumes de discussion où tout le monde s'engueule à la fin ?

(C'est purement rhétorique : je sais bien qu'on va continuer à tolérer les sociopathes de ce genre. En plus, dans ces cas là, on les laisse vivre et on tombe sur le premier mec normal qui est légèrement exaspéré. Faites moi marrer et prétendez le contraire, pour voir.)

Donc, qu'est-ce qu'on attend pour non seulement bloquer les types qui foutent la merde, mais également tous ceux qui les soutiennent ? En bloc. Et pas après trois cent mille tergiversations sur les pages communautaires.

mardi 2 septembre 2008

Esprit de ruche, sagesse collective et vice-présidents

Intéressant article du Washington Post sur un phénomène amusant : dans la semaine précédent la nomination officielle des candidats à la vice-présidence des deux principaux partis américains, les articles anglais de Palin et de Biden ont été considérablement édités. Et les éditeurs en question ont été bien plus à même d'éditer également les articles de McCain et d'Obama que les autres.

Que ces articles furent fortement édités après l'investiture, soit. Mais qu'ils le furent avant, c'est autre chose. Surtout que les articles des autres vices-présidents potentiels le furent nettement moins. Il se trouve que les éditions furent intéressantes (sources, précisions, etc.), ce qui limite leur provenance d'un service de RP. Autrement dit, collectivement, les éditeurs ont édité les bons articles.

Y'a du boulot à creuser pour les chasseurs de hype : analyser les éditions sur Wikipédia.

(Via WpB, lui même via TfD.)

lundi 1 septembre 2008

Crédo

J'ai souvent l'impression qu'on a une image de moi assez déformée, sur Wikipédia. D'après ce que j'ai compris, je ne suis qu'un affreux inclusionniste qui encourage tout le monde à écrire sur n'importe quel sujet, on s'en fout de si c'est justifié et on n'a pas besoin de s'expliquer, tout est encyclopédique. Bon, c'est pas bien grave en général (sauf que personne ne semble me prendre au sérieux), mais j'ai lu récemment sur un blog de très bonne tenue que je suis un complice des vandales et que mes idées sont une incitation à la débauche (je caricature si je veux). Je pense donc qu'il est temps que je clarifie un peu ma position idéologique. Tout le monde s'en fout complètement, mais ça me fera au moins un post.

Mes critères d'inclusion sont extrêmement larges, c'est vrai. Je pense que Wikipédia a tout à gagner à accueillir tout ce qui bouge. Ou, plus exactement, qu'elle n'a rien à y perdre, qu'un article d'une ligne sur un sujet pas connu est toujours mieux que pas d'article du tout et qu'on n'a de toute façon pas de raison à décider de ce qui intéresse les lecteurs à leur place (d'ailleurs, on ignore ce qui les intéresse, alors c'est vite plié). Avoir des millions d'articles n'est pas un problème, c'est une force. Même un article qui ne contient que des données brutes ne me semble pas inutile.

Bon, j'espère qu'avec ça, j'ai déjà tué la majorité des trois lecteurs de ce blog (et que le dernier a l'impression que je me fous du monde). Ah ben, j'avais dit que je voulais clarifier ma position, hein, je tiens mes promesses.

Évidemment, tout cet inclusionnisme enragé s'accompagne de grosses conditions : vérifiabilité, pertinence, rien d'inédit. Plus que dans les débats sans fin sur les critères d'admissibilité, c'est là-dessus qu'on doit mettre l'accent, à mon avis. Ça veut dire par exemple qu'on ne fait pas d'article sur le groupe de rock du garage parce que personne n'en a jamais parlé ailleurs, que les travaux généalogiques n'ont rien à faire ici, qu'on n'analyse pas tout seul les données brutes suscitées (même pour dire des trucs aussi basiques que ça augmente ou que ça diminue), et tout ça tout ça. En gros, mon idée, c'est qu'il vaut mieux se baser sur les principes de base, c'est plus efficace parce qu'on ne sait pas à priori ce qui peut être créé. Par contre, il faut être très strict avec ces principes.

Voilà, vous pouvez désormais dire autour de vous que je ne suis qu'un doux rêveur, que mes idées sont inapplicables, que je ne sais même pas faire la différence entre une source primaire et une source secondaire et que j'approuve moralement le vandalisme.