mercredi 24 août 2011

Wikipédia n'existe pas

Donc, Wikipédia se meurt. Au moins, ça nous permet de lire trolls et contre-trolls, aucun ne parlant vraiment de Wikipédia mais plutôt de ses propres obsessions. Pour ma part, je pense que Wikipédia n'a jamais vraiment décollé. Oh, il y a bien ces millions de fiches sur tout un tas de sujets, je ne le nie pas. C'est important, bien sûr.

Wikipédia pour moi, c'est un état d'esprit : si on peut apporter quelque chose au projet, on l'apporte. Et c'est tout.

En vérité, Wikipédia est un projet créé par des types qui n'y avaient jamais songé, fréquenté par des types qui le détestent et géré par des types n'y croient pas. La participation volontaire n'y est perçue que comme un moindre mal, en attendant de passer aux choses sérieuses (faites, bien entendu, par des personnes sérieuses). Il faut attirer les universitaires. Il faut contribuer avec les musées. Il faut nous insérer dans le monde des milieux autorisés. Oui, oui, bien sûr, c'est important aussi. Mais personne n'ira se battre pour recruter 100 000 contributeurs pour qu'ils aillent écrire sur le sport, les jeux vidéo, leur ville de naissance ou les mille trucs bizarres qu'ils sont seuls à connaitre. Et pourtant, c'est ça, Wikipédia.

Non, Wikipédia n'a jamais démarré. Malgré tout ce qui est arrivé depuis 10 ans, nous en sommes toujours à coller à un modèle encyclopédique fantasmé. Nous n'avons pas eu le déclic. C'est dommage, voilà, c'est tout.

lundi 15 août 2011

Encore des catégories

La dernière fois que nous nous sommes vus, chers lecteurs, j'étais en train de faire le kéké avec les catégories de Wikipédia. Et puis j'ai continué dans mon coin, histoire de sortir un truc tout cute-kawaii :



C'est le graphe des catégories en partant de la catégorie « Article ». Histoire de simplifier le tout, je n'ai pris en compte que les catégories encyclopédiques (pas les trucs des portails, les modèles, etc.) et j'ai laissé tomber les listes et les homonymies. Et chaque nœud n'est relié qu'au parent le plus important (sinon, c'est illisible).

Pendant qu'on y est, quelques trucs sur les catégories (uniquement les encyclopédiques) :


C'est tout pour aujourd'hui. Un de ces quatre, j'arriverai à générer un graphe qui ne soit pas que mignon, histoire que ça serve à autre chose qu'égayer mon blog.

jeudi 11 août 2011

Catégories

De temps à autre, je télécharge la base de données de Wikipédia, histoire de produire des statistiques pour ce blog (ou pour mon amusement personnel). Cette fois-ci, j'ai récupéré l'arborescence des catégories du projet francophone. Une fois les données nettoyées (j'ai enlevé les catégories dédiées à la maintenance du projet, par exemple), j'ai créé un graphe (un nœud = une catégorie ; un arc = un couple de catégories mère/fille) que j'ai donné à manger à Gephi. Puis j'ai lancé le moteur de layout OpenOrd pour mettre un peu d'ordre dans ces 158 540 catégories et leurs 339 418 liens.

Voici le dessin de ce que ça m'a pondu :



Je n'ai aucune idée de ce que ça représente vraiment, mais c'est plutôt chouette, non ?

lundi 8 août 2011

3615 WIKI (1,27 F la minute)

Sur Wikipédia, il n'y a pas de comité de lecture.

Par contre, comme la nature à horreur du vide et qu'il y a clairement un marché pour les types qui ont envie de dire quels articles sont plus encyclopédiques que les autres, il existe le projet Wikipédia 1.0. Vous savez, c'est celui qui crée des pages de discussion avec des bandeaux bizarres au lieu de les laisser bien vierges et sans aucune, euh, discussion.

Donc, ce projet a pour but de construire « une sélection d’articles que la communauté aura évalués puis rassemblés sur la base de critères précis ; ces articles seront en moyenne plus complets, plus justes et plus importants que la plupart des articles de Wikipédia. » Pour faire ça, le projet attribue aux articles à la fois une note de qualité et une note d'importance.

Sur environ 1 100 000 articles, on comptait le 19 juillet :
  • importance maximum : 9 826 (0,9%) ;
  • importance élevée : 35 789 (3,2%) ;
  • importance moyenne : 122 796 (11,2%) ;
  • importance faible : 371 362 (33,8%) ;
  • importance inconnue : 157 584 (14,3%) ;
  • pas concernés par le bouzin : environ 400 000 (36,6%) ;

Le projet définit l'importance de manière à la fois vague et explicite. En gros, si elle est maximum, élevée ou moyenne, c'est important ou intéressant. Si c'est faible, c'est sans grande importance et on s'en tape un peu. Si c'est inconnu, j'imagine que ce n'est pas important ou intéressant (sinon ça se verrait).

Bref, pour le projet 1.0, 90% de tout Wikipédia n'a pas vraiment d'intérêt.

Oui, je sais, je suis de mauvaise foi et le projet précise explicitement qu'il ne s'agit pas d'un comité de lecture. N'empêche. J'avoue ne pas bien comprendre l'utilité d'avoir un DVD avec juste quelques milliers d'articles (tout le texte de WP tient sur un DVD, d'ailleurs). Je ne trouve pas non plus très utile cette envie de « stabiliser les articles jugés les plus importants ». Certes, je ne suis pas opposé à ce qu'on édite un DVD avec des versions précises (après tout, les articles sont à tout le monde, chacun fait ce qu'il veut), mais il me semble étrange de penser qu'il est « primordial » d'avoir des versions stables d'articles importants. Les articles peu importants ne sont pas le boulet de Wikipédia : ils en ont la force, ce qui n'est justement répertorié nulle part ailleurs. Quant à l'évolution perpétuelle, ce n'est pas une faiblesse mais précisément ce qui rend le site attractif. Je suis étonné que 10 ans après les débuts de Wikipédia, on en soit encore là : à vouloir reproduire dans la douleur le modèle périmé des encyclopédies papier d'antan, bien closes et figées. On devrait encourager l'écriture tous azimuts, les expériences inédites, la discussion, les angles d'approche bizarres... Pas faire un service encyclopédique pour Minitel.

Oui, bon, chacun fait ce qu'il veut, je sais.