jeudi 29 janvier 2009

Amusons-nous avec les catégories

Pour continuer sur les catégories (vu que je me suis tapé un script pour toutes les récupérer, va falloir rentabiliser tout ça), quelques constatations :

  • nojhan faisait remarquer en commentaire du post précédent que les catégories de Wikipédia formaient un graphe sans échelle organisé en petit monde (comme ça, je peux caser des termes que je ne connais pas sur mon blog, ça en jette, merci nojhan). Au final, tout est organisé, hiérarchisé, avec des structures propres à chaque sujet, mais rien n'est jamais très loin. En cadeau, sur la droite, je vous offre le diagramme des liaisons entre les catégories filles de Catégorie:Liste. C'est mignon comme tout (à défaut d'être lisible et exploitable). Si je réussis à faire la même chose pour l'intégralité des catégories encyclopédiques, je vous mets au courant.
  • Il y a en tout près de 100 000 catégories différentes. C'est beaucoup et on communique assez peu sur le sujet.
  • Je connaissais mal le haut des catégories. Tout au-dessus, on trouve l'Accueil, divisé en Espace encyclopédique (les articles, au sens large), Espace non encyclopédique (les projets, les modèles, tout le reste) et Article (les articles, au sens strict). Bon, le distingo entre Article et Espace encyclopédique est assez faiblard, vu que la première contient la deuxième, mais il semblerait que la volonté d'Article soit de produire Classification thématique principale, bref une taxonomie sérieuse. Espace encyclopédique aussi, d'ailleurs, mais pas de la même façon. Bref, au plus haut, c'est déjà redondant, voire contradictoire. :o)
  • Ce qui est amusant avec les catégories, c'est qu'on a en même temps une tendance à l'abstraction et à la spécialisation. Les catégories abstraites classent les autres catégories ; les catégories spécialisées rangent les articles. Je me demande dans quel ordre on a procédé.
  • J'ai découvert la catégorie Expérience, bizarrement placée sous Espace encyclopédique. Conservée suite à une PàS, j'ai un peu de mal à comprendre son but. Son historique m'a permis de découvrir le Projet:Catégories, pas super actif.

5 commentaires:

Barraki a dit…

Ah oui, effectivement les catégories de la racine ne sont pas une réussite.

Tiens, elle est là l'occasion de briser le mythe de l'arbre au profit de beaux graphes à cycles : mettre les catégories racines de Wikipédia dans la catégorie Wikipédia, qui elle est la catégorie des articles de WP parlant de WP, souscat de "encyclopédie en ligne", souscat de...

Encore une fois : Wikipédia brisera le mythe selon lequel le savoir humain peut s'organiser en arbre !

Meodudlye a dit…

Ton graphe montre quand meme que WP c'est un beau bordel surtout ;-)

Anonymous a dit…

À propos du distinguo entre les catégories Article et Espace encyclopédique, il faut savoir que la première, ainsi que son autre catégorie fille Classification thématique principale, ont été créées hier, quelques heures seulement avant ton post. Je crois que cette initiative n'est effectivement pas très heureuse et devrait faire l'objet d'une discussion.

Anonymous a dit…

Graphiquement on a l'impression de regarder un réseau neuronal. C'est superbe, et finalement très approprié.
Merci pour cette exploration.

Niavlys/Delhovlyn a dit…

Merci Poulpy d'avoir remarqué ceci. Effectivement c'est très peu clair. J'ai écrit un message à Utilisateur:Antiamour, qui a créé la catégorie : http://fr.wikipedia.org/w/index.php?title=Discussion_Utilisateur:....