lundi 19 mai 2008

Il y a quelques jours, j'ai demandé sur le Bistro et le ton de l'humour qu'on me donne des idées d'articles qu'on pourrait créer en masse, histoire de franchir plus vite la barre des 700 000. J'ai eu diverses réponses, toutes intéressantes et qui témoignent bien que les contributeurs axent leur boulot sur des domaines très divers. Je n'ai pas trop eu d'attaques sur le thème « la qualité contre la quantité », en tout cas moins que je m'y attendais.

Quelques ordres de grandeur, pour bien situer le problème :
* À ce jour, on recense environ 180 000 astéroïdes numérotés. Tous n'ont pas leur article, et tous ne l'auront d'ailleurs pas. En fait, on en compte un bon millier sur fr:, seulement.
* Il y a un peu plus de 36 000 communes en France. Toutes sans exception possèdent leur article. Il y a donc 35 fois plus d'articles sur les communes françaises que d'articles sur les astéroïdes.
* La ville de Paris compte environ 6 000 voies de circulation. Très peu ont un article.
* Les Philippines comptent de l'ordre de 1 500 villes officielles, pour un pays d'une taille comparable à celle de l'Allemagne. Suivant les pays, le nombre de villes (ou communes, ou municipalités, ou autre chose encore) est très variable, mais j'imagine qu'il doit y en avoir dans les 2 000 000 dans le monde (à la louche, à plusieurs millions près).

Maintenant, en: compte 2 380 000 articles. fr:, environ 650 000. Pour rattraper en:, il faudrait créer 1 730 000 articles. C'est à dire écrire deux fois et demi plus d'articles que tout ce qui s'est fait sur fr: depuis le début du projet. Souvent, j'ai l'impression qu'on ne se rend pas bien compte, sur la Wikipédia francophone, du volume que représente la Wikipédia anglophone. Les 650 000 articles de fr:, c'est monstrueux : sans tenir compte de leur qualité, on a des articles sur tous les sujets de base, tous les sujets moins immédiats et il faut commencer à se creuser la tête pour trouver des sujets qui n'ont pas été couverts au moins en partie. Les 2 380 000 articles d'en:, c'est proprement hallucinant. Ca veut dire que là-bas, ils ont écrit des articles sur tout ce qu'on peut imaginer et plus encore, et qu'il n'est plus possible d'avoir une vision simple ce que l'encyclopédie contient.

Comme j'aime les chiffres, j'ai fait d'autres calculs absurdes. Si on décide de faire un article décrivant tout ce qui se trouve dans chaque quadrilatères de la surface terrestre d'un degré de côté (111 km à l'équateur), on ne va pas plus loin que 64 800 articles. Pour obtenir 1 730 000 articles, il faut que les quadrilatères fassent 0,38° de côté (43 km à l'équateur). Pas évident, déjà. Maintenant, si je crée 1 730 000 articles et que je m'applique un tout petit peu et prenne cinq minutes pour chacun, j'en ai pour 4 siècles. Si on a 1 000 contributeurs qui font ça à plein temps (un truc qui n'arrivera jamais), ils mettront cinq mois. Si on a un bot qui crée un article par seconde, il lui faudra 20 jours et il sera impossible de vérifier ce qu'il a fait.

Tout ça, c'était juste pour montrer à quel point Wikipédia (l'anglaise) est énorme. Et le pire, c'est que leurs articles ridiculisent souvent ce qui se fait sur fr: (citer un AdQ au hasard n'est pas un contre exemple pertinent). Je ne sais pas trop quelle est la morale de l'histoire. Peut-être que ça montre que le français est définitivement foutu, ou qu'il faudrait développer des méthodes de traduction automatique, ou qu'il est nécessaire de former des gens à Wikipédia, ou que l'anglais est plus attractif au niveau mondial que le français et qu'on n'y peut rien et qu'on sera toujours à la traîne, c'est vous qui voyez. Mais si vous voulez rajouter des paquets d'articles, va falloir vous lever tôt. Même avec tous les astéroïdes dont on peut décemment parler, on n'atteint pas le million.

2 commentaires:

Barraki a dit…

Moi j'ai la solution : créons un article sur chaque adresse IP en IPv6 !

Bon, plus sérieusement, merci pour tes ordres de grandeur, c'est vraiment impressionnant. Et puis c'est vrai qu'on se rend compte de l'absurdité qu'il y a à prétendre tout faire vérifier par une poignée de sages. Non, vraiment, on ne peut pas faire avec un petit nombre de gens organisés ce que Wikipédia a fait faire avec des millions de personnes invitées à faire ce qui leur plaît.

Poulpy a dit…

Oui, c'est un peu ce que je voulais dire : on a perdu toute possibilité d'appréhender Wikipedia de façon simple.

Sinon, comme tu le dis, ce que tout ça montre, c'est que la méthode traditionnelle de compilation du savoir est explosée par l'expérience wikipédienne. Si on veut choisir un petit nombre de personnes et faire vérifier les contributions en interne, on ne produira pas Wikipedia.