mardi 19 janvier 2010

Prospective à deux balles

C'était au mois de novembre dernier. Nous étions, mon père et moi, en train de contempler la grisaille infinie du ciel breton. « C'est plutôt déprimant », fis-je remarquer. Mon père me répondit : « Poulpinet, sais-tu que c'est en novembre qu'il y a le plus de suicides en Bretagne ? À cause de la luminosité qui décline. » Je ne répondis pas grand chose à cette dernière affirmation paternelle (le suicide n'entre pas dans le top 100 de mes conversation favorites avec mes parents). J'avais cependant déjà entendu cette hypothèse : c'était très flou dans ma tête, mais il me semblait que ça ne parlait pas forcément de la Bretagne. Du coup, mon esprit de fou furieux s'est mis à travailler : le taux de suicide est-il lié au climat ? À la saison ? Cela dépend-il de la région ? N'est-ce pas juste une grosse légende urbano-rurale ?

Pour répondre à cette question morbide, le plus simple serait de dénicher quelqu'un de sérieux qui a fait une étude là-dessus (je suis sûr que ça existe, mais je n'ai pas regardé). Le plus complexe serait de récupérer les stats de suicide, la météo sur 50 ans et de comparer tout ça (faudrait également faire quelques études avant, histoire de savoir manier les données). Et puis je me disais que dans quelques années, j'irai sur Internet, je taperai deux-trois requêtes, les serveurs moulineront des données, j'obtiendrai une réponse et je n'y passerai pas plus de temps que ce que la question mérite : quelques minutes.

Prédire l'avenir est toujours difficile, surtout quand ça concerne le futur. Néanmoins, j'ai tendance à penser que viendra l'époque où non seulement les moteurs de recherche pourront taper dans d'énormes sources d'infos (bases de données, textes, images, etc.), mais en plus le public aura accès à tout un tas de trucs pour traiter ces résultats (calculs divers, corrélations, graphes et j'en passe). J'ignore la forme que prendra cette évolution (le web sémantique aura sûrement son mot à dire, pour autant qu'il décolle un jour). J'ignore quels moyens seront mis en œuvre. Si ça se trouve, ça tient plus du wishful thinking que d'autre chose. Ça serait puissant, en tout cas.

Bon. C'est quoi le rapport avec le kimchi ? Le rapport, c'est que si évolution il y a, Wikipédia n'en fera pas partie. Je suis toujours étonné quand on me raconte que Wikipédia, c'est le web 2.0 : certes, la production de contenu par les utilisateurs est le cœur du site, mais à part ça, Wikipédia se caractérise quand même par une absence quasi-totale de possibilité de réutilisation. Toute page est une île ; Wikipédia ne se lie pas au monde extérieur ; le monde extérieur peut aller se tordre pour savoir de quoi WP parle. Concrètement, Wikipédia a une approche très 1995 de l'information. Ce n'est pas un mal en soi, certes, mais j'ai toujours le sentiment qu'on pourrait faire tellement plus...

(Et puis je connais la réponse : on va me dire que Wikipédia est une encyclopédie, n'a pas à se transformer en base de données à la con et que je suis complètement à côté de la plaque. Un truc du genre.)

12 commentaires:

Litlok a dit…

Je ne suis pas d'accord. Les infoboxes permettent déjà ce genre d'exploitation. Mais pour être utilisables, encore faudrait-il que leur forme (pas le code wiki, mais le code HTML généré pour les intitulés de ligne et de colonne des tableaux, par exemple) ne soit pas susceptible de bouger tous les quatre matins...

Pymouss a dit…

Ton père t'appelle « Poulpinet » ? C’est mignon, ça :)

Manoillon a dit…

@litlok : Infiniment mieux que ces @!#$@$@#$@#$ d'infobox, il y a les métadata que la version germanophone de wikipedia a mis en place (par exemple, je ne sais pas s'il y en a d'autres).

C'est un système simple, complètement disconnecté des problèmes de mise en page, et qui permet une utilisation facile par n'importe quelle application externe.

RB a dit…

Wikipédia est une encyclopédie, n'a pas à se transformer en base de données à la con et tu es complètement à côté de la plaque.

Ça c'est fait. Sinon, une étude sociologique dont je n'ai malheureusement pas gardé trace avançait il y a quelques années l'hypothèse de la luminosité comme facteur pour les suicides en Charente...

Anonymous a dit…

Wikipédia, une encyclopédie. Hihi il est drôle l'autre.

« Néanmoins, j'ai tendance à penser que viendra l'époque où non seulement les moteurs de recherche pourront taper dans d'énormes sources d'infos. »

Tu es presque visionnaire, jeune garçon. Il me semble que Google Flu Trends anticipait par exemple des propagations de grippe à J+7. Bref, je pense comme toi que la masse informe d'information intégrée, mise à jour chaque jour peut être analysée, travaillée, transformée. Nous n'en sommes qu'à la préhistoire bien évidemment.

Par contre, je suis moins pessimiste que toi sur Wikipédia. Wikipédia, de fait, est un des organismes vivants majeurs du web. Tu le disais toi même hier, sous la forme d'une blague, nous pourrions anticiper les blocages de pages en analysant les vues ou éditions d'un article. Derrière cette petite moquerie, tu mettais le doigt sur le fait que les pics d'édition et de consultation sont des indices de l'état du temps réel, du monde réel. Bon ca veut pas dire grand chose ma dernière phrase, mais tu m'auras compris.

Sylenius a dit…

+1000 Manoillon (c'est pas souvent tiens, alors je profite)
les metadata sont LA solution aux problèmes de recherche d'info sur WP en interne et externe, ainsi qu'au problèmes récurrents de catégorisations bidons

Arkanosis a dit…

Moi je suis d'accord avec toi, Poulpy : il y a un manque criant d'uniformisation et de réutilisation sur Wikipédia.

Quand je vois qu'on en est réduit à écrire à la main le paragraphe d'introduction d'une biographie, l'infobox qui va bien et qu'il faut encore ajouter les catégories qui contiennent les mêmes infos... que la majorité des articles contiennent une ou deux versions de ces infos, mais pas les trois -- et jamais la ou les mêmes, bien sûr -- mon esprit d'informaticien maniaque se tord de douleur (et encore, c'est sans compter qu'on répète ça sur les 267 versions de Wikipédia...).

On a aussi à gérer la combinatoire des catégories quand des tags seraient à la fois plus simples et plus riches, les interwikis quand ils pourraient être gérés directement par mediawiki ; et on ne peut pas faire hériter les modèles les uns des autres autrement que par une composition laborieuse...

Je ne sais pas si c'est "1995" (j'avais 9 ans à l'époque :p), mais je confirme qu'il y a une vaste marge de progression : si on n'est pas capable de se réutiliser en interne, ce n'est pas demain qu'on pourra être correctement réutilisé ailleurs... (je dis ça d'expérience, on parse Wikipédia régulièrement au boulot)

Jastrow75 a dit…

Pour répondre à la question macabre, je peux te filer la carte de France des suicides (comparaison des taux standardisés régionaux à la moyenne métropolitaine) 2006. Il ne reste plus qu'à la croiser avec la carte de l'ensoleillement que l'on trouve facilement chez Météo France :)

Joe Staline a dit…

Le suicide, de Durkheim, bible de tous les étudiants en socio. L'influence du climat est bien sûr examinée.

Léna a dit…

A mon avis, ce n'est pas à Wikipédia de fournir ce genre de bases de données. Par contre, on pourrait imaginer un nouveau projet Wikimedia qui y serait consacré.

Gloumouth1 a dit…

A ce propos, une étude hyper sérieuse a été menée récemment. Compte-rendu ici : http://gloumouth1.free.fr/test/Lundi/index.html
G1

Spicalioth a dit…

Vagues souvenirs : le suicide diminue en période de coupe de monde de foot et (dans une moindre mesure) lors d'élections présidentielles. Les gens ne veulent pas mourir avant de savoir qui va gagner au foot et aux élections. Je me demande si ces évènements ont aussi une influence sur l'activité wikipédienne.
Concernant la faible reprise des information : au début de Wikipédia, celle-ci était présentée comme potentiellement "la mère de toutes les sources de connaissances". Raté.
A propos d'une approche très 1995 : c'est même pire. Wikipédia a adopté une présentation très universitaire des connaissances. Un modèle éprouvé, mais peu novateur. La rupture opérée par Diderot et d'Alembert avec leur époque était plus profonde.