J'avoue, sur Wikipédia, on associe souvent mon nom à des tas de trucs géographiques un peu bizarres comme les frontières, les tripoints ou les points extrêmes. Et aux listes, aussi. Je ne vais pas nier, ça serait inutile. On a tous sa marotte, après tout.
Un beau jour de juin 2005, j'ai créé la liste des départements français classés par altitude. Je ne sais plus trop quel était l'argument derrière, mais je crois me souvenir d'une période très ennuyeuse au boulot, juste avant les départs en vacances. J'avais probablement été inspiré par la list of U.S. states by elevation d'en:. Et puis il existe des sites spécialisés dans ce genre de trucs, comme Peakbagger.
Il y a deux jours, El Caro lance sur Twitter : « cette carte me fait penser à Poulpy. » Cette carte, c'était la « Carte comparative des principales altitudes de la France par département », par Hippolyte Malègue (1897), disponible sur Gallica. Un bonheur kitsch pur jus 3e République, le genre de truc qu'on exposait dans les salles de classes afin d'édifier les foules et de souder la Nation en vue de foutre la pâté aux Boches. L'équivalent des infographies qu'on voit passer un peu partout, mais dessiné à la main avec amour. Ce document présente une sorte de coupe schématique de chaque département métropolitain de l'époque, avec les points culminants, les altitudes des grandes villes et le niveau le plus bas. C'est mignon et plutôt bien foutu. Et donc, oui, ça fait penser à moi (et si monsieur Malègue, en 1897, a jugé bon de sortir cette carte, vous serez bien gentils à l'avenir d'arrêter de faire les malins en prétendant que j'ai des idées débiles qui n'intéressent personne).
Bon. Le Malègue, il est mort en 1901. La carte, ça fait donc un paquet d'années qu'elle est dans le domaine public. Là, je me dis : ça serait cool de mettre ça sur Commons, quoi. Et puis alors je constate que je ne sais pas trop comment transférer un docu de Gallica sur Commons, mais Pyb me dit : « viens ce soir, on va picoler avec d'autres Wikipédiens, je t'expliquerai. » Mais ce soir là, faut avouer qu'on a surtout picolé et pas trop parlé du transfert. On a mangé des pizzas, aussi. C'était bon mais un peu trop copieux. Et puis je suis tombé sur un truc bizarre rue Saint-Maur en rentrant alors j'ai édité plus tard l'article sur la rue Saint-Maur, qui était vraiment en déshérance.
Le lendemain, Pyb m'a filé l'url du script pour le transfert. C'était en Python, alors j'ai installé Python sur ma machine. Et puis j'ai installé une extension pour avoir une interface graphique. Et puis j'ai installé une extension pour télécharger des extensions. Et puis j'ai téléchargé ensuite cinq ou six packages pour résoudre les dépendances. Et puis au 100e message d'erreur, j'en ai eu marre d'avoir encore à faire de la divination dans les fichiers de configs alors que les années 2010 sont déjà avancées (surtout que ça me rappelle le boulot ; sauf qu'au boulot, je suis payé pour, alors je fais avec). Donc j'ai dit : « ¡Ya basta! Je vais le faire moi-même tout seul ». Alors je l'ai fait moi-même tout seul.
Non, parce que Gallica, y sont bien gentils, mais ils refusent obstinément de fournir leurs documents scannés autrement qu'en format timbre poste. Oh, bien sûr, il existe toute une machinerie compliquée pour zoomer sur le document, à base de Flash et d'ergonomie pourrie, mais il semble que Monsieur Gallica n'ait pas véritablement pigé le concept du domaine public (ou de la bibliothèque, ou de l'accès à la culture, ou du service public, ou de tout un tas de choses qu'on va vous bassiner les oreilles en France avec jusque debut mai sans jamais y croire un instant, parce qu'un citoyen n'est jamais qu'un blaireau muni du droit de vote). Donc au lieu de télécharger le document chez moi et d'en faire ce que je veux (puisque j'ai le droit inaliénable d'en faire ce que je veux, y compris de l'imprimer en A3, de le rouler et de me le fourrer dans le cul), je suis contraint de passer par une interface à la con même pas pratique. Si je veux avoir accès à la version grand format de ce document (dans le domaine public, est-ce que je l'ai déjà précisé ?), la Bibliothèque nationale de France (un service public à vocation culturelle, est-ce que je l'ai déjà précisé ?) m'insulte carrément en me fournissant un formulaire à remplir pour que, moyennant finances, je puisse mettre la main dessus. Au bout d'un certain temps. On verra. Si on veut bien.
Là, j'avoue, j'ai pris ça comme un défi.
Tout d'abord, j'ai lancé le live de Byetone à la Gaîté Lyrique, car ce genre de choses doit s'effectuer en musique (c'était la soirée annniversaire de Raster-Noton, l'un des labels musicaux les plus importants des 15 dernières années). Puis, ayant constaté que lorsque le zoom maximal était enclenché, les images formaient une mosaïque avec un codage séquentiel du type « btv1b8441601z.f1&l=6&r=X*256,Y*256,256,256 », j'ai lancé mon Perl et codé une moulinette de quelques lignes. 10 minutes plus tard, je me retrouvais avec 1 376 morceaux de cartes qu'il suffisait de réassembler. Facile.
Le réassemblage. J'ai bien cherché, mais je n'ai pas trouvé de logiciel qui faisait ça. Oh, je ne doute pas que ça existe, bien sûr, mais comme j'étais un peu énervé (surtout après avoir headbangué tout seul devant mon écran tandis que les fichiers se téléchargaient), je suis allé me faire une tisane aux fruits rouges. J'ai tout une boîte de sachets de tisane aux fruits rouges que ma colocataire a ramené un jour de je-ne-sais-où et que j'espère finir avant 2015 (si vous voulez la tester, venez chez moi, on parlera et je vous montrerai ma collection de Rubik's Cubes). Forcément, j'en ai eu marre de chercher et je me suis décidé à le faire également moi-même. Pourquoi s'arrêter en si bon chemin ? J'ai donc tout converti en fichiers TGA non compressés, histoire de ne pas m'emmerder avec des encodages superfétatoires et j'ai pondu une deuxième moulinette en C pour générer un fichier complet. Et j'ai chargé le résultat final sur Commons, avec les modèles qui allaient bien. Et j'ai utilisé l'image sur Wikipédia pour finir. Victoire était mienne.
Cette histoire a une double morale. La première, c'est que les services publics ne le sont pas une seule seconde, même (surtout ?) quand ils prétendent être au service du peuple. Gallica, sache que ce soir là, j'ai vu en toi un ennemi qui me refusait l'accès à ce qui n'est rien d'autre que mon propre bien. Je t'aime bien et tout, tu possèdes tout un tas de documents super utiles, mais tu ne réponds pas aux exigences les plus élémentaires du service public : être au service du public. Et ne va pas prétendre le contraire, mon expérience d'hier soir est assez explicite sur ce point.
La deuxième morale : j'ai effectué toutes ces manipulations parce qu'elles sont aussi naturelles pour moi que d'aller faire des courses à la superette du coin. Elles forment la base de mon boulot, à tel point que personne ne se demande si je les possède. Savoir pondre une moulinette, c'est aussi évident que de taper au clavier. Et là, je pense à pas mal de trucs qui sont revenus ces derniers temps : oui, la citoyenneté contemporaine, ça passe par la maitrise des outils informatiques. Ce que j'ai fait, c'est du pur hacking. J'ai utilisé mes connaissances dans un sens imprévu afin de reconquérir ce qui m'était justement dû. Sérieusement, vous trouvez ça normal ?
Les enfants, faites comme moi : prenez des ordinateurs quand vous êtes jeunes, faites n'importe quoi avec et amusez-vous. Même si vous ne terminez pas dans un boulot informatique pur et dur, vous saurez quoi faire si the Man tente de vous opprimer. C'est comme le bricolage : vous savez planter un clou, trouer un mur à la perceuse, changer une vitre ? Vous devriez également savoir créer une moulinette pour récupérer des images. Votre futur est à ce prix, et je ne pense même pas exagérer en écrivant ça.
10 commentaires:
Nan, forcer quelqu'un à faire du Perl, je ne trouve pas ça normal. C'est criminel. D'ailleurs c'est écrit dans la déclaration universelle des droits de l'homme que c'est pas bien (je ne me souviens plus de la page, mais c'est évident que ça y est).
Bon, je retiens. La prochaine fois qu'on me demande ouate ze Poulpe iz famousse faur, je réponds que c'est le seul qui recode ImageMagick pour faire un upload sur commons :-)
Salut Poulpy
Pour ce qui est de coller des morceaux d'images, ImageMagick fait ça très bien.
A la verticale :
convert dessus.png dessous.png -append output.png
A l'horizontale :
convert gauche.png droite.png +append output.png
Comme on peut coller autant d'images qu'on veut en une commande, en deux commandes on peut assembler tous les morceaux.
http://octet.ca/wiki/ImageMagick
J'avoue que comme toi, je suis assez prompt à sortir mon GCC quand j'ai la flemme de chercher une moulinette qui fait pile ce que je veux, mais pour ce genre d'opération ImageMagick sait forcément faire.
Et tu n'es pas le seul à haïr Gallica. Il est tellement peu accessible que ça ne peut pas être de l'incompétence mais forcément le résultat d'une volonté délibérée.
Bonne continuation,
Je retiens une seule chose de ce billet : c'est qu'il y a des Wikipediens qui s'amusent sans moi, en mangeant par exemple des pizzas.
et d'autres qui ne connaissent absolument rien à la technique mais qui défendent la liberté de diffusion de la culture.
Rosier
Plusieurs trucs pas super en rapport avec le sujet principal:
1_ tu devrais rajouter certains hashtags dans tes tweets d'annonce. les hashtags, c'est des portes d'entrée qui permettent à tes annonces, et donc à tes articles, d'être trouvés par d'autres, et je pense que ce billet peut intéresser bien plus que le microcosme wikipédien.
2_ dommage que le truc bizarre de la rue Saint-Maur ne puisse être mentionné dans l'article sur la rue Saint-Maur, c'est le genre d'info qui le fait !
3_J'adore ce billet (le sujet et les digressions) et je trouve super agréable à la lecture lorsque tu fais des digressions genre tisane aux fruits rouges. C'est le genre de truc qui me fout la banane je sais pas pourquoi.
Sur ce, bonne fin de week-end!
Tout d'abord merci Poulpy, j'ai lolé comme rarement en lisant un billet de blog.
Je pense pour ma part que ce genre de limitation a été mise en place pour éviter les téléchargements de masse ; tu l'as vu ton image au final fait du 10K par 8K, j'imagine que la plupart des images de Gallica ont ce genre de taille (et donc un poids conséquent)...
Je pense sincèrement que Gallica n'a jamais eu pour but de fournir un autre service que celui de la consultation de documents anciens (et pour celà, il faut avouer que pouvoir zoomer sur les documents à la manière d'une carte est bien sympa), tout en évitant de trop faciliter la tâche aux sites miroirs qui voudraient monétiser le contenu de la BNF (même si dans l'absolu ce serait leur droit)...
Ce qu'il manque vraiment (et tu l'as dit dans ton billet à demi-mot), c'est une procédure pas trop compliquée pour accéder au fichier original (genre captcha à résoudre pour éviter les robots et compagnie).
Ceci dit il n'y en a pas un qui a essayé d'ouvir le fichier Flash pour voir si il n'y avait pas un lien vers le fichier original dedans ?
Si je passe un jour sur Paris, je saurai où boire un tisane en tout cas ;o)
Ah et sinon, tu aurais pu réduire le nombre de morceaux de cartes : &r=3584,4608,256,256 c'est pour &r=X,Y,hauteur,largeur et tu peux monter jusqu'en 2236 par 2236 :
http://gallica.bnf.fr/proxy?method=R&ark=btv1b8441601z.f1&l=6&r=0,0,2236,2236
Étant donné que je voulais pas te chambrer sur le recodage de ImageMagick, je vais éviter de te chambrer là-dessus aussi ;o)
Pas tout lu, les choses du genre "oui, la citoyenneté contemporaine, ça passe par la maitrise des outils informatiques.", ayant un peu tendance à me fatiguer.
Mais il faudrait aussi peut-être que l'informatique comprenne qu'elle est en plein syndrome du "cordonnier le plus ml chaussé", non ? Et plus que des histoires de formats, l"ouverture" dans ce domaine cela voudrait d'abord dire utiliser des distributeurs d'étiquettes ouverts et partagés, question toujours soigneusement évitée, mais ça se comprend !
http://iiscn.wordpress.com/about/
Si les morceaux récupérés sont du JPEG, il y a bien mieux qu'ImageMagick : jpegtran. Ça a l'avantage de faire le boulot sans décompresser / recompresser, donc sans perte de qualité. On peut le vérifier : il n'y a aucun pixel différent entre les morceaux et l'assemblage. Je l'ai fait récemment avec File:Autographe d'Emilio Castelar.jpg.
Est-ce qu'il serait possible d'obtenir ton script Perl pour récupérer les morceaux ? J'ai régulièrement des images de Gallica que j'ai envie de reprendre et la flemme d'apprendre le Perl pour ça.
Enregistrer un commentaire