Du plomb au web en passant par l’OCR

De notre visite dans les fichiers du service digital de la Bibliothèque Royale en novembre dernier, nous avons collecté une sélection centenaire. Les unes et feuillets de cinq journaux datés du 13 décembre 1916 : Le bruxellois, L’écho de la presse, Le messager de Bruxelles, Le Télégraphe et le Vooruit du jour nous ont été livrés aux formats jpg, pdf et xml (Alto). Après discussion et mise en place d’un script permettant à l’équipe digitale de convertir les fichiers Alto en fichier txt, nous avons balisé les textes OCRisés du Bruxellois pour traduire sa mise en forme sur une page web.
Ici un aperçu de quelques une des pages revisitées avec leurs liens dans la foulée.
Merci Frédéric Lemmers et Claude Sorgeloos!

Screenshot from 2017-09-07 18-26-19Screenshot from 2017-09-07 18-26-58Screenshot from 2017-09-07 18-27-48Screenshot from 2017-09-07 18-19-46

KB_JB28_1916-12-13_01-00001
KB_JB28_1916-12-13_01-00004

Ici les pages en ligne de Léa, Laurine, Catherine, Théo, Roxanne et Jean.

This entry was posted in Uncategorized. Bookmark the permalink.

Comments are closed.