Article

115 ans d’archivage de journal en ligne

115 ans d’archivage de journal en ligne

Un reportage EQDA

Imaginez la taille du bâtiment nécessaire pour le stockage et le classement de tous les articles publiés depuis les 115 ans qu’existe le journal Le Temps ! Alors quel est le moyen le plus efficace pour stocker autant d’archives, les classer et pouvoir les retrouver? La technologie numérique est la seule solution. Le Temps a collaboré avec des chercheurs de l’EPFL de Lausanne pour créer un site internet qui permet aux lecteurs de retrouver et relire toutes les anciennes informations en seulement quelques secondes.

Pour en parler, je rencontre Gaël Hürlimann, rédacteur en chef de la partie numérique du Temps. Il m’apprend que son journal est publié sous différents noms depuis 1861, ce qui m’impressionne vivement. Pour sauvegarder ce patrimoine, l’équipe du Temps et l’EPFL ont utilisé d’immenses scanners. Les pages de chaque édition ont été numérisées puis classées dans un «super ordinateur». Les journaux au format PDF ont également été collectés.

L’ordinateur enregistre les mots, les chiffres et les images du journal. Toutes ces données sont traitées par un programme puis connectées au site www.letempsarchives.ch.
Lorsque les lecteurs arrivent sur le site, le champ de recherche est disponible sur la page d’accueil. «Essayons de trouver le mot Bornéo», suggère Gaël Hürlimann. Deux secondes plus tard, le site montre que «Bornéo» a été fréquemment utilisé dans le journal durant l’année 1909. Encore quelques clics et nous découvrons que «Bornéo» était une marque de cigarettes et que de nombreuses publicités ont été publiées durant cette année-là. Moi qui pensais que le journal avait peut-être parlé de la colonisation en Indonésie…

De telles recherches dans les archives sont très utiles aux journalistes, notamment lorsqu’ils doivent rédiger des biographies. « Habituellement, ils cherchent ces informations sur Google. Mais en utilisant notre site, le processus de recherche peut être plus rapide et efficace. Les données présentées sont rangées chronologiquement et sont complètes. On peut par exemple suivre dans le temps la position occupée par la personne sur laquelle on écrit», souligne Gaël Hürlimann. Ce dernier explique que ce projet de numérisation des archives a occupé Le Temps durant trois ans, en collaboration avec l’une des universités scientifiques les plus connues du monde, l’Ecole Polytechnique Fédérale de Lausanne (EPFL). Ce projet peut être utilisé à de nombreuses fins. Des scientifiques ont par exemple cherché à savoir combien d’articles liés aux hommes ou aux femmes ont été publiés depuis la création du journal. « En 1800, le nombre de reportages sur des femmes était très faible », souligne Gaël Hürlimann. D’autres étudient l’utilisation de mots qui ne sont plus très communs aujourd’hui.
Gaël Hürlimann espère que le site évoluera encore les prochaines années. Mais cela demande des moyens considérables. (Dian Lestari).

Traduction de l’indonésien: Dwiria Wahyuni. Relecture des traduction: Cécile Rais

Article original en ligne

Dian Lestari

Dian Lestari est journaliste à la Tribun Pontianak depuis 2009, après avoir passé trois ans au Pontianak Post. Pontianak est la capitale du Kalimantan de l’ouest, une province indonésienne. Dian est très active dans diverses organisations de journalistes et dans la poursuite de sa formation en cours d’emploi, notamment sur les femmes et les médias, la religion et les relations interculturelles, l’environnement, ou le journalisme de données. Elle a obtenu plusieurs distinctions journalistiques entre 2010 et 2015.

Cécile Rais

Cécile Rais est journaliste pour RTSinfo.ch, le site d’informations de la Radio Télévision Suisse. Après des études de journalisme à Neuchâtel, elle se tourne vers le multimédia et plus particulièrement vers les récits long format. La problématique de la déforestation sur l’île de Bornéo était dès lors un terrain idéal pour un récit mêlant vidéos, textes et éléments graphiques.

Dian Lestari

Autres articles

Episode 1 : Le lac asséché et les drones

Episode 2 : La forêt marécageuse protégée par des SMS

Episode 3 : La forêt tropicale préservée et le blog

Episode 4 : Les palmiers à huile qui prolifèrent