A la suite de la numérisation des livres imprimés de la Bibliothèque de Caen la mer, Azentis a entrepris la saisie manuelle des ouvrages les plus anciens.

 

 

Ce projet initié en 2013 par la Bibliothèque de Caen se propose de mettre en ligne, à destination de tous les publics, la reproduction de la totalité des livres imprimés à Caen entre le XVIe siècle et 1900.

Le corpus numérisé par Azentis se composait de documents imprimés et d’images fixes (livres, brochures, affiches, estampes), maintenant consultables sur Impressions Caennaises, la bibliothèque numérique de Caen .

Une fois les images numériques obtenues, les ouvrages les plus récents (seconde moitié du XVIIIe et XIXe siècles) ont bénéficié d’une traitement OCR pour permettre la récupération automatique des textes. En revanche, pour les documents plus anciens (XVIe, XVIIe et XVIIIe siècle jusqu’à 1750 environ) pour lesquels l’océrisation n’apportait pas de résultat satisfaisant, nous avons réalisé une opération de saisie manuelle.

Nos opérateurs ont suivi des règles de saisie strictes. Ils ont appliqué une saisie littérale en respectant le texte d’origine, même s’il est plus compliqué à lire et comprendre aujourd’hui.

Afin de s’assurer d’obtenir le meilleur résultat possible, nous avons utilisé des dispositifs de contrôle poussés : relecture de l’OCR afin de valider mot à mot l’identification du texte et mise en place de techniques de saisie fiables et qualitatives.

En tout 50 000 pages de formats différents ont été saisies : A6 , A5 et A4 et A3 et A2.

La deuxième partie de ce projet est prévu pour 2019.

 

Les recherches et antiquitez de la Province de Neustrie, à présent Duché de Normandie, comme des villes remarquables d’icelles : mais plus spéciallement de la ville & Université de Caen, Bourgueville de Bras, Charles de (1504-1593), 1588

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.