Publication de fonds au format XML Alto

La solution Arkothèque offre la possibilité d'intégrer les données contenues dans les fichiers au format Alto :

  • Chaque fichier Alto doit permettre d'identifier la ou les ressources (c'est-à-dire l'image physique présente sur le serveur).
  • Chaque fichier est analysé et les données sont récupérées et intégrées dans une base de données.
  • Chaque texte/paragraphe est stocké ainsi que ses coordonnées afin de permettre un surlignage dans la visionneuse. 

La mise à jour des données au format Alto XML s'effectue depuis le back-office en plusieurs étapes :

  • Dépôt des fichiers par lots (avec arborescence ou non)
  • Numérisation et contrôle de la confirmité selon la norme Alto
  • Intégration des données Alto XML
  • Mise en correspondance avec les ressources images
  • Mise à disposition des données dans le (ou les) moteur(s) de recherche

Mise en place d'un moteur de recherche

La recherche peut être couplée (ou non) avec les valeurs d'un fonds

La recherche peut aussi être couplée avec les données d'annotation

Exemple sur les Archives d'Orléans Métropole :

  • la recherche libre va cumuler une recherche sur les données d'annotation et/ou les données issues des fichiers altos
  • Certains registres trop anciens ne pouvant être indexés au format alto, l'option d'annotation a été mise en place

 

Le moteur de recherche texte libre repose sur le moteur Elasticsearch permettant d'obtenir une rapidité de réponse et options d'ajustements de la recherche (pertinence/suggestion/rapprochement de termes/...).

Les données sont ensuite restituées dans la visionneuse avec mise en surbrillance des termes.

Partager sur