Oui, c'est facile si vous utilisez PMB …

Import de notices ou d’exemplaires en format tableur

Méthodologie – Migration de données à partir d'un tableur

 

De nombreux catalogues ont été créés il y a quelques années avec des logiciels qui n’étaient pas conçus au départ pour gérer une bibliothèque, comme Access ou FileMaker, et le seul mode d’export envisageable est vers le tableur.

Même si on avait employé un logiciel spécifique de gestion de bibliothèque, les versions les plus anciennes n’offraient en général qu’une ou deux possibilités d’export : le format texte et/ou le format tableur. En outre, de nombreux logiciels propriétaires bloquaient – et bloquent encore – autant que possible la migration de données vers un autre logiciel, l’export en Unimarc ou en .xml n’existe pas toujours, ou bien c’est un Unimarc un peu différent, pas tout à fait normalisé (surtout pour les infos relatives aux exemplaires, ce qui est fort gênant).

C’est pourquoi j’ai décidé de consacrer un guide méthodoligique à l’import de notices et d’exemplaires dans PMB à partir du format texte ou du format tableur, quel que soit le logiciel de départ.

 

Réaliser une migration en transitant par le tableur est donc assez fréquent. En effet, même si d’autres modes d’exportation sont parfois disponibles (Unimarc), le passage par le tableur permet plus facilement d’améliorer et d’enrichir la base avant l’import dans PMB : corriger des erreurs,  supprimer des doublons, scinder des données en plusieurs champs ou au contraire les regrouper en un seul, ajouter des éléments qui manquaient dans la version de départ mais qui sont utiles dans PMB, adapter la base aux normes bibliographiques actuelles, etc.

 

La première étape consiste à exporter les données de la base d'origine soit en format texte, soit directement vers le tableur.

Si c'est en format texte, Il faut bien choisir le caractère qui servira de séparateur de champs : un caractère non employé dans les données, et aussi un caractère qui ne soit pas réservé ou interdit dans le logiciel de départ. Au passage, il faut aussi veiller à éviter la perte éventuelle d'un zéro initial (au début d'un champ numérique).

 

La deuxième étape, c'est tout le travail dans le tableur.

  • réorganiser les données : donner un titre aux colonnes, déplacer des colonnes, trier, scinder des données en 2 colonnes ou les fusionner en un seul champ ..
  • corriger les données, modifier certains codes afin qu'ils deviennent des codes Unimarc
  • compléter les données, ajouter des champs qui ne figuraient pas dans la base d'origine mais qui sont utiles dans PMB

 

Je donne ensuite une longue série de conseils spécifiques

  • auteurs, titres, titres de série, codes des langues, ISBN et dédoublonnage des notices, mentions d'édition, plan de classement (indexation décimale), catégories (descripteurs du thésaurus) et mots-clés libres, données des exemplaires, etc
  • sauvegarde en format .csv (c'est un format texte), pièges à éviter

 

Le choix du script d'import est également abordé

  • en effet, ce choix influencera entre autres la manière dont les futures descripteurs du thésaurus seront intégrés dans la base : en tant que catégories ou comme mots-clés libres ?
  • en outre, ce choix a aussi un impact sur l'import des exemplaires

 

Le chapitre suivant est consacré au params.xml

  • c'est le fichier qui assure la concordance entre le tableur et les codes Unimarc des différentes colonnes : on signale par exemple que l'ISBN est dans la colonne n° 2, le titre principal dans la colonne n° 3, etc
  • je fournis deux modèles fort complets de params.xml (60 colonnes de données, avec les codes Unimarc les plus fréquents)
  • j'explique les règles de syntaxe à respecter
  • je montre comment traiter certains cas particuliers
  • l'import de champs multivalués (répétables) : il y a donc plusieurs valeurs pour le même champ ou sous-champ, ex. catégories ou langues
  • l'import de divers types de documents (définis au niveau de la notice) : texte imprimé / manuscrit, enregistrement sonore (non) musical ..
  • gestion des données liées aux exemplaires et codages d'import (pour les supports, sections et codes statistiques)
  • il y a de nombreux exemples d'import illustrés dans le tutoriel et disponibles dans un zip téléchargeable (params.xml + fichier de données)

 

On passe ensuite à l'import dans PMB

  • paramétrage de la base avant l'import
  • description de l'import étape par étape
  • ce qu'il faut fare après l'import

 

Ce n'est qu'un bref, très bref aperçu du contenu de ce guide méthodologique  (52 pages au stade actuel !)

Bonne lecture 😉

 

La version imprimable contient des explications détaillées et de nombreuses copies d'écran pour illustrer le processus.

Importer des notices et/ou des exemplaires à partir du tableur (pdf)

Un zip est également disponible. Il contient

  • Les diverses versions du script d’import : func_belgique.inc.php    et    func_belgique_bretagne.inc.php
  • Les 2 modèles complets de params.xml mentionnés dans ce tutoriel :params_liste_codes_unimarc.xml    et   params_notices_types_docs.xml
  • Des tests, des fichiers de démo (en version tableur et en version .csv) et le params.xml correspondant : ils sont regroupés dans des sous-dossiers, donc vous repérez tout de suite les « ensembles » (params + csv). Cela vous permet de tester différents aspects de l’import

pmb-importer-format-tableur (zip)

 

, ,

Comments are currently closed.