Skip to content


Coupler Zotero et Bib2Hal pour signaler massivement les publications sur HAL

Posté dans Open acces / Archive ouverte.

sampaab5d4fa075b86c0Avant d’entamer la lecture de ce billet, je vous conseille très vivement d’aller voir l’article de Frédérique Bordignon sur le fonctionnement de l’application Bib2HAL.

Depuis 2014, nous nous servons  de Zotero+Bib2Hal pour signaler en masse les publications 2008-2014 de l’Université de La Réunion. Ce billet vise à expliquer comment.

Bib2Hal est une application utile pour l’alimentation d’une collection HAL à partir d’un fichier de références bibliographiques bibtex. Frédérique explique très bien les différentes étapes de la procédure. La plus importante selon moi, celle qui justifie à elle seule l’existence de Bib2Hal est l’affiliation des auteurs. Cette étape aussi fastidieuse que primordiale consiste à attribuer à chaque auteur une affiliation à un ou plusieurs laboratoires. Cette action déclenchera le tamponnage de la publi dans toutes les collections HAL concernées.

Avant de pouvoir utiliser Bib2Hal, il faut néanmoins disposer d’un fichier bibtex correctement formaté, c’est là que Zotero intervient.

Alimenter Zotero

Nous alimentons Zotero, à partir des bibliographies des laboratoires fournies lors de la précédente évaluation de l’AERES. A 80%, ces bibliographies sont produites sous format texte (word, pdf) et ne répondent que très partiellement aux normes de structuration des références bibliographiques, rendant l’utilisation d’outils comme Anystyle.io impossible.

Zoterhal

Exemple de bibliographie non structurée

En plus d’être mal structurées, ces bibliographies sont aussi lacunaires. Les métadonnées minimales sont parfois absentes surtout pour les communications dans des congrès (lieu, date de début/fin, titres des actes, etc.). Les types de documents sont parfois flous, les enseignants préférant déclarer un article ou un chapitre de livre plutôt qu’une communication avec acte publié.

Zotero1

Exemple de communication dans un colloque entré dans Zotero

Zotero

Exemple d’article de revue entré dans Zotero

Même si la force de Zotero est la récupération automatique des métadonnées, nous avons produit un important travail de vérification et de reprise de ces données pour intégrer dans HAL les informations les plus fiables.

De plus, avant d’exporter les données dans un fichier Bibtex spécialement mis en forme pour être importé dans Bib2Hal, il a fallu ajouter aux références Zotero des champs attendus dans HAL mais qui n’existaient ni dans le format Bibtex, ni dans Zotero, par exemple les dates de début et fin d’une communication, l’audience de la publication, la présence d’une évaluation par les pairs, ou la présence d’acte.

Nous avons recouru à une astuce pour les renseigner tout de même. Nous avons choisi de détourner certains champs Zotero inutilisés dans notre opération. Ainsi « Titre abrégé » a accueilli la date de début d’un colloque, « Consulté le » la date de fin, etc.  Ces données ont été entrées à la main.

Nous avons établi une liste de correspondances entre les champs Zotero détournés et les champs HAL attendus.

Champs Zotero-Bib2Hal

Revenons sur l’alimentation de Zotero. Les ouvrages et les articles sont le plus souvent récupérables sur Zotero par simple clic depuis un catalogue de bibliothèque ou le site de l’éditeur. Une recherche préalable sur Google Scholar permet aussi de savoir si la publi est déjà référencée sur HAL. Les métadonnées des autres types de document (communication, chapitre de livre, poster, brevet, etc.) sont moins souvent présentes et nécessitent une saisie manuelle ou semi-manuelle : récupération des métadonnées d’un livre puis transformation en chapitre de livre en ajoutant les éléments manquants, duplication des entrées pour différentes communications dans le même congrès.

 

Produire un fichier bibtex, compatible Bib2HAL

Une fois les références entrées dans Zotero, vérifiées, complétées, il est temps de les exporter au format bibtex pour utiliser Bib2Hal. Comme je l’ai mentionné plus haut, HAL attend des champs qui ne sont pas prévus par défaut dans les formats Bibtex ou Zotero. L’application Bib2Hal propose donc des intitulés à ajouter au fichier bibtex : x-audience pour l’audience de la publication (valeur : International, National, non renseigné), x-language pour la lange du document codé sur 2 caractères selon la norme ISO 639-1, x-peerreviewing pour l’évaluation par les pairs (valeur Yes/oui, No/Non), etc.

Nous avons détourné l’usage de certains champs Zotero pour renseigner ces valeurs. Il fallait s’assurer que les champs étaient bien parmi ceux exportés et que les libellé étaient bien compatibles avec Bib2Hal.

Le format d’export Bibtex dans Zotero a été développé par Simon Kornblith, Richard Karnesky et Emiliano Heyns. Stéphane Calderoni (Ingénieur de recherche en informatique à l’Université de La Réunion) et moi-même nous en sommes servi pour construire le format d’export Bib2Hal. Malheureusement, le format Bibtex n’exportait pas tous les champs dont nous avions besoin. Nous avons, dans un premier temps, élargi le nombre de champs exportés (cote, archive, archiveloc, catalog, access).

Champs Bibtex

Champs exportés dans le format bibtex

 

Bib2hal

Champs exportés dans le format Bib2Hal

Nous avons ensuite renommé les intitulés des champs détournés pour les faire correspondre aux intitulés attendus par Bib2Hal.

Bib2Hal2

Nouveaux intitulés des champs spécifiques à Bib2Hal

Nous avons enfin indiqué à Zotero quels champs utiliser lors de l’export

Pour que Zotero exporte les bons champs

Pour que Zotero exporte les bons champs

L’export Bibtex ne sortant pas le titre du colloque en plus du titre de la présentation pour une communication dans un congrès, nous avons réglé ce problème en modifiant une dernier fois le javascript.

Corriger l'export pour une communication dans un congrès

Corriger l’export pour une communication dans un congrès

Ces modifications dans le fichier javascript permettent d’exporter un fichier bibtex directement utilisable dans Bib2Hal.

 

Pour une meilleure intégration Zotero-Bib2Hal-Hal

Nous sommes tout à fait conscient du bricolage effectué pour construire notre dispositif. Le détournement des champs Zotero pour un autre usage ne peut constituer une solution viable à moyen terme. Une alternative aurait été de recréer des types de document Zotero calibrés spécifiquement pour Bib2Hal avec le bon nombre et les bons intitulés de champs. Cette solution très brièvement envisagée a été mise de côté en raison de l’investissement en temps et en maitrise de l’application que cela aurait nécessité. De plus, nous n’étions pas certain de conserver ces types de documents maisons lors d’un changement de version Zotero. Enfin, cette solution ne résolvait pas le problème des métadonnées manquantes sur les bases de données de publications des éditeurs. Un traitement manuel restait nécessaire.

Malgré ces limites, notre dispositif nous a permis de signaler plusieurs milliers de références en un temps relativement court,la majorité des versements ayant eu lieu entre septembre et décembre 2015. Grâce au couplage Zotero et Bib2Hal nous avons atteint le premier objectif de notre projet HAL-Réunion, le signalement des publications. Nous œuvrons maintenant aux dépôts des publications elles-mêmes.

HAL-Reunion_evolution_depots2005-2016

télécharger le script Zotero Bib2Hal sur GitHub

Taggé , , , , , , , , , .


3 réponses

Suivez la conversation, abonnez-vous au flux RSS des commentaires de ce billet.

  1. Justine Ancelin dit

    Merci pour ce retour d’expérience. Nous allons probablement opter pour la même démarche à l’université de Nanterre, mais en utilisant probablement plutôt le plug-in BetterBibTeX, qui permet de rajouter à toutes les publications des métadonnées « en dur » (par exemple x-audience = {international}) et de spécifier des métadonnées variables (ex.: x-conferencestartdate) dans le champ « Extra ».

    Mais du coup, l’aspect collaboratif de Zotero n’est pas utilisé. Pensez-vous qu’il soit possible de demander aux chercheurs d’alimenter eux-même un groupe Zotero en entrant leurs publications, quitte à ensuite contrôler les métadonnées saisies (et ajouter d’éventuels champs manquants) ? Ou serait-ce une perte de temps ?

    Autre question: quand vous entrez les publications dans Zotero, si certaines informations sont absentes de la bibliographie Word sur laquelle vous vous fondez, mais pas obligatoires dans HAL, recherchez-vous quand même ces informations pour faire en sorte que la notice soit la plus exhaustive possible ? Par exemple, s’il manque le lieu d’édition d’une monographie ?

    D’avance, merci beaucoup !

    • nicoAsLi dit

      Bonjour Justine,

      Nous avons un temps envisagé la fonction bibliographie collaborative de Zotero. Nous avons rapidement renoncé car l’outil était peu utilisé dans les labos et lorsqu’il l’était, les fonctionnalités collaborative était ignorées. Pressés par le temps, nous ne voulions pas imposer une manière de procéder aux labos mais nous adapter à la leur.
      Lors de la complétion des informations, nous entrions tout ce que nous pouvions trouver même si ce n’était pas dans la bibliographie d’origine. Quand les informations importantes étaient introuvables, on se tournait alors vers l’auteur de la publi, avec plus ou moins de bonheur.

      Pour ta dernière question, le dépôt des références a commencé en 2013 avec 3-4 labos pilotes signalés sporadiquement. Le projet a changé d’ampleur avec le vote d’un mandat OA par la commission Recherche de l’Université puis le recrutement d’un contrat sur 4 mois (août-décembre 2015) pour m’assister sur le dépôt. On travaillait ensemble sur une bibliographie collaborative Zotero (utile pour les vérifs) et un compte commun HAL.

  2. Justine Ancelin dit

    Encore une question: combien de temps avez-vous consacré à la saisie de ces quelques 3500 références dans Zotero ? Travailliez-vous dessus à temps plein ?



HTML possible

ou, répondez à ce billet via trackback.