BiUM Blog

Un autre regard sur la Bibliothèque Universitaire de Médecine de Lausanne

Flower

Archive(s) de la catégorie ‘Métadonnées’

Les dépôts institutionnels : un bilan

DINI (Deutsche Initiative für Netzwerkinformation) a organisé début décembre un colloque à Berlin intitulé : Repositories : Practice & Vision.
La présentation introductive propose un bilan très complet des caractéristiques des dépôts en 2010. Une grand nombre de pistes de développement sont évoquées.
Les présentations suivantes, notamment la présentation de Martin Fenner : Repositories: Researcher Perspective, mettent l’accent sur les points faibles de nombre de dépôts actuels : manque de visibilité, peu de textes disponibles, des fonctionnalités qui ne répondent pas aux besoins des auteurs/chercheurs. Martin Fenner cite au passage l’article qui fait toujours référence de Dorothea Salo « Innkeeper at the Roach Motel, » une synthèse remarquable (et non dépourvu d’humour) rédigée en 2008 sur les dysfonctionnements des dépôts. Le point commun entre un grand nombre de ces présentations est l’articulation entre les DI et les CRIS (Current Research Information Systems ou systèmes d’information sur la recherche en cours) qui doivent incorporer dans la mesure du possible des informations standardisées et faire le lien également avec les données primaires issues de la recherche.
Le schéma repris par Martin Fenner est très parlant.
cris2

Au coeur des développements technologiques c’est encore et toujours les systèmes d’identification univoque des auteurs ainsi que la récupération des métadonnées qui font l’objet de plus de commentaires, de projets et d’innovations.
Plusieurs intervenants soulignent la croissance du mouvement pour des données ouvertes et réutilisables (movement for open, re-usable bibliographic data).
Une présentation du protocole SWORD qui permet de récupérer automatiquement les métadonnées provenant des sites des éditeurs donne envie de le voir implanté rapidement dans nos applications locales.
Le débat reste tout de même ouvert concernant la pertinence des dépôts institutionnels multidisciplinaires. Les dépôts internationaux thématiques n’ont ils pas plus de chances de succès ?
La réussite de RePEc, présentée par son concepteur, Thomas Krichel, est certainement lié à sa spécialisation.
Selon Krichel le succès d’un archive ouverte dépend surtout de la grande ouverture et souplesse offertes à ceux qui doivent déposer.
– something that everybody can use,
– something that everybody can contribute to.
Une approche que l’on souhaiterait voir mise en pratique dans la gestion de plus de DI.

Exports, retraitement et gestion des références

Les logiciels de gestion bibliographiques sont de plus en plus sophistiqués et gèrent maintenant plus que les références. Ce sont aussi des outils incontournables pour constituer et organiser des bibliothèques électroniques de fichiers en formats pdf ou autres. Les collaborateurs des bibliothèques médicales du site (CHUV) se sont interrogés au cours d’un atelier sur comment mieux utiliser ces outils : les traditionnels (Endnote, Refman), et les nouvaux (Zotero, Mendeley).
Les cas pratiques à traiter étaient les suivants :
Imaginons, un chercheur se présente…
…avec une liste bibliographique en format Word
…avec une liste de références imprimée depuis PubMed
…avec une clé USB contenant plusieurs fichiers PDF, avec des noms de fichiers très hétérogènes
Il vous demande conseil pour…
…constituer, gérer, modifier un corpus de références
…élaborer une bibliographie
…réutiliser ces références pour différents travaux
…organiser ses fichiers PDF
…partager ses références avec des collègues à distance
…rendre la base accessible sur le web

La présentation sur Slideshare :

Nouvelle apologie de l’indexation matière

[Ce texte est une réponse personnelle à la question "L’indexation matière a-t-elle encore du sens à l’époque de Google ou d’Amazon ?" traitée par mon collègue Thomas Brauchli dans son billet du 23 octobre 2009]

J’ai lu avec beaucoup d’intérêt le compte-rendu de la conférence « Apologie de l’indexation-matière« , c’est un sujet passionnant où nous pouvons voir deux visions du catalogue (et du catalogage) s’affronter : l’approche pragmatico-technologique et celle plus conceptuelle et méthodologique.

Même si cela peut surprendre je me situe clairement du coté de Thomas Mann car sa défense de l’indexation matière n’est pas un combat d’arrière garde mais, au contraire, une défense fondamentale de la valeur ajoutée qui est injectée dans le système par les humains qui traitent les documents et qui, à mon avis, ne peut pas être remplacé par des traitements automatiques des informations bibliographiques ou du texte intégral, qu’ils soient à priori ou à posteriori.

C’est une énorme erreur de penser que nos catalogues et bases de données doivent ressembler de plus en plus à Google car nos outils ne pourront jamais appliquer les techniques de ce moteur de recherche. En effet, contrairement à Google, le corpus des informations dont nous disposons est fermé. Se contenter des descriptions bibliographiques des documents ou du texte intégral équivaut à abandonner les seules armes qui nous permettent d’exploiter les données du catalogue avec des ressources conceptuelles externes et donc à améliorer les résultats de la recherche par d’autres moyens que ceux qui se rapportent aux données ou métadonnées des documents (catalogage simple plus texte intégral).

La méconnaissance des techniques de Google (bien entretenue par sa politique de communication de boîte noire) peut provoquer bien des dégâts quand les gens tentent de l’imiter et de simplifier ses méthodes ou ses outils pour s’approcher d’un modèle où la technologie remplace le traitement humain. L’apparente simplicité de son moteur de recherche n’est qu’un leurre qui cache bien des technologies de traitement de l’information et de reprocessage mises au point pendant ces dix dernières années par une foule de chercheurs et techniciens qui ont réussi à exploiter de manière remarquable les informations crées par des gens.
(Lire la suite…)

L’indexation matière a-t-elle encore du sens à l’époque de Google ou d’Amazon ?

Compte rendu de la 6e Conférence de la DIS (Université de Genève) Apologie de l’indexation-matière

Intervenant :  Bruno Menon,  maître de conférences associé, Université Paris 8, Département Sciences de l’information et de la documentation).
Présentation Powerpoint et références complètes disponibles sur http://www.unige.ch/biblio/sinformer/conferences.html

L’indexation matière a-t-elle encore du sens à l’époque de Google ou d’Amazon ?

Dans le cadre des catalogues actuels et surtout futurs, l’indexation matière est souvent jugée obsolète car trop compliquée, trop chère, peu utilisée. Les modèles d’accès à l’information issus des entreprises dominantes du Web seraient à privilégier, car plébiscités par les utilisateurs. Deux rapports américains de la bibliothèque de l’Université de California (UC 2005) et de la bibliothèque du Congrès (Calhoun, 2006) préconisent donc l’abandon de l’usage des vocabulaires contrôlés pour l’expression du sujet dans les notices bibliographiques. Calhoun estime même que les collections entièrement numérisées, indexées automatiquement par les mots de leurs textes, pourraient se passer de catalogue.

En l’absence du champ d’indexation matière, on perd plus de 35% des références, avertissent Tina Gross et Arlene G. Taylor (2005). Bruno Menon, bien que n’étant pas bibliothécaire, défend le catalogue et l’indexation matière, à condition (1) que le vocabulaire contrôlé soit suffisamment riche, tenu à jour, largement doté en points d’accès et mis à disposition de tous sous une forme aisément compréhensible, et (2) que  l’indexation soit faite soigneusement. Il faut indexer en fonction d’un langage précoordonné pourvu d’une syntaxe, précise même Thomas Mann (2000) (le fameux… bibliothécaire, vous l’aurez deviné ! ).

Tout cela a un prix ! Sur la question des coûts, Bruno Menon soulève  une question  de fond(s) :

« Une rationalité marchande doit-elle s’appliquer dans le cas des institutions culturelles, et en particulier de bibliothèques de recherche ? » Selon lui, les catalogues et Google sont des systèmes différents qui doivent pouvoir coexister, s’adresser à des publics plus ou moins nombreux, et répondre à des besoins divers, sans pour autant s’exclure. B. Menon relève qu’au moment où il est question de déstructurer ou de déconstruire les catalogues, on travaille beaucoup sur la structuration des données. L’architecture du Web sémantique reprend en partie le modèle conceptuel du catalogue :

  • données = collections
  • métadonnées = notices
  • ontologies = autorités

[Ontologies : il s’agit des principes fondamentaux d’un domaine et leurs relations. (Roberts, Roger, 2008)]

En conclusion, Bruno Menon cite Michel Mingam (2005), dont il partage le point de vue sur l’importance du langage d’indexation :

« […] un outil dont les pesanteurs sont certaines mais dont les potentialités nous semblent loin d’avoir été entièrement épuisées, y compris dans le contexte des évolutions techniques en cours, si l’on veut bien admettre que ces dernières ne sauraient totalement évacuer la question des contenus intellectuels. ».

Thomas Brauchli

Vous parcourez actuellement les archives pour la catégorie Métadonnées.