Skip to content


[LIB 2.011] Utiliser l’intelligence artificielle et les agents virtuels pour améliorer les services de renseignement en bibliothèques

Posté dans Compte-rendu, Lib 2.011, Service de référence en ligne.

LIB 2.011 est une conférence internationale, gratuite et entièrement en ligne sur les bibliothèques organisée par la School of information and Library Sciences de la San José State University qui s’est tenue les 2, 3 et 4 novembre 2011. L’enregistrement des ateliers est disponible en ligne.

Que ce chat est laid ! (ccc)

Présentation de Michele McNeal (web specialist – Akron-Summit County public library) et David Newyear (Adult information services manager-  Mentor Public Library)

EMMA

EMMA est un agent intelligent (=chatbot), un agent conversationnel, un programme informatique installé sur le site web de la Mentor Public Library depuis 2 ans.

Les moteurs de recherche nécessitent que l’usager trouve l’information ce dont il a besoin, l’agent virtuel le trouve pour lui. La recherche se fait à partir d’un dialogue entre l’agent et l’usager en utilisant le langage naturel (natural language processing, NLP). L’usager n’utilise pas la même terminologie que la bibliothèque, le NLP résout ce problème. Ils n’ont pas à connaître notre vocabulaire pour interagir avec la bibliothèque.

Deux composants dans l’agent intelligent :

  • le cerveau (brain) : détermine comment l’agent répondra aux requêtes. il se compose de plusieurs fichiers AIML (Artificial Intelligence Markup Language). Le logiciel Pandorabot est utilisé comme hôte de l’IA.
  • le visage (face) : optionnel, animé ou pas, texte audio, plus ces fonctionnalités seront utilisées, plus la conservation sera réaliste. L’application SitePal est utilisée pour héberger l’avatar

pourquoi utiliser AIML ?

Langage simple, open source et gratuit qui utilise différents langages html, xml, php, javascript. L’agent peut être utilisé de différentes manières : texte d’aide dans l’opac, avatar interactif parlant dans le site web, mini avatar sur la page d’accueil, page pour web mobile, etc.

Comment fonctionne AIML ?

Le langage se base sur des catégories, des patterns (modèle de question) et des templates (modèles de réponse). Une question équivaut à une réponse. possibilité d’ajouter du html aux templates (renvoi vers une page web, une recherche catalogue).

Utilisation des wildcards : astérisque et underscore permettant de créer un pattern pour une large gamme de questions “Do you know * is ?”

Utilisation des wildcards multiples : “* who * is ?” pour “Do you know/can you tell me who/i want to know”

Le tag <SRAI> : permet d’essayer tous les templates sur le pattern

Réponse aléatoire avec le tag <random> pour les questions triviales du type “i like the library”.

Le programme Pandora gère les erreurs de frappe les plus courantes mais pas toutes.

Bilan du service

quelle répartition des échanges ?

  • 30% sur les procédures, le règlement et les collections de la bibliothèque
  • 35-40% de recherche sur le catalogue
  • le reste est du chat.

Le but de l’agent est de répondre aussi précisément que possible à la question. Un mot recherché correspond à de très nombreuses possibilités.  Mais il y a plus de chances de tomber sur une mauvaise réponse et le délai de réponse est plus long.
Problèmes : gérer les fautes, gérer les dialectes et le temps passé à créer de nouvelles catégories.

Comment accroître les connaissances du bot ?

– manuellement (avec un éditeur html)
– Pandorawriter (éditeur inclus dans Pandora)
– Python (pour générer un grand nombre de catégories)
– Apprentissage autonome, le bot peut apprendre tout seul : passer en revue les logs des conversations, moyen efficace mais chronophage

L’avatar

Visage et voix : l’avatar est optionnel, les avatars humains ont été écartés pour éviter tout problèmes de discriminations des minorités. Choix du chat : longue histoire entre les bibliothèques, les livres et les chats.

Les débats engendrés par l’utilisation d’un avatar :
– photoréaliste ?
– animé par des expressions faciales ?
– sens de l’humour
– IA uniquement ou IA + assistance humaine

Étude de DeAngeli : Relation de domination entre l’usager et le bot, ils peuvent le “punir” en éteignant l’ordi/l’application, inconsciemment le bot est pris pour un être humain, la moitié des usagers adopte une attitude de compétition et essaye de tester les limites du bot, l’autre moitié est plus coopérative (car ils se rendent sur le site de la bib pour répondre à un besoin d’information)

EMMA ignore explicitement les insultes et reprend la conversation si l’utilisateur se calme.

Lorsqu’aucun terme entré par l’usager ne correspond à une catégorie, le bot utilise une catégorie ultime (<pattern>*</pattern>), il est alors renvoyé vers une recherche sur le catalogue, le site web, les bdd ou une assistance humaine.

La fin du renseignement ?

les agents virtuels sont présents un peu partout, et se portent plutôt bien “400% d’augmentation d’ici 2014” selon une étude. Plusieurs agents en Allemagne, exemple de PIXEL (University of Nebraska Linconl Libraries http://pixel.unl.edu (créé par Dee Ann Allison)

Les usagers aiment beaucoup les agents virtuels, surtout les ados. Une utilisation soutenue permet d’accroître la pertinence des résultats, le taux de réponses correctes est passé de 12% à 83%.

Les personnes sont anxieux, ils se demandent s’ils vont garder leur job, s’ils sont encore utiles, si les services traditionnels en bibliothèque ont encore une raison d’être -> mais que se passerait-il si on ignorait ces technologies ? ces technologies se développent dans le quotidien des usagers (SIRI, app Android)

Avantages :

  • usager n’a pas à réfléchir à la manière de poser sa question (langage naturel)
  • réponse immédiate
  • plus facile pour poser des questions idiotes
  • 24/24 7/7
  • anonyme
  • marketing
  • amusant à utiliser
  • intéressant pour les publics d’ados

Inconvénients :

  • chronophage
  • logs à vérifier
  • nouvelles catégories à ajouter
  • bêta permanente

EMMA est devenu INFOTABBY (Open source-apache 2.0 license), disponible sur Google code et sur le site dédié.

Taggé , , , , , , , .


0 réponses

Suivez la conversation, abonnez-vous au flux RSS des commentaires de ce billet.



HTML possible

ou, répondez à ce billet via trackback.