Séminaire : Technologies de la connaissance et recherche d'information en contexte

Séminaire de recherche
« Technologies de la connaissance et recherche d'information en contexte - Projets de recherche et usages applicatifs »

Le jeudi 16 Juin 2011

Direction : Luc Grivel 

Cycle thématique
Eduquer et transmettre 2011
Lieu : Site Gennevilliers
« Adresse précise, voir ci-dessous »

"Participation gratuite dans la limite des places disponibles. Inscription en ligne : « http://doodle.com/pyxx8atr8s2rzmwc »

Thématique 

Depuis une dizaine d’années, on assiste au développement d’applications basées sur des moteurs de recherche d’information capables de s’interfacer avec des systèmes d’information hétérogènes. Potentiellement, ces applications sont susceptibles d’accéder à toute information qui aura pu être stockée concernant ou caractérisant une personne, une société, un lieu, un objet. Ce décloisonnement des systèmes d’information soulève bien des interrogations :
1) sur le plan de l’ingénierie: Comment définir le contexte ? Comment le prendre en charge durant le processus de recherche d’information, Comment relier des systèmes existants et des contenus jusqu’alors autonomes ?
2) sur le plan des usages applicatifs (exploitation des contenus) et de la gouvernance des systèmes d’information : Comment garantir la cohérence des résultats, la sécurité et la confidentialité des accès aux contenus?

Ce séminaire vise à lancer une réflexion sur les impacts de l'introduction des technologies de la connaissance dans les systèmes de recherche d’information sur les usages et sur les pratiques de recherche d'information, en quoi elles offrent des potentiels nouveaux, modifient nos pratiques de recherche d'information, voire nos modes de pensée et de travail.

Programme 

9h45-10h : Accueil 

10h00-10h15 Présentation de la journée par Luc Grivel, INDEX-Paragraphe 

10h15-10h45 La « qualité perçue » comme instrument d’étude sur les nouvelles pratiques de recherche d’information Valery Nosulenko, Directeur de recherche à l'Institut de psychologie, Académie des sciences de Russie, Responsable du laboratoire "Psychologie de communication dans les environnements augmentés" Professeur invité à Paris-8 

Quelles sont les éléments pertinents d’un nouveau système de recherche d’information ? Comment ce système modifie les pratiques de recherche d'information ? Comment analyser les activités d’usage dans ce contexte ? Nous discutons ces questions sur le fond du paradigme de « qualité perçue » qui représente un ensemble de techniques pour définir la pertinence subjective de différents éléments médiatisant l’activité d’usage. La qualité perçue intègre à la fois les propriétés observables d’un système ou d’une situation et les caractéristiques du sujet (individu ou groupe) en tant qu’utilisateur de ce système. L’analyse vise soit la mise en évidence de la qualité perçue des caractéristiques actuelles de la situation (ici et maintenant), soit l’historique de sa constitution (vécu antérieur de l’individu ou du groupe), soit l’avenir attendu par l’individu (le contenu de ses buts qui sont les anticipations de la situation future). Nous discutons les apports et les limites de la méthode en l’illustrant par des cas concrets.
10h45-11h10 La recherche d’informations linguistiques en contexte d’écriture : « Le petit Google illustré ? Maryse Courberand (doctorante laboratoire PARAGRAPHE)
Comment procède exactement un « écrivant » (sur écran) pour rechercher et sélectionner une information linguistique en ligne (orthographe, conjugaison, grammaire…) au cours de sa pratique d’écriture ?
Quels services d’aide à la rédaction utilise-t-il ? Comment formule-t-il sa requête ? Et comment décide-t-il d’arrêter sa recherche d’information estimant avoir la réponse à sa question ?
Nous nous proposons d’observer des individus « écrivants » , qu’ils soient profanes ou professionnels, selon différents modes d’investigation: analyse filmique des situations, analyse de discours sur le film par les filmés, analyse de discours sur la question dans différents forums, questionnaires et interviews.  La démarche se veut d’abord ethnographique et ethno-méthodologique. Pour ce séminaire, nous présenterons uniquement le cas d’un écrivant. 

11h10-11h30 Les usages en situation de recherche d’information et la compétence informationnelle : l’interaction homme-machine comme collaboration à potentiel didactique Safia ABOUAD (doctorante laboratoire PARAGRAPHE)
« […] whether our actions are ad hoc or planned depends upon the nature of  the activity, or our degree of expertise »
La subjectivité peut-elle, de problème dans la modélisation des activités de recherche d’information, passer au statut de ressource dans l’élaboration de dispositifs sociotechniques (outils et mode d’emploi) améliorant la qualité des résultats d’une requête faite à un SRI (système de recherche d’information) ? Je propose de donner un panorama du problème de la personnalisation des processus d’interaction homme-machine, sa dimension historique – notamment en faisant état de l’apport décisif de Lucy Suchman – et sa prégnance actuelle traversant les disciplines (informatique, ergonomie cognitive, éducation, SIC, …). C’est donc une approche considérant l’apport des travaux sur la place de la subjectivité dans l’utilisation de SRI, argumentant la pertinence d’une approche collaborative de la situation d’usage, prenant en compte la question de la compétence informationnelle des acteurs en situation de recherche d’information et le potentiel didactique de telles situations.

PAUSE 11h30-11h45

11h50-12h20 Recherche d'informations techniques et d’expertises dans une grande entreprise : apport de la gestion des connaissances, pratiques et enjeux Yasmina Quatrain (ingénieur EDF R&D)
Le contexte d’expérimentation choisi est une étude des accès à l’information des différents acteurs (techniciens, ingénieurs) avant et pendant l’arrêt d’une tranche d’une centrale de production, en vue de réaliser les « plusieurs milliers d’opérations d’entretien effectuées lorsqu’un arrêt du réacteur est programmé ». La démarche proposée est de faire « du moteur de recherche le pivot de l’accès aux contenus du système d’information ». L’exploitation du contexte d’élaboration des documents, c’est à dire la caractérisation du document dès sa création en prenant compte son parcours au sein de processus métiers structurants, constitue l’une des pistes importantes d’amélioration proposées, bien que cette approche ne soit pas envisageable de manière rétroactive. « Un bénéfice attendu est de disposer d’un typage des documents plus proche des pratiques et des organisations, et qui mémorise en partie les intentions qui ont conduit à la rédaction du document et donc contribue à avoir une idée de ce qu’il peut contenir. » Une autre piste explorée est d’adosser la recherche à des systèmes d’organisation des connaissances. Enfin, un troisième levier d’amélioration pour mieux trouver l’information ou identifier les acteurs la possédant, ou contribuant à sa construction est de faire appel aux réseaux ou communautés. L’idée est de faciliter la recherche d’experts dans l’organisation en développant des communautés de pratique et en favorisant le travail collaboratif.
REPAS

14h-14h30 analyse sémantique et moteurs de recherche : apport des entités nommées Patrick Constant (PERTIMM ; projet Infomagic Cap Digital))
Patrick CONSTANT (PERTIMM) présente les travaux de son équipe dans le cadre du « projet Infomagic (2006-2009), coordonné par Thales et soutenu par le pôle de compétitivité francilien Cap Digital». Il décrit comment des résultats d’extraction d’entités nommées (personnes, lieux, organisations, expressions temporelles et numériques)) issus de 4 annotateurs peuvent être fusionnés pour améliorer les résultats d’un moteur de recherche. « La fusion permet de gérer la compatibilité entre annotations et de mettre en évidence les conflits, pour fournir des informations plus fiables.» Des exemples concrets illustrent les apports de la fusion d’entités nommées complexes pour la recherche d’information. Ils mettent en évidence certains enjeux importants pour le Web sémantique, concernant notamment les problèmes de normalisation des dates, « car une même date peut être désignée de très nombreuses façons différentes dans un texte » et des expressions numériques, (problématique des unités et gestion des recherches par intervalles).

14h30-15h Calcul de l’autorité des pages web au sein de leurs communautés respectives - Propositions pour une contextualisation de l’information par Aurélien LAUF, doctorant CIFRE encadré Mathieu Valette et Monique Slodzian (INaLCO - Langues'O), au sein de la société AMI Software.
Cette intervention présentera un ensemble de pistes pour la contextualisation des résultats des moteurs de recherche et des plateformes de veille sur internet. Nous nous intéressons au problème du calcul de l’autorité des sources afin d’illustrer notre propos. A partir d’un examen de l’algorithme HITS de Jon Kleinberg, nous proposons une réflexion sur la validité des pratiques en matière de calcul d’autorité. Notre objectif est de montrer que calculer l’autorité des sources en fonction des communautés auxquelles elles appartiennent et proposer des outils de visualisation adéquats (CliquePercolation Method) permet de sortir de la logique de classement et laisse à l’utilisateur final la liberté d’interpréter les résultats selon ses besoins.

15h-15h30 Bilan-Conclusion de la journée

Informations pratiques : 

Adresse :
Pôle Universitaire de Gennevilliers – (Cliquez ici pour accéder à Google Map), ZAC Barbanniers, 1, avenue Marcel Paul, 92230 Gennevilliers, France.
Salle « suspendue » (suivre le fléchage)
Transports en commun : Métro Ligne 13 en direction de Asnières-Gennevilliers, arrêt Porte de Clichy, puis RER C direction Argenteuil / Montigny-Beauchamp, arrêt Gennevilliers.
Voiture : Suivre Google map et entrer dans l’allée de la Gare (au feu sur l’avenue Marcel Paul, passer au milieu de l’IUFM). Le parking est situé à gauche
Contacts organisation :
Pierre Quettier
tél : 06 73 47 98 07
Isabelle Ménil tél: 01 41 21 74 71