Axe de recherche Connaissance

Axe de recherche Connaissance

Les chercheurs de cet axe se sont fédérés pour proposer des méthodes et des outils d'extraction, de recherche, d'analyse et de filtrage des informations pour accompagner un utilisateur dans son investigation d’un vaste corpus de connaissances. Si pendant de nombreuses années on se demandait où chercher l'information, de nos jours le principal enjeu de la Recherche d’Information (RI) consiste à sélectionner les ressources pertinentes et à les présenter de façon judicieuse à l'opérateur humain dans un contexte précis. Notre approche est, en ce sens, fortement anthropocentrée.

Une interaction homme/machine contrôlée constitue une composante majeure de l’automatisation cognitive. La RI conceptuelle est un processus qui se déroule en plusieurs phases, chacune ayant des spécificités : indexation, calcul de pertinence, restitution de résultats et reformulation. Dans chacune de ces étapes, les mesures sémantiques jouent un rôle central. Une étude approfondie de ces mesures (distances, similarités sémantiques) a été menée, un cadre abstrait unificateur a été proposé et une librairie développée et mise à disposition de la communauté scientifique (Semantic Library - http://www.semantic-measures-library.org). Par ailleurs, les ontologies étant de plus en plus volumineuses, en particulier dans le domaine biomédical, nous avons développé une méthode d'extraction de sous-ontologies permettant à un utilisateur de se focaliser sur une partie bien idhttp://www.ontotoolkit.mines-ales.fr/ObirsClient/) et l' autre à la recherche de publications scientifiques liées au cancer pour l'ITMO Cancer (http://itcancer.mines-ales.fr).

Ces travaux ont également donné lieu à une collaboration entre plusieurs chercheurs de KID, puisqu'une approche hybride a été proposée, qui exploite l'analyse lexicale des ressources textuelles et des méthodes de segmentation de texte pour mettre en exergue, dans les documents retrouvés, les passages pertinents pour l'utilisateur en fonction de sa requête. Nous avons doté notre méthode de recherche d'information d’une fonctionnalité de reformulation permettant d'affiner la requête en fonction des ressources jugées pertinentes par l'utilisateur. L'implémentation de ces travaux est visible à http://obirs.itcancer.mines-ales.fr). Cette fonctionnalité illustre la place privilégiée qu’occupe l’interaction homme/machine dans nos travaux.

Nous avons développé une application qui exploite des ressources liées au domaine de la musique à partir des ontologies et du paradigme des données liées (dbpedia, etc.) (http://www.lgi2p.ema.fr:8090/kid/tools/bandrec). Il s’agit d’un système de recommandation basé sur le contenu . La segmentation automatique de texte et l’analyse automatique de sentiments ont fait l’objet d’une thèse .Sur la base de méthodes statistiques, nous avons proposé une méthode qui construit un dictionnaire de descripteurs d’opinion pour une thématique donnée. Ce dictionnaire est ensuite utilisé pour extraire automatiquement la polarité des extraits de texte identifiés à l’étape de segmentation. Ces méthodes d’extraction de connaissances combinées à des outils d’analyse multicritère adaptés à la fusion d’avis d’experts ouvrent la voie à des systèmes de recommandation pertinents, fiables et personnalisés qui minimisent l’intervention humaine dans le fonctionnement collaboratif de la recommandation. Ces travaux illustrent une fois encore la complémentarité des axes « Knowledge » et « Decision » pour répondre à la problématique complexe de l’automatisation cognitive.

Le LGI2P développe des travaux de recherche sur les méthodes de fouille de données appliquées au domaine biomédical. Les méthodes de découverte de connaissances à partir de données au service du patient (maladies chroniques : diabète, maladies cardiovasculaires, …)et le développement d’interfaces cerveau-machine pour le suivi de patients en rééducation post AVC sont nos sujets de recherche en fouille de données aujourd’hui.  Enfin, pour ce qui concerne notre activité plus spécifiquement rattachée à la visualisation, nous avons cherché à présenter une collection de ressources (gènes, publications, images, auteurs, etc.) sous la forme d’une carte sémantique afin d’en faire ressortir différentes caractéristiques. Pour gérer la complexité, la collection est indexée et lors d’interactions avec l'utilisateur, des sous-collections sont extraites et s’organisent de façon dynamique. Nous avons en particulier développé des modes d’interaction avec les sous hiérarchies de Galois pour indexer par propagation des objets à l’aide d’autres objets. Un brevet a été déposé en 2008.Initié par l’analyse des coauteurs des corpus documentaires que nous exploitons pour les travaux précédemment cités, nous avons développé un thème de recherche sur l’analyse des réseaux sociaux.

Afin de comprendre et d’extraire la connaissance partagée par les membres d’une communauté scientifique, nous nous intéressons à la détection de communautés partageant des connaissances (communautés recouvrantes) avec des techniques de clustering, de graph partitioning et de calculs d’équilibres. ). Ces travaux ont débouché sur un démonstrateur de détection de communautés recouvrantes pour des graphes bipartis, monopartis et orientés (http://communities.mines-ales.fr/) et sont consultables sur (http://social-networks.mines-ales.fr).

Collaborations:

  • LIRMM, UM2 Montpellier
  • SupAgro Montpellier
  • Laboratoire Movement to Health (M2H) de l’Université Montpellier 1
  • Centre de recherche en Neuroscience de Lyon (CNRS UMR 5292)
  • Inserm-IRCM (Institut de Recherche en Cancérologie de Montpellier)
  • Inserm-ITMO (gestion de communautés scientifiques multi organismes)
  • Inserm-DISC
  • Biomedical Engineering Research Group (BERG)
  • CNRS-DIST
  • CEA / DSV (programme transversal toxicologie)
  • SANOFI
  • Aviesan ITMOs
  • Université Rovira i Virgili (Tarragone, Espagne)

Projets:

  • AVIESAN,  TOXCEA