Ateliers et tutoriels > In-ovive

INtégration de sources/masses de données hétérogènes et Ontologies, dans le domaine des sciences du VIVant et de l’Environnement

Site de l'atelier : ici

La société actuelle doit faire face à des évolutions rapides et à des enjeux multiples (environnementaux, sociétaux, économiques). C'est particulièrement vrai pour le monde des sciences du vivant et de l’environnement, soumis en plus aux aléas naturels. Afin de répondre à ces enjeux et évolutions, il est nécessaire de posséder une vue globalisée et intégrée du domaine d’application étudié (e.g. les filières agricoles), tout en étant capable de préconiser des actions à des niveaux assez fins (e.g., parcelle, opération unitaire) et en tenant compte des différents points de vue impliqués.

Pour cela, il faut développer des outils génériques adéquats, or la plupart des études menées jusqu’à présent, soit ont proposé des approches spécifiques à une partie du domaine d’application étudié (e.g. amélioration génétique d’une filière), soit se sont concentrées sur des enjeux bien déterminés (e.g. problèmes sanitaires). Il en a résulté un éparpillement de la connaissance et une séparation des ensembles de données, ce qui s’est traduit par une grande difficulté à faire cohabiter ces connaissances et restituer ces données dans un système unique. Un des facteurs limitant du traitement informatique des données en sciences du vivant et de l’environnement est la difficulté à appréhender les données disponibles. Cette difficulté s’explique par les raisons suivantes :

  • le stockage des données expérimentales suffisamment décrites (par des métadonnées) et sous une forme informatisée homogène est loin d’être systématique dans l’approche analytique classique,
  • les données sont éparses, stockées dans des bases de données de laboratoire, publiées dans des revues scientifiques ou sur des pages de sites Web, mais aussi dans des rapports de projet, des thèses ou des supports de cours ;
  • les données sont représentées dans des formats hétérogènes (textes, tableaux, graphiques, spectres, images, …) ;
  • les données sont imparfaites (incomplètes et imprécises) ;
  • les évolutions technologiques rapides, qui permettent une observation de plus en plus fine (nature de l'information, fréquence d’acquisition, géo localisation), nécessitent de s’adapter et de gérer des volumes de données en forte croissante ;
  • l’intégration de ces données à différentes échelles, dans des modèles cohérents pose de nouvelles questions de recherche.

La recherche menée aujourd’hui autour de ces problématiques est de plus en plus collaborative, multi-expertes et requiert un usage intensif des données. La gestion automatisée et l’analyse de données scientifiques nécessitent d’intégrer des connaissances du domaine concerné. L’intégration nécessite de confronter les données et les connaissances disponibles et de valider la qualité de ces données et de ces connaissances. Avant de pouvoir combiner, explorer et expliquer les sources de données, il faut être capable de les caractériser,de les relier, de détecter les incohérences induites par l’intégration de ces sources. Ceci peut être réalisée à l’aide de méthodes informatiques d’intégration qui consistent à essayer d’établir des correspondances entre les données à l’aide d’une ontologie de domaine qui est une représentation, formalisée et structurée, du vocabulaire spécifique au domaine étudié.

Ces questions d’IC trouvent dans les domaines des sciences du vivant et de l’environnement une résonance importante et particulière qui justifie l’intérêt considérable de l’IC pour ces domaines et le développement de méthodes adaptées.
L'objectif de cet atelier est de dresser un panorama des recherches et expérimentations francophones traitant de l’intégration de sources/masses de données hétérogènes notamment à l’aide d’ontologies, dans le domaine des sciences du vivant et de l’environnement.

Thèmes
Les auteurs sont invités à envoyer des propositions ayant une portée théorique, méthodologique ou appliquée, sur l’un des thèmes suivants (liste non exhaustive) :

  • Modélisation et représentation des connaissances
  • Modélisation et capitalisation de connaissances extraites à partir de sources ouvertes,
  • Représentation de connaissances, en particulier à l’aide des langages du Web sémantique.
  • Ontologie et données
  • Gestion d’ontologies, construction d’ontologies, évolution d’ontologies,
  • Interopérabilité des sources de données et alignement d'ontologies,
  • Génération et publication des données et des ontologies sur le Web de données afin de permettre notamment l’interconnexion de jeux de données,
  • Détection de redondances dans les sources de données.
  • Méthodes d’intégration de données et acquisition de connaissances
  • Extraction d'informations à partir des données structurées (tableaux ou graphiques), peu structurées ou pas structurées, en langue naturelle,
  • Apprentissage automatique à partir de corpus,
  • Traitement automatique de la langue,
  • Annotation sémantique de connaissances, guidée par une ontologie.
  • Evaluation et qualification des sources d'informations et des données extraites
  • Raisonnement et connaissances imparfaites
  • Théorie de l’argumentation,
  • Raisonnement dans les bases de connaissances imparfaites,
  • Prise en compte des biais cognitifs dans les bases de connaissances imparfaites,
  • Méthodes de dialogue permettant d’expliquer des connaissances incomplètes.

Il pourra s'agir de travaux de recherche (présentation de méthodes, d'outils ou de résultats théoriques) ou de travaux plus appliqués tels que des études de cas ou des applications scientifiques ou industrielles. Dans tous les cas, les soumissions devront montrer la spécificité des questions scientifiques posées par le domaine des sciences du vivant et de l’environnement et montrer l’intérêt des résultats pour ces domaines.

Les soumissions pour faire une présentation orale à l’atelier pourront avoir deux formes :
- soit sous la forme d’un résumé (maximum 2 pages),
- soit sous la forme d’un article.

Dates importantes :

  • Soumission des articles : 7 avril 2016
  • Notification aux auteurs: 1 mai 2016
  • Soumission de la version définitive: 9 mai 2016
  • Atelier IN-OVIVE à IC: 7 juin 2016
Personnes connectées : 1