About: Web sémantique et mémoire d'expériences pour l'analyse du transcriptome   Goto Sponge  NotDistinct  Permalink

An Entity of Type : rdac:C10001, within Data Space : data.idref.fr associated with source document(s)

AttributesValues
type
Thesis advisor
Author
alternative label
  • Semantic web and experiments memory for the transcriptome analysis
dc:subject
  • Web sémantique
  • Thèses et écrits académiques
  • Biopuces
preferred label
  • Web sémantique et mémoire d'expériences pour l'analyse du transcriptome
Language
Subject
dc:title
  • Web sémantique et mémoire d'expériences pour l'analyse du transcriptome
Degree granting institution
note
  • Cette thèse rentre dans le cadre du projet MEAT (Mémoire d'Expériences pour l'Analyse du Transcriptome) dont le but est d'assister les biologistes travaillant dans le domaine des puces à ADN, pour l'interprétation et la validation de leurs résultats. Nous proposons une aide méthodologique et logicielle pour construire une mémoire d'expériences pour ce domaine. Notre approche, basée sur les technologies du web sémantique, repose sur l'utilisation des ontologies et des annotations sémantiques sur des articles scientifiques et d'autres sources de connaissances du domaine. Dans une première partie, nous proposons une ontologie modulaire pour la description des connaissances du domaine des puces à ADN (base de données d'expériences, articles scientifiques, entités biomédicales...). Cette ontologie intègre entre autres, l'ontologie déjà existante UMLS, ce qui nous a permis d'approfondir le problème de réutilisation d'ontologies et leur adaptation à une nouvelle application. Ensuite, nous proposons une méthodologie générique pour la génération d'annotations sémantiques basées sur cette ontologie en exploitant les connaissances contenues dans les textes. Cette méthodologie a l'originalité d'utiliser des techniques de traitement automatique de la langue et des grammaires d'extraction de relations pour extraire automatiquement des articles scientifiques les relations reliant des termes d'UMLS reconnus dans le texte. Un système supportant cette méthodologie a été implémenté et validé par nos collègues biologistes. Enfin, pour faciliter la diffusion des connaissances contenues dans la mémoire, nous proposons un prototype qui se base sur un moteur de recherche sémantique (Corese) et qui exploite la base d'annotations que nous avons constituée. Cette partie du travail a permis d'améliorer la tâche de recherche d'informations en la rendant plus efficace et en offrant des mécanismes de raisonnement sur les connaissances du domaine.
  • This work is carried out in the context of the MEAT project (Memory of Experiments for Analysis of Transcriptome) aiming to support biologists working on DNA microarrays. We provide methodological and software solutions to help biologists in the validation and the interpretation of their experiments. Our approach, based on Semantic web technologies, is relying on formalized ontologies, semantic annotations of scientific articles and knowledge extraction from texts. It can probably be extended to other massive analyses of biological events (as provided by proteomics, metabolomics...). First, we propose a modular ontology composed of three sub-ontologies covering all knowledge of the biochip domain (experiments databases, scientific papers, biomedical entities...). To describe the biomedical domain, this ontology integrates an existing ontology called UMLS, which allowed us to study the problem of reusing and adapting ontologies for new applications. Second, we propose a methodology for the automatic generation of ontology-based semantic annotations: starting from a scientific article in biology, it allows to generate a structured semantic annotation based on a domain ontology and describing the semantic content of this text. The generated annotations are based not only on concept instances but also on relation instances. Finally, to facilitate the sharing of the knowledge embedded in the memory, we propose a search module based on Corese which enables biologists to use annotations. By using the query and rule languages of Corese, this system allows to perform reasoning on the annotations base for retrieving relevant information.
dc:type
  • Text
http://iflastandar...bd/elements/P1001
rdaw:P10219
  • 2006
has content type
is primary topic of
is rdam:P30135 of
Faceted Search & Find service v1.13.91 as of Aug 16 2018


Alternative Linked Data Documents: ODE     Content Formats:       RDF       ODATA       Microdata      About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data]
OpenLink Virtuoso version 07.20.3229 as of May 14 2019, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (70 GB total memory)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software