About: Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia   Goto Sponge  NotDistinct  Permalink

An Entity of Type : rdac:C10001, within Data Space : data.idref.fr associated with source document(s)

AttributesValues
type
Thesis advisor
Author
alternative label
  • From test suites for MT to an operating system for aligned corpora of multilingual , multi-annotated, and multi-media documents and meta-documents
dc:subject
  • Thèses et écrits académiques
preferred label
  • Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia
Language
Subject
dc:title
  • Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia
Degree granting institution
note
  • Cette thèse porte sur trois grands défis posés par la conception et la réalisation d'un « système d'exploitation de corpus de traductions », abrégé en « sectra ». Un sectra vise à fournir un support informatique unifié à l'exploitation de corpus de traductions effectuée à la fois par l'humain et par la machine. Le premier défi vise l'aspect de support informatique unifié pour l'évaluation de systèmes de TA. Le deuxième défi concerne l'aspect de support contributif et collaboratif au travail humain sur des corpus variés en contexte multilingue. Enfin, le troisième défi vise au support informatique à l'exploitation de corpus de traductions dans des applications novatrices (comme les iMAG, Notepad++, etc.). Plusieurs notions émergentes (un segment multilingualisé et contextualité, un corpus de documents « multifichier », etc.), principes généraux (laproactivité, la délégation, etc.), et problématiques à dominante conceptuelle (par exemple, définition étendue d'un « contexte» de segment), algorithmique (par exemple, programmabilité du traitement des corpus), et programmatoire (par exemple, traitement de masses de données) ont été abordés et traités pour la conception et la réalisation d'un tel système. Un système appelé SECTra_w a été construit et expérimenté avec succès dans le cadre de plusieurs projets réels pour l'évaluation de TA, la post-édition, et la multilinguïsation de sites Web et des applications.
  • The thesis focuses on three major challenges posed by the conception and implementation of an \"operating system of translation corpora\", abbreviated as \"sectra\". A sectra aims to supply a unified software environment to support the exploitation of translation corpora done by both human and machine.The first challenge aims to the aspect of software environment to support the MT evaluation. The second challenge relates to the aspect of collaborative and contributive support for human work on various corpora in multilingual contexts. Finally, the third challenge aims at software environment to enable the exploitation of translation corpora within innovative applications (like the iMAG Gateways, Notepad++, etc.). Several new notions (such as a multilingualized and contextualized segment, a corpus ofmulti-file documents, etc.), general principles (pro-activity, delegation of services, etc.), and problems at the conceptuallevel (for example, the extended definition of a \"context\" of segment), algorithmic level (for example, programmability of corpora processing), and programmatic level (for example, handling masses of data) have been addressed and dealt with for conceiving and implementing such system. A system called SECTra - w has been built and experimented successfully in the framework of sever real Dfojects of MT evaluation, post-edition, and multilimmalization of websites and applications.
dc:type
  • Text
http://iflastandar...bd/elements/P1001
rdaw:P10219
  • 2010
has content type
is primary topic of
is rdam:P30135 of
Faceted Search & Find service v1.13.91 as of Aug 16 2018


Alternative Linked Data Documents: ODE     Content Formats:       RDF       ODATA       Microdata      About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data]
OpenLink Virtuoso version 07.20.3229 as of May 14 2019, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (70 GB total memory)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software