This HTML5 document contains 21 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

PrefixNamespace IRI
dctermshttp://purl.org/dc/terms/
marcrelhttp://id.loc.gov/vocabulary/relators/
n2http://www.idref.fr/205586252/
n8http://www.idref.fr/027253139/
dchttp://purl.org/dc/elements/1.1/
rdauhttp://rdaregistry.info/Elements/u/
n13http://www.idref.fr/027813274/
skoshttp://www.w3.org/2004/02/skos/core#
n19http://www.idref.fr/052630072/
n5http://www.idref.fr/035331194/
n21http://www.idref.fr/189173602/
n18http://lexvo.org/id/iso639-3/
n11http://iflastandards.info/ns/isbd/terms/contentform/
rdachttp://rdaregistry.info/Elements/c/
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
frbrhttp://purl.org/vocab/frbr/core#
n15http://rdaregistry.info/termList/RDAContentType/
n10http://iflastandards.info/ns/isbd/elements/
n16http://www.idref.fr/175357730/
rdawhttp://rdaregistry.info/Elements/w/
n9http://www.idref.fr/052444724/
xsdhhttp://www.w3.org/2001/XMLSchema#
Subject Item
n2:id
rdf:type
rdac:C10001 frbr:Work
marcrel:ths
n5:id n16:id n19:id
marcrel:aut
n21:id
skos:altLabel
Recognition and context, a cooperative approach for reading printed text
dc:subject
Reconnaissance optique des caractères Thèses et écrits académiques
skos:prefLabel
Reconnaissance et contexte, une approche coopérative pour la lecture de textes imprimés
dcterms:language
n18:fra
dcterms:subject
n8:id n13:id
dc:title
Reconnaissance et contexte, une approche coopérative pour la lecture de textes imprimés
marcrel:dgg
n9:id
skos:note
La lecture optique de textes imprimés ne se base pas sur la seule reconnaissance de la forme graphique des caractères isolés ; elle repose aussi sur des informations statistiques, typographiques et contextuelles ; l'utilisation d'un étage d'analyse contextuelle, indépendant de l'étage de reconnaissance n'est pas satisfaisante. Ce travail a pour objet d'établir une coopération entre l'étage de reconnaissance et l'étage de correction contextuelle. L'étage d'analyse contextuelle qui est ensuite créé fournit à l'étage de reconnaissance les informations nécessaires afin que ce dernier puisse corriger en permanence ses critères de décision. L'objectif est d'augmenter les performances globales du système, au fur et à mesure des lectures successives. La première partie traite de la reconnaissance des caractères sans l'aide du contexte. Elle débute par une présentation des principales méthodes d'extraction et de traitement de l'information. Dans un premier temps, nous comparons les caractères de façon à isoler toutes les formes identiques du texte, qui seront appelées prototypes. Dans un deuxième temps, nous identifions ces prototypes grâce à une approche originale de reconnaissance, fondée sur une classification par voisinages adaptatifs. La deuxième partie est consacrée au traitement contextuel et aux liens entre les deux parties. L'étage d'analyse contextuelle corrige les erreurs à partir des redondances dans le texte des prototypes de caractères, des informations issues de l'étage de reconnaissance et de l'exploitation d'un dictionnaire. Le système réorganise les classes de l'espace de représentation en modifiant les paramètres qui interviennent dans le processus de reconnaissance. Le taux de reconnaissance globale doit atteindre un optimum qui ne dépend plus de la base d'apprentissage de départ, mais des choix des attributs et de la méthode de reconnaissance utilisée. The printed documents analysis is not only based on the optical character recognition, it also uses statistical, typographic and contextual information. A contextual stage, independent from the recognition does not give good results. The topic of this work is to build a cooperation between the recognition and the contextual stage. The recognition stage give information to the syntactic analysis stage in order to improve the correction process. Then, the contextual analysis stage provides necessary information to the recognition stage in order to correct its decision criteria and to improve automatically the recognition performance during the reading. This work is divided in two parts. The first part presents the character recognition only from the patterns and the second part studies the recognition with the help of contextual information mainly based on a syntactic correction. This work starts with a presentation of classic methods to extract features from patterns and to compare features descriptions. Then we introduce a pattern compacted by mutually comparing characters to collect all identical patterns on the entire text, called prototypes. In order to reconstruct the recognized text, we identify these prototypes with an original pretopological recognition approach, based on a classification by adaptive neighborhoods. The second part of this work deals with the contextual processing and the cooperation abilities between the two main stages involved in the recognition process. The contextual analysis corrects recognition errors with the pattern redundancies information and a trie dictionary. The system reorganizes pattern representation of the system by modifying parameters that intervene in the process of recognition. The global recognition rate reach an optimum that no longer depends on the training set, but on choice of features and the method of comparison used.
dc:type
Text
n10:P1001
n11:T1009
rdaw:P10219
1996
rdau:P60049
n15:1020