Attributes | Values |
---|
type
| |
Thesis advisor
| |
Author
| |
alternative label
| - Stochastic modelling techniques for speech recognition
|
dc:subject
| - Évaluation
- Thèses et écrits académiques
- Processus stochastiques
- Markov, Processus de
- Modèles mathématiques
»more» |
preferred label
| - Techniques de modélisation stochastique pour la reconnaissance de la parole
|
Language
| |
Subject
| |
dc:title
| - Techniques de modélisation stochastique pour la reconnaissance de la parole
|
Degree granting institution
| |
note
| - Dans un système de reconnaissance de parole, l'analyse acoustique consiste à reconnaître dans le signal de parole des unités acoustiques (phonèmes, syllabes, mots). Cette étude concerne les modèles stochastiques utilisés pour représenter ces unités acoustiques. Ces modèles sont tous composés d'un processus non-observable ou «caché» ; représentant la structure temporelle grossière de l'unité acoustique et d'un processus d'observation liant le processus caché aux paramètres acoustiques extraits du signal de parole. Le plus connu de ces modèles, composé d'une chaîne de Markov «cachée» et d'un processus d'observation, est appelé Modèle de Markov Caché. Différents types de processus cachés (chaîne de Markov, semi-chaîne de Markov, chaîne de Markov hiérarchisée) ainsi que différents types de processus d'observation (modélisation discrète, continue, semi-continue – processus multiple) sont combinés et comparés. L'algorithmique est détaillée (principe d'optimisation pour l'apprentissage : algorithme EM, algorithmes d'apprentissage et de reconnaissance) ; l'algorithmique correspondant aux semi-modèles de Markov cachés constitue l'apport majeur de ce travail. De nombreux tests ont été effectués dans le cadre d'un système de reconnaissance de 130 mots isolés multi-locuteur. Ces tests montrent l'intérêt de la modélisation explicite du temps passé dans chaque état du processus caché notamment par le biais d'une semi-chaîne de Markov; L'utilisation de plusieurs processus d'observation améliore de manière très importante les résultats en permettant d’extraire une information plus riche du signal de parole. Dans le but d'apprendre globalement un dictionnaire de modèles acoustiques, la modélisation semi-continue nous apparaît comme une technique très prometteuse. Enfin, dans le cadre d'un système de reconnaissance de parole continue, ce travail propose un outil d'évaluation de treillis d'unités acoustiques basé sur une comparaison graphe-graphe par programmation dynamique.
|
dc:type
| |
http://iflastandar...bd/elements/P1001
| |
rdaw:P10219
| |
has content type
| |
is primary topic
of | |
is rdam:P30135
of | |