Modélisation de HMM en contexte avec des arbres de décision pour la reconnaissance de mots manuscrits

Anne-Laure Bianne-Bernard, Christopher Kermovant, Laurence Likformann-Sulem, Chafic Mokbel
2011 Document Numérique  
Cet article présente un système à base de HMM pour la reconnaissance hors ligne de mots manuscrits. Afin de prendre en compte les liaisons entre les caractères d'un même mot (monographes), leurs modèles sont considérés dépendants de leur contexte (trigraphes). Une telle modélisation augmente de manière considérable le nombre de paramètres à calculer, ce qui nous amène à considérer un partage des paramètres. Nous effectuons un clustering sur chaque position d'état, basé sur des arbres de
more » ... qui ont l'avantage, en phase de test, de pouvoir associer un modèle connu à un trigraphe non appris. Nous avons testé notre système sur la base publique Rimes, et ses performances dépassent celles d'un système à base de monographes et atteignent plus de 80 % de mots correctement reconnus. ABSTRACT. This paper presents an HMM-based recognizer for the off-line recognition of handwritten words. Word models are the concatenation of context-dependent character models: the trigraphs. Due to the large number of possible context-dependent models to compute, a clustering is applied on each state position, based on decision trees. Our system is shown to perform better than a baseline context independent system, and reaches an accuracy higher than 80 % on the publicly available Rimes database. MOTS-CLÉS : reconnaissance d'écriture manuscrite, clustering d'états, arbres de décision.
doi:10.3166/dn.14.2.29-52 fatcat:nerbukgbybeohj6qjvrvr3ticm