Learning deterministic regular grammars from stochastic samples in polynomial time

Rafael C. Carrasco, Jose Oncina
1999 RAIRO - Theoretical Informatics and Applications  
In this paper, the identification of stochastic regular languages is addressed. For this purpose, we propose a class of algorithms which allow for the identification of the structure of the minimal stochastic automaton generating the language. It is shown that the time needed grows only linearly with the size of the sample set and a measure of the complexity of the task is provided. Experimentally, our implementation proves very fast for application purposes. Résumé. Dans cet article, onétudie
more » ... 'identification de langages réguliers stochastiques. Dans ce but, nous proposons une classe d'algorithmes permettant l'identification de la structure de l'automate stochastique minimal qu'engendre le langage. On trouve que le temps nécessaire croît linéairement avec la taille de l'échantillon et on donne une mesure de la complexité de l'identification. Expérimentalement, notre mise en oeuvre est très rapide, ce qui la rend très intéressante pour des applications.
doi:10.1051/ita:1999102 fatcat:rw2vcb2qtnfo7ma5cns3dffuum