Building task-oriented machine translation systems [thesis]

Germán Sanchis Trilles
The main goal of this thesis is to develop interactive machine translation systems which present a more robust synergy with their potential users. Hence, the main purpose is to make current state-of-the-art systems more ergonomic, intuitive and efficient, so that the human expert feels more comfortable when using them. For doing this, different techniques are presented, focusing on improving the adaptability and response time of the underlying statistical machine translation systems, as well as
more » ... systems, as well as a strategy aiming at enhancing the human-machine interaction. All of this with the ultimate purpose of filling in the existing gap between the state of the art in machine translation and the final tools that are usually available for the final human translators. Concerning the response time of the machine translation systems, a parameter pruning technique is presented, whose intuition stems from the concept of bilingual segmentation, but which evolves towards a full parameter re-estimation strategy. By using such strategy, experimental results presented here prove that it is possible to achieve reductions of up to 97% in the number of parameters required without a significant loss in translation quality. Being robust across different language pairs, these results evidence that the pruning technique presented is effective in a traditional machine translation scenario, and could be used for instance in a post-editing setup. Nevertheless, experiments carried out within a simulated interactive machine translation environment are slightly less convincing, since a trade-off between response time and translation quality is needed. Two orthogonally different approaches are presented with the purpose of increasing the adaptability of the statistical machine translation systems. On the one hand, we investigate how to increase the adaptability of the language model, by subdividing it into several smaller language models which are then interpolated in translation time according to the source sentence to be translated. The specific sub-models are built either by taking advantage of supervised information present in certain bilingual corpora, or by performing unsupervised clustering on the training set, with the aim of uncovering specific sub-topics or language vii i "thesis" -2012/3/12 -18:47 -page viii -#8 On the other hand, Bayesian predictive adaptation is elucidated as an efficient strategy for adapting the translation models present in state-of-the-art machine translation systems. Although adaptation experiments are only performed within the traditional machine translation framework, the results obtained are compelling enough for implementing them within an interactive setup, and such work will be done in the near future. Finally, special attention is devoted to increasing the synergy between the human expert and the interactive machine translation system. With this purpose, two different forms of weaker feedback are studied, which intend to increase the productivity of the human translator. For doing this, two different changes to the traditional interaction scheme are presented. The first one aims at anticipating the user's actions, and the second one is targeted at increasing the flexibility of the system whenever the user signals that there is an error he wants the system to correct. viii GST-DSIC-UPV i "thesis" -2012/3/12 -18:47 -page ix -#9 i i i i i Resumen La principal meta de esta tesis es desarrollar sistemas de traducción interactiva que presenten mayor sinergia con sus usuarios potenciales. Por ello, el objetivo es hacer los sistemas estado del arte más ergonómicos, intuitivos y eficientes, con el fin de que el experto humano se sienta más cómodo al utilizarlos. Con este fin se presentan diferentes técnicas enfocadas a mejorar la adaptabilidad y el tiempo de respuesta de los sistemas de traducción automática subyacentes, así como también se presenta una estrategia cuya finalidad es mejorar la interacción hombremáquina. Todo ello con el propósito último de rellenar el hueco existente entre el estado del arte en traducción automática y las herramientas que los traductores humanos tienen a su disposición. En lo que respecta al tiempo de respuesta de los sistemas de traducción automática, en esta tesis se presenta una técnica de poda de los parámetros de los modelos de traducción actuales, cuya intuición está basada en el concepto de segmentación bilingüe, pero que termina por evolucionar hacia una estrategia de re-estimación de dichos parámetros. Utilizando esta estrategia se obtienen resultados experimentales que demuestran que es posible podar la tabla de segmentos hasta en un 97%, sin mermar por ello la calidad de las traducciones obtenidas. Además, estos resultados son coherentes en diferentes pares de lenguas, lo cual evidencia que la técnica que se presenta aquí es efectiva en un entorno de traducción automática tradicional, y por lo tanto podría ser utilizada directamente en un escenario de post-edición. Sin embargo, los experimentos llevados a cabo en traducción interactiva son ligeramente menos convincentes, pues implican la necesidad de llegar a un compromiso entre el tiempo de respuesta y la calidad de los sufijos producidos. Por otra parte, se presentan dos técnicas de adaptación, con el propósito de mejorar la adaptabilidad de los sistemas de traducción automática. La primera de ellas se centra en mejorar la adaptabilidad del modelo de lenguaje, mediante su subdivisión en varios modelos de lenguaje más pequeños, pero más específicos. Una vez hecho esto, tales submodelos se interpolan en tiempo de traducción en función de la frase de entrada en cuestión. Los ix i "thesis" -2012/3/12 -18:47 -page x -#10 i i i i i submodelos específicos son construidos o bien teniendo en cuenta información procedente de etiquetas supervisadas existentes en diferentes conjuntos de datos bilingües, o bien mediante estrategias de agrupamiento no supervisadas, con el propósito de descubrir determinados temas o estilos lingüísticos. La segunda técnica de adaptación que se presenta en esta tesis consiste en aplicar la adaptación predictiva Bayesiana a los modelos de traducción subyacentes en los sistemas de traducción automática actuales. A pesar de que los experimentos de adaptación se han llevado a cabo en un entorno de traducción automática pura, los resultados obtenidos son lo suficientemente prometedores como para implementar las técnicas desarrolladas en esta tesis en un entorno interactivo en el futuro cercano. Por último, también se dedica una especial atención a mejorar la sinergia entre el experto humano y el sistema de traducción interactiva. Para ello, se estudian dos formas diferentes de realimentación débil, con la intención de mejorar la productividad del traductor humano. Con este fin, se presentan dos modificaciones al esquema tradicional de interacción. La primera pretende anticipar las acciones del usuario, mientras que la segunda tiene por finalidad mejorar la flexibilidad del sistema en el caso en que el usuario señale que hay un error que quiere que el sistema corrija. x GST-DSIC-UPV
doi:10.4995/thesis/10251/17174 fatcat:x453fsr6obepjmaq4jmtsqq5om