La lematización en español: una aplicación para la recuperación de información (R. Gómez Díaz)

Rodríguez Yunta, Luis
2006 Revista Española de Documentación Científica  
La recuperación de información (RI) es una disciplina relativamente joven, que ha experimentado un rápido desarrollo en los últimos años, debido fundamentalmente a la aparición de los motores de búsqueda. Sin embargo, desde su origen, se ha pronosticado que la lingüística computacional y las técnicas de procesamiento del lenguaje natural (PLN) traerían una auténtica revolución a los sistemas de recuperación de información (SRI). La obra que aquí se reseña aborda un aspecto indispensable en la
more » ... vestigación en este campo: la lematización, neologismo que se aplica al proceso de eliminación automática de partes no esenciales de los términos (sufijos, prefijos) para reducirlos a su parte esencial (lema) y facilitar la eficacia de la indización y la consiguiente recuperación. Estos neologismos, lema y lematización, proceden del campo de la Informática. En inglés se denominan stem y stemming, términos que encontraremos con frecuencia en la bibliografía internacional o en la propaganda de programas como dtSearch de Bitext. El lema es una etiqueta informática, que en español coincidirá generalmente con el lexema o raíz de las palabras, pero que no necesariamente han de ser equivalentes.
doaj:a2b68b9de6514abeb878badb5313ea49 fatcat:xamvihblujdf7jl5n2orxf3fjm