Tendencias en procesamiento del lenguaje natural

Hace veinte años que se organiza con una periodicidad bienal un congreso que recoge específicamente cuáles son las tendencias en procesamiento del lenguaje natural y que se ha convertido en un referente en este ámbito de conocimiento. Los temas que se tratan en este congreso van desde la fonética, la fonología y la morfología, pasando por los tesauros y las ontologías, la traducción automática y asistida, hasta la adquisición de conocimiento, la recuperación de información, la extracción de terminología, la minería de opiniones, el aprendizaje de idiomas asistido por ordenador o el procesamiento del lenguaje natural aplicado a la semántica y a la biomedicina.

La décima edición del congreso internacional Recent Advances in Natural Language Processing tuvo lugar en Bulgaria del 7 al 9 de septiembre del 2015. Este congreso es organizado por la Universidad de Wolverhampton y la Bulgarian Academy of Sciences.

En esta ocasión las conferencias se centraron en temas tan variados como la traducción automática en contraposición con la traducción humana y de qué manera ambas pueden llegar a ser integradas en un único sistema de traducción (Marcello Federico, When Machine Translation Meets Human Translators); la aplicación de la estadística y la reordering grammar para mejorar el proceso de traducción automática de un texto (Khalil Sima’an, Reordering Grammar and Hidden Treebanks); la aplicación de técnicas de procesamiento del lenguaje natural para la localización de comunidades web centradas en la resolución de preguntas, el análisis de las preguntas y respuestas que se ofrecen en estas comunidades y la mejora de los buscadores web (Idan Szpektor, Natural Language Processing for Community Question Answering); el uso de procesamiento del lenguaje natural para capturar el conjunto de noticias que se publican diariamente en cuatro lenguas (inglés, danés, español e italiano), extraer qué ha pasado a quien, cuando y donde y dar acceso a la fuente de información de donde se ha extraído (Piek Vossen, From Mentions in Text to Instances in RDF: Cross-Lingual Interpretation of Unstructured News in the NewsReader Project); la mejora de los sistemas de traducción automática estadística para que puedan llegar a ofrecer traducciones sintácticamente correctas y semánticamente adecuadas o coherentes con el discurso (Bonnie Webber, Towards Improving the Discourse Coherence of SMT Output), y de qué forma los tesauros o las bases de datos léxicas como Wordnet nos pueden ayudar a encontrar las palabras que necesitamos en el momento de comunicarnos oralmente o de escribir, y saber si pueden llegar a ser más efectivas que los diccionarios convencionales (Michael Zock, Roget, WordNet and beyond).

Los distintos bloques temáticos en que se organizaron las presentaciones también reflejaron las diferentes líneas de estudio y de interés que hay en el ámbito del procesamiento del lenguaje natural. Los bloques temáticos trataron temas de minería de opiniones y análisis de sentimientos, procesamiento del lenguaje natural aplicado al ámbito médico y a las redes sociales, traducción automática aplicada a distintos idiomas, etiquetado y análisis de corpus, expresiones multilingües, lexicones y ontologías y reconocimiento de expresiones nominales.

En este congreso presentamos una nueva herramienta de extracción automática de terminología, denominada TBXTools, que permite extraer de una manera muy eficiente términos multipalabra de un corpus especializado a partir de una combinación de métodos estadísticos y lingüísticos. La descripción de esta herramienta y sus funcionalidades se encuentran en el artículo “TBXTools: A Free, Fast and Flexible Tool for Automatic Terminology Extraction”.

El alcance temático del congreso hizo posible compartir de una manera natural la investigación que se lleva a cabo en cualquiera de las líneas de trabajo que están presentes en el ámbito del procesamiento del lenguaje natural con diferentes expertos de todo el mundo, gracias al carácter transversal que tiene este ámbito de especialidad.

Cita recomendada

VAZQUEZ GARCIA, Mercè. Tendencias en procesamiento del lenguaje natural. COMeIN [en línea], octubre 2015, núm. 48. ISSN: 1696-3296. DOI: https://doi.org/10.7238/c.n48.1567

terminología; gestión de la información; gestión del conocimiento; periodismo;