Linguistica computacional

Hablemos de lingüística computacional, ¿es el Procesamiento del Lenguaje Natural (PLN) algo presente en el día a día de todos y, por lo tanto, está ya en un grado de desarrollo avanzado? ¿O, por el contrario, aún le falta mucho para poder alcanzar dicho estado?

No sé qué pensáis vosotros, pero cuando yo explico en clase las diferentes capas de análisis y las principales tareas de PLN, hay algunos estudiantes que se sorprenden de que esto esté tan desarrollado, mientras que otros lo dan por sentado.





Descarga gratis la guía: Retos oportunidades y consejos de la Economía Digital




Esto podría deberse a varias razones: la primera de ellas es que no todas las tareas típicas de Procesamiento del Lenguaje Natural están uniformemente desarrolladas. Por ejemplo, no tiene el mismo desarrollo un sistema de recuperación de información que un sistema de lingüística computacional de reconocimiento de voz o el análisis del sentimiento en redes sociales.

Estos tres son ejemplos de éxito en PLN, en el sentido de que tienen un alto grado de desarrollo, ya que en la actualidad muchas grandes compañías tienen su propio reconocedor de voz en múltiples lenguas (pensemos en las aplicaciones móviles). Con la recuperación de información podemos decir que los buscadores de indexación y recuperación son de uso cotidiano, la mayoría de ellos tienen algún tipo de tecnología lingüística dentro, ya que son capaces de mostrar resultados en varios idiomas, aunque se realicen las búsquedas solo en uno. En cuanto al análisis del sentimiento, casi cualquier herramienta afirma que hace este tipo de análisis, otra cosa es que señalen la tecnología de la que disponen para realizar esto o qué tecnología utilizan, algo clave para controlar las expectativas en cuanto al acierto del análisis.

El caso de análisis del sentimiento podría también considerarse poco avanzado, dependiendo de la perspectiva con la que se mire, ya que, por un lado, como ya hemos dicho, son muchas las herramientas que tienen este tipo de análisis. Sin embargo, a su vez son muchos los que desconfían, porque señalan que su acierto es bajo y, por lo tanto, pueden llegar a pensar que la tecnología no está madura.

Esta creencia de que está poco avanzado se hace todavía más notoria para el desarrollo de aplicaciones en distintas lenguas, por ejemplo, si es una aplicación en inglés, español u otras lenguas. Las tecnologías de computación lingüística tienen un desarrollo mucho mayor en inglés que en español, en gran medida porque no existen recursos lingüísticos en las diferentes lenguas ni con la misma calidad ni para todos los objetivos que se pretendan conseguir de forma libre o gratuita. Por ejemplo, si lo que se quiere es analizar el sentimiento de unos tweets en español en el sector bancario, seguramente no es recomendable utilizar un recurso lingüístico que haya sido basado en un corpus de prensa online. O si la herramienta está desarrollada con recursos lingüísticos en inglés, está claro que en español no funcionará. Esta recomendación se debe a que, aunque es útil tener recursos lingüísticos ya desarrollados, no todos van a proporcionar unos resultados fiables con los que trabajar.

A día de hoy, estas serían las claves para abordar un proyecto al que se le quiera incluir alguna tecnología lingüística:

En ICEMD, el Instituto de la Economía Digital de ESIC, ofrecemos formación especializada a profesionales inmersos en procesos de transformación digital. Puedes encontrar más información sobre el Programa Superior en Big Data en la web de ICEMD.





Descargar e-Book




Comentarios

Deja tu comentario: