Inicio > Lingüística computacional, ¿está el procesamiento del lenguaje natural muy avanzado o sigue poco maduro?

Lingüística computacional, ¿está el procesamiento del lenguaje natural muy avanzado o sigue poco maduro?

Recurso artículo | Innovación Digital | 4 minutos de lectura


Marta Guerrero Nieto
Coordinadora

Linguistica computacional

No sé qué pensáis vosotros, pero cuando yo explico en clase las diferentes capas de análisis y las principales tareas de PLN, hay algunos estudiantes que se sorprenden de que esto esté tan desarrollado, mientras que otros lo dan por sentado.

Esto podría deberse a varias razones: la primera de ellas es que no todas las tareas típicas de Procesamiento del Lenguaje Natural están uniformemente desarrolladas. Por ejemplo, no tiene el mismo desarrollo un sistema de recuperación de información que un sistema de lingüística computacional de reconocimiento de voz o el análisis del sentimiento en redes sociales.

Estos tres son ejemplos de éxito en PLN, en el sentido de que tienen un alto grado de desarrollo, ya que en la actualidad muchas grandes compañías tienen su propio reconocedor de voz en múltiples lenguas (pensemos en las aplicaciones móviles). Con la recuperación de información podemos decir que los buscadores de indexación y recuperación son de uso cotidiano, la mayoría de ellos tienen algún tipo de tecnología lingüística dentro, ya que son capaces de mostrar resultados en varios idiomas, aunque se realicen las búsquedas solo en uno. En cuanto al análisis del sentimiento, casi cualquier herramienta afirma que hace este tipo de análisis, otra cosa es que señalen la tecnología de la que disponen para realizar esto o qué tecnología utilizan (basada o no en inteligencia artificial), algo clave para controlar las expectativas en cuanto al acierto del análisis.

El caso de análisis del sentimiento podría también considerarse poco avanzado, dependiendo de la perspectiva con la que se mire, ya que, por un lado, como ya hemos dicho, son muchas las herramientas que tienen este tipo de análisis. Sin embargo, a su vez son muchos los que desconfían, porque señalan que su acierto es bajo y, por lo tanto, pueden llegar a pensar que la tecnología no está madura.

Esta creencia de que está poco avanzado se hace todavía más notoria para el desarrollo de aplicaciones en distintas lenguas, por ejemplo, si es una aplicación en inglés, español u otras lenguas. Las tecnologías de computación lingüística tienen un desarrollo mucho mayor en inglés que en español, en gran medida porque no existen recursos lingüísticos en las diferentes lenguas ni con la misma calidad ni para todos los objetivos que se pretendan conseguir de forma libre o gratuita. Por ejemplo, si lo que se quiere es analizar el sentimiento de unos tweets en español en el sector bancario, seguramente no es recomendable utilizar un recurso lingüístico que haya sido basado en un corpus de prensa online. O si la herramienta está desarrollada con recursos lingüísticos en inglés, está claro que en español no funcionará. Esta recomendación se debe a que, aunque es útil tener recursos lingüísticos ya desarrollados, no todos van a proporcionar unos resultados fiables con los que trabajar.

A día de hoy, estas serían las claves para abordar un proyecto al que se le quiera incluir alguna tecnología lingüística:

  • Tener claro qué tecnología es recomendable usar para abordar el problema (Pipeline de PLN, Machine Learning, otras ramas de la inteligencia artificial, etc.).
  • Disponer de los recursos lingüísticos necesarios y poder adaptarlos o, tener la capacidad de crear recursos propios en todas las lenguas que se vayan a trabajar.
  • Haber desarrollado cierta pericia en ámbitos como PLN, Lingüística Computacional, Text Mining o Machine Learning.

En ICEMD, el Instituto de la Economía Digital de ESIC, ofrecemos formación especializada a profesionales inmersos en procesos de transformación digital. Puedes encontrar más información sobre el Programa Superior en Big Data en la web de ICEMD.





Descargar e-Book





Recursos relacionados

12 Sep 2017
Internet de las cosas: ejemplos en la interacción con humanos

El Internet de las cosas terminará estableciendo nuevas formas en las que humanos y máquinas interactúan. En la medida que la tecnología siga evolucionando, serán comunes ejemplos de relaciones cada vez más complejas entre humanos y máquinas.

11 Aug 2017
¿Aplicas la multicanalidad o tu estrategia digital es un apéndice?

No hagas en digital lo que no harías en el mundo offline y viceversa: un Plan de Marketing Digital debe ser parte del Plan de Marketing de la Compañía. La multicanalidad nos abre nuevos horizontes: debemos integrarlos y trabajar de forma coordinada.

03 Jul 2017
Modelo entidad relación: descripción y aplicaciones

El modelo entidad relación es una herramienta muy extendida para representar cómo se organiza la información en una base de datos. En este artículo se describen sus componentes principales y algunas de sus aplicaciones más habituales.

01 Feb 2017
Normativa comercio electrónico: la importancia de conocer las reglas del juego

Cookies, privacidad, protección de datos, reclamaciones, condiciones del servicio, devoluciones… Bienvenidos al laberinto de la normativa del comercio electrónico en España. Desgrano aquí los conceptos claves para el experto en marketing.