Procesamiento del lenguaje natural: qué tecnologías se están desarrollando

Procesamiento del Lenguaje Natural
Instituto Tecnológico de Galicia

En los últimos años se han producido grandes avances en tecnologías de la Inteligencia Artificial. Dentro del ámbito de la comunicación, las herramientas de Inteligencia Artificial están siendo cada vez más utilizadas tanto por empresas, por ejemplo, a la hora de interactuar con sus clientes, como por las personas en su día a día cotidiano, por ejemplo, a la hora de preguntarle a Siri el tiempo que va a hacer hoy en su ciudad.

El Instituto tecnológico de Galicia está a la vanguardia de las tecnologías de Inteligencia Artificial y de manera específica en el procesamiento de Lenguaje Natural (NLP). A través de la red CEL.IA, el ITG concentra sus esfuerzos en contribuir a superar las barreras y lagunas existentes en cada momento para que los usuarios finales (Empresa y Sociedad) incorporen la Inteligencia Artificial a su día a día, desarrollando, transfiriendo y aplicando soluciones basadas en las Tecnologías Cervera 21 (realidad virtual y aumentada, visión artificial y procesamiento de lenguaje natural) para dar respuesta a esas necesidades. En este blog, se proporcionará un análisis de las tecnologías que son la base del NLP.

Tecnología NLP: ¿Qué es?

Los avances que permiten una comunicación más fluida entre máquina y humano se enmarcan dentro del campo del Procesamiento del Lenguaje Natural (PLN) o su nombre en inglés Natural Language Processing (NLP). El NLP es una rama de conocimiento perteneciente a la inteligencia artificial cuya actividad es la de combinar diferentes áreas de conocimiento como la lingüística, los modelos estadísticos y la IA para procesar el lenguaje humano. El objetivo es que las máquinas puedan procesar el lenguaje humano tanto en texto como en voz y poder comprender el significado, la intención y el sentimiento del emisor superando las dificultades inherentes a la ambigüedad del lenguaje a nivel léxico, semántico o sintáctico.

Tecnologías que se engloban dentro del NLP

El NLP engloba otras tecnologías, complementarias entre sí, para el desarrollo de la comprensión del lenguaje natural por parte de las máquinas. A continuación, se detallan cada una de estas tecnologías:

Natural Language Understanding

NLU (Natural Language Understanding) es un subconjunto de NLP que se enfoca en entender el significado de una frase, convirtiendo las entradas no estructuradas en estructuradas para entender y ejecutar la acción requerida. Esto se debe a que el lenguaje cotidiano e informal no se enfoca en el vocabulario y la gramática. Es por ello que se debe conocer el peso de cada palabra dentro de la frase y analizar su dependencia en la oración.

Natural Language Generation

NLG (Natural Language Generation) es una tecnología que permite producir una salida de texto, como si hubiese sido generada por un humano, a partir de una entrada que puede ser de distinta tipología: imagen, información meteorológica o una conversación, entre otras.

El proceso de generación de lenguaje natural puede ser visto como el siguiente paso al NLU. En el caso del proceso de comprensión del lenguaje natural, lo que se busca es generar una representación de los términos de entrada que sea inequívoca y no pueda ser interpretada de varias formas, mientras que el proceso de NLG es prácticamente el caso inverso. Partiendo de una representación del texto o imágenes de entrada, debemos ser capaces de crear un texto de salida que tenga sentido, y que pudiera ser el generado por un humano.

Análisis de sentimientos

Las IA de emociones o minería de opiniones consisten en el uso de las tecnologías NLP para el análisis de textos, la lingüística computacional y la biometría para identificar, extraer, cuantificar y estudiar sistemáticamente los estados afectivos y la información subjetiva. Este tipo de análisis se suelen aplicar a reseñas de clientes sobre productos o servicios, respuestas a encuestas, o comentarios en redes sociales a cerca de un tema en concreto. Dentro de este tipo de análisis, existen diferentes categorías para satisfacer las necesidades de análisis de opiniones:

Análisis de sentimiento calificado cuyo objetivo es cuantificar la calificación de una reseña positiva o negativa para poder extender la polaridad de las categorías a diferentes niveles de positivo o negativo.

Análisis de detección de emociones cuyo objetivo es identificar emociones más allá de las comunes como felicidad, ira, frustración y tristeza. Muchos sistemas de detección de emociones utilizan léxicos o algoritmos complejos de aprendizaje automático.

Análisis de sentimiento basado en aspectos cuyo objetivo es conocer aspectos o características particulares que mencionan las personas de manera positiva, neutral o negativa.

Análisis de sentimiento multilingüe cuyo objetivo es detectar el idioma en los textos automáticamente a través de un modelo de análisis de sentimiento personalizado. El análisis de sentimiento multilingüe puede resultar complejo e implica una cantidad de recursos y preprocesamiento.

Detección de intenciones

La detección de intenciones es un componente crucial de muchos sistemas de NLU. Su objetivo es capturar la semántica detrás de los mensajes de los usuarios y asignarla a la etiqueta correcta. Es especialmente importante en el uso de chatbots, ya que sin la detección de intenciones no es posible crear flujos de diálogo inteligentes. Dentro de la detección de intenciones se pueden diferenciar dos metodologías de ejecución diferentes:

Métodos tradicionales de detección de intenciones mediante reconocimiento semántico basado en reglas y algoritmos de clasificación basado en estadísticas. Este método requiere extraer las características claves del corpus, siendo necesario una extracción manual de las características que lo hace muy costoso y no garantiza la precisión.

Métodos convencionales actuales de detección de intenciones mediante las redes neuronales y el aprendizaje en profundidad que suponen una evolución en el desarrollo en el que se puede aprender información semántica del orden de las palabras según el contexto.

Automatic Speech Recognition

En los últimos años la IA conversacional ha dado un salto desde el procesamiento text to text habitual referido a conversaciones con una IA en formato textual hasta conversaciones mediante habla. Estas conversaciones se descomponen en procesos speech to text – text to text – text to speech que indican que lo escuchado se convierte a texto, este texto se procesa obteniendo una respuesta al mismo y posteriormente la respuesta se transforma en sonido.

El Instituto Tecnológico de Galicia y el proyecto CEL.IA

El ITG, dentro de la red CEL.IA, está llevando a cabo avances importantes en la aplicación de las tecnologías del lenguaje:

  • Análisis e investigación de técnicas de Sentimental Analysis, Intent Recognition, Named Entity Recognition y Text/Topic Classification focalizándose en facilitar la comunicación entre el usuario y los asistentes virtuales inteligentes (AVI) y poder ofrecer las respuestas y las funcionalidades esperadas por el usuario.
  • Análisis y comparación de distintas técnicas de tratamiento y procesamiento de audio en español.
  • Análisis del estado de la técnica en cuanto al uso del paradigma Federated Learning para el entrenamiento de modelos de Speech Recognition e investigación de una arquitectura de entrenamiento.
  • Análisis del estado del arte e investigación de modelos de clasificación de emociones basado en audio.
  • Análisis e implementación de modelos NLG para mejorar la comunicación entre el usuario y los asistentes virtuales inteligentes (AVI) a través de:
    • La corrección de textos provenientes de la transcripción de audio.
    • La implementación de chatbots más inteligentes basados íntegramente en modelos de generación automática de lenguaje o integrando estos modelos con modelos de detección de intenciones.
  • Análisis de los modelos y las tecnologías XAI (Explainable Artificial Intelligence) y la aplicación del NLP para obtener la interpretación de los resultados de los modelos de AI en lenguaje humano y poder ofrecer al usuario dicha interpretación a través de AVIs, incrementando de esta forma la confianza del usuario en los sistemas de AI.

El sentido y propósito final de estas tecnologías aplicadas a CEL.IA es el de la creación de demostradores que posibiliten herramientas innovadoras y en el estado del arte de la realidad aumentada y virtual, tecnologías de la imagen y el lenguaje.

Esto se concreta en el caso de ITG en el sector Salud, donde se desarrollan herramientas remotas de diagnóstico y la automatización de los procesos y flujos de trabajo de gestión de pacientes y documentación.

El objetivo es la mejora sustancial del sistema sanitario, a través de vectores como alivio de la carga de trabajo a los profesionales médicos; bien automatizando el primer punto de contacto de la atención primaria como optimizando los procesos y flujos de trabajo de gestión de clientes y documentación; sin olvidar la mejora en el diagnóstico de determinadas dolencias.

Como conclusión principal se extrae que, pese a su madurez, el NLP es una disciplina viva y en pleno desarrollo, con multitud de retos que superar fruto de la ambigüedad subyacente al lenguaje natural. El NLP, los Chatbots y las Interfaces Conversacionales son tecnologías con una gran proyección de futuro, que se volverán indispensables en nuestra vida y cambiarán nuestra forma de percibir la tecnología.

¿Te ha gustado?

¡Compártelo en redes sociales!

Categorías

Calendario de noticias

septiembre 2023
LMXJVSD
 123
45678910
11121314151617
18192021222324
252627282930 

Eventos

Próximos eventos

Menú