¿Cómo puede el aprendizaje automático ayudar a los ordenadores a entendernos? - Centro De Innovación y Desarrollo Tecnológico CIDT

Desde que el código Enigma se descifró utilizando ordenadores, los seres humanos se han visto obligados a hablar con las máquinas de una manera que estos últimas pudieran entender. Se crearon varios lenguajes, desde el lenguaje ensamblador a Fortran, C, C++, Java, Perl y Ruby, por nombrar unos pocos. La mayor parte de dichos lenguajes contenían palabras clave en inglés, pero la sintaxis seguía siendo rígida y requería conocimientos de programación de alto nivel.

Imagen alusiva a ¿Cómo puede el aprendizaje automático ayudar a los ordenadores a entendernos?

Imagen: CC0 Creative Commons

¿Qué sucedería si pudiéramos hablar con cualquier ordenador o dispositivo inteligente utilizando el lenguaje natural y dichas máquinas nos comprendieran? Esta es la apuesta del NLP (procesamiento de lenguaje natural). En la actualidad, aún se trata de traducir el lenguaje a algo que una máquina pueda procesar, pero a medida que el sistema incorpore más IA y aprenda de la interacciones, se hará cada vez más independiente.

¿CÓMO FUNCIONA EL NLP?

Para hacerse una idea acerca de lo que el NLP hace en relación con un ordenador, es preciso pensar en cómo se aprende un nuevo idioma.En primer lugar, se aprende vocabulario y luego se aprende a crear frases de carácter simple. La sintaxis y los conectores resultan fundamentales para dotar de sentido a lo que se oye o se lee. A medida que se avanza, resulta posible comprender frases más complejas e incluso jergas o lenguajes especializados.

NLP – Nuevo código NLP creado conjuntamente por John Grinder y Carmen Bostic St. Clair, co-desarrollado por Michael Carroll. Imagen: NPL Academy

Esto es justamente lo que hace la lingüística informática mediante la combinación de la potencia de la IA, el aprendizaje automático y la lingüística. Divide los datos de entrada en palabras, buscando palabras claves específicas tales como “localización”, “tiempo”, “canales” o similares. Luego, realiza un escaneo de la sintaxis, centrándose en los verbos, los conectores y las negaciones.

El algoritmo primero se fija en el análisis léxico, clasificando los datos de entrada según la parte del discurso, luego pasa a un nivel más profundo y se fija en la sintaxis, para clasificar los datos en partes de la frase. Para algunas aplicaciones, se añaden otras capas, como es el caso del análisis del sentimiento para comprender el estado del emisor. El contexto resulta esencial para eliminar ambigüedades.

El NLP se basa en tablas que contienen sinonimos, antónimos, merónimos, etc. Esta es la manera en que la máquina puede entendernos como otro ser humano e incluso puede respondernos de una manera que no resulte “robótica”.

Imagen: CC0 Public Domain

Toma un conjunto de datos de formación como elementos de entrada a partir de los cuales aprende. Hay tres métodos de formación distintos:

Aprendizaje guiado basado en normas: bastante similar a la programación informática clásica (bucles si-entonces-en caso contrario/mientras).
Aprendizaje estadísitico: se construye basándose en la respuesta más probable.
Aprendizaje no supervisado: lo que resulta idóneo para sistemas que ya han sido entrenados y simplemente mejoran mediante interacción.

¿PARA QUÉ SIRVE EL NLP?

La empresas ya disponen de grandes cantidades de datos que pueden emplearse para mejorar la gestión si se dividen en categorías y se etiquetan correctamente. El NPL puede modificar todo esto creando un sistema que puede ser consultado de la misma manera en que se pediría a una secretaria que recuperara información desde un archivo almacenado en un disco duro. La diferencia es que para un chatbot esto supone unos segundos y, además, puede realizar tareas adicionales.

1. Datos “amigables”

Imagine la posibilidad de recibir ideas comerciales tan rápido y tan fácilmente como se pregunta a Siri cuál será el clima en su ciudad. O lo que ocurriría si, en lugar de pasar largas horas frente a una hoja de cálculo, fuera posible solicitar el dato del ROI de una serie de productos en los mercados asiáticos durante el último trimestre. Por otro lado, cabe ir un paso más allá y solicitar al sistema mediante voz o texto que efectúe una serie de predicciones para el año próximo. Esta es una manera de fusionar la comprensión del lenguaje con la IA para crear soluciones valiosas destinadas a resolver problemas comerciales reales.

2.Otorgar sentido a los datos no estructurados

Hasta el momento, los datos tenían que ordenarse en tablas o al menos debían incluir alguna etiquetas, como puede ser el caso de etiquetas XML, para que los algoritmos pudieran localizarlos y recuperarlos. Ahora, la IA y el aprendizaje automático hacen que resulte posible comprender diversas fuentes de entrada como comentarios, imágenes o incluso vídeos procedentes de redes sociales.

Imagen: CC0 Public Domain

El proceso puede profundizar aún más y llevar a cabo un análisis de sentimiento en relación con dichos datos. Esto resulta importante en lo que respecta a marcas que están intentando conocer el pulso instantáneo del mercado. Ahora, ya no resulta necesario esperar meses hasta conocer los datos de ventas ordenados en una tabla impoluta, sino que cabe explorar la web en busca de comentarios relacionados con una determinada marca y disponer de un barómetro “en directo” a través del análisis de texto.

3.Gestión de RRHH

Asimismo, el NLP presenta la posibilidad de mejorar las condiciones laborales y recibir comentarios reales del personal de manera diaria. Si bien resulta muy cercano a un sistema tipo “Gran hermano”, disponer de un algoritmo capaz de evaluar diariamente las interacciones en una empresa puede revelar nuevas ideas acerca de la satisfacción, los conflictos laborales o el acoso. Mediante el análisis de dichos datos, los procesos pueden ser mejorados detectando los puntos de frustración y procediendo a eliminarlos.

RETOS ACTUALES

En los próximos años, resulta poco probable que una máquina comprenda directamente a las personas. Los chatbots existentes estás muy lejos de ser perfectos y existen numerosos retos que deben resolverse antes de que una entidad autónoma pueda ser liberada y no resulte preciso someterla a supervisión.

Un primer problema a la hora de crear un buen algoritmo NLP radica en la sinonimia. Esto sucede cuando los datos de entrada no contienen la palabra clave esperada. Y, en su lugar, contienen sinónimos o palabras relacionadas. Esto supone un problema, ya que los algoritmos de análisis pueden pasar un “mal rato” intentando centrarse en lo esencial.

Otro problema puede ser el de la polisemia, lo que significa que la misma palabra puede significar cosas distintas en diversos contextos. Si no existen claves suficientes o el algoritmo no está debidamente ajustado para escoger entre las distintas posibilidades, los resultados pueden variar yendo de lo esperado a aquello que carece de sentido.

En tercer lugar, la metonimia y el sarcasmo pueden producir algunos de los problemas más significativos relacionados con el NLP. Mientras que un ser humano puede efectuar las asociaciones necesarias y comprender la referencia, una máquina, como sucede con un niño, tiende a tomar las cosas en sentido literal. Evaluar el impacto de la retórica y diferenciar entre las distintas figuras puede requerir un nuevo nivel de profundidad.

Se estima que las inversiones solo en NLP alcanzarán los 22.300 millones de dólares estadounidenses en 2025. Aparecerán muchísimasaplicaciones de IA y NLP en distintos dominios. El problema real es obtener los mejores datos de formación para el algoritmo a partir de procesos existentes. Otra dirección que precisa trabajo es la integración de los chatbots en el flujo diario de la organización sin encontrar resistencia.

Autora: Jasmin Morgan.

Fuente.