Inteligencia artificial y lingüística: ¿por qué es tan complicado hacer machine learning con idiomas como el español?

Para las inteligencias artificiales de los asistentes es más complicado tratar con ciertos idiomas.

3220

Cada día la inteligencia artificial se desarrolla a pasos agigantados. Actualmente las máquinas son capaces de realizar más tareas, desde la concertación de una cita hasta detectar si los alimentos que hay en el refrigerador necesitan ser renovados. Los asistentes virtuales son grandes ejemplos de este tipo de implementaciones, los cuales han tenido un reto muy particular al trabajar con hablantes de lenguas como el español. ¿Por qué se de este tipo de situaciones? En las siguientes líneas revisaremos algunos datos interesantes al respecto.

En entrevista con Manuel Alejandro Sánchez, subdirector de socios de Club Premier, explicó que para las inteligencias artificiales como los asistentes virtuales, es muy sencillo trabajar con idiomas como el japonés, puesto que su sintaxis es relativamente sencilla (por ejemplo, el verbo siempre se coloca al final de la oración y el adjetivo antes de lo que califica). En español, el núcleo del predicado puede ocupar casi cualquier espacio en una frase, lo que complica el proceso de machine learning de la máquina.

Un aspecto que destacó y que consideró fundamental es la polisemia de las palabras. Si bien, el japonés es mucho más directo con los significados de las palabras, en el caso del español, hay vocablos que pueden tener una cantidad considerable de significados, lo que dificulta su interpretación por la inteligencia artificial y, por ende, el proceso de machine learning.

También hay que considerar que, tan sólo de hablantes nativos, el japonés sólo cuenta con 128 millones (buena parte en Japón), mientras que el español tiene 528 millones, los cuales están distribuidos en Latinoamérica, Europa, Norteamérica e partes de África (como Marruecos) y de Asia (como las Filipinas).

A un mayor número de hablantes existe una mayor cantidad de dialectos geográficos, a los cuales se tienen que añadir los socialectos; por lo que existen muchas variantes de la misma lengua.

El sarcasmo y la ironía también son variantes que dificultan al análisis y el procesamiento del español por parte de la inteligencia artificial, puesto que ya no sólo se tiene que analizar la semántica y la morfosintaxis del hablante, sino que también se tiene que hacer un análisis pragmático y incluso fonético-fonológico para detectar la curva tonal utilizada utilizada para cada intención.

SUSCRÍBETE A LA REVISTA IMPRESA A UN PRECIO ESPECIAL