La capacidad de las personas para aprender un concepto nuevo y aplicarlo a otros usos conocidos es una de las características más singulares de la inteligencia humana, conocido como generalización del conocimiento.
En los años 80s un grupos de científicos y filósofos cognitivos teorizaron que el aprendizaje automatizado de las IAs y sus redes neuronales artificiales no podrían simular esas conexiones, por lo que no podría imitar esta singularidad. Sin embargo, en las últimas décadas los científicos han hecho investigaciones para desafiar esos límites e incorporar a las tecnologías la capacidad de realizar “generalizaciones composicionales”.
Esta semana, investigadores de la Universidad de Nueva York y la Universidad Pompeu Fabra de Barcelona describen en un artículo de la revista Nature una técnica que llama Metaaprendizaje para Composicionalidad (Meta learning for Compositionality, o MLC por sus siglas en ingles). El método se centra en el entrenamiento de redes neuronales artificiales, los sistemas detrás de muchas de las tecnologías actuales, por ejemplo las relacionadas con el reconocimiento del habla y el procesamiento del lenguaje natural.
Las redes neuronales se entrenan para mejorar la generalización composicional a través de la práctica y la actualización continua para relacionar las experiencias de la misma forma que las personas. Posteriormente, realizaron experimentos con voluntarios a los que se les sometió a las mismas pruebas que a las máquinas, sin embargo, en lugar de tener que aprender el significado de palabras reales -términos que los humanos ya podrían conocer- los participantes y la IA con MLC tuvieron que aprender el significado de términos creados por los investigadores y aplicarlos como ellos los habían diseñado.. Los resultados muestran que la máquina fue capaz de generalizar tan bien o mejor que las personas, incluso superando a ChatGPT 3 o ChatGPT 4.
Algunos de los diseñadores de los sistemas de IA han teorizado que la capacidad para teorizar y relacionar podría surgir espontáneamente con métodos de entrenamiento estándar, mientras que otros han intentado desarrollar sistemas específicos para esta tarea.
Inteligencia equiparable a la humana
“Durante 35 años, los investigadores de la ciencia cognitiva, la inteligencia artificial, la lingüística y la filosofía han debatido si las redes neuronales pueden lograr una generalización sistemática similar a la humana. Hemos probado por primera vez que sí”, afirma Brenden Lake, profesor adjunto del Centro de Ciencia de Datos y del Departamento de Psicología de la NYU y uno de los autores del trabajo.
Las inteligencias basadas en lenguaje como ChatGPT requieren de un entrenamiento con alimentación de datos de los cuales pueda extraer patrones para dar respuestas coherentes, pero ese entrenamiento es lento y muy costoso a nivel energético, lo que significas muchos centros de datos trabajando continuamente durante semanas o meses.
“Nosotros proponemos una solución parcial a este problema que se basa en una idea de las ciencias cognitivas”, explica Marco Baroni, investigador del ICREA y profesor del departamento de Traducción y Lenguas Sociales de la Universitat Pompeu Fabra de Barcelona y coautor del estudio. “Los humanos podemos aprender muy rápidamente porque tenemos la facultad de la generalización composicional. Es decir, que si yo nunca he oído la frase ‘saltar dos veces’, pero sí sé qué es ‘saltar’ y qué es ‘dos veces’, lo puedo entender. Eso no es capaz de hacerlo ChatGPT”.
Otra de las intenciones de los autores del estudio es darle la oportunidad de un mejor sistema de aprendizaje automático a esas IAs más pequeños para que estos tengas sistemas tana avanzados como los de las empresas más grandes, como Microsoft, Google o Amazon.
Teodore Calonge, profesor Titular del departamento de Informática en la Universidad de Valladolid, quien ha revisado el código usado en los experimentos, señala que se trata de un primer trabajo y aún es pronto para augurar el recorrido que puede tener este nuevo método para relacionar conceptos. «No sabría decir si es una línea de investigación que vaya a ofrecer grandes avances a corto o medio plazo» comento para SMC España.
Veronika Parra (Pasante UBA)
¡Síguenos en nuestras redes sociales y descargar la app!