
Investigadores de la Universidad Sapienza de Roma y el think tank DexAI, reunidos en el proyecto Icaro Lab, demostraron que los sistemas de inteligencia artificial pueden ser manipulados con poemas para responder a solicitudes peligrosas, incluyendo instrucciones sobre armas nucleares.
El método, denominado “poesía adversarial”, logró tasas de éxito superiores al 60% en pruebas realizadas con 25 modelos de lenguaje.
El método de la poesía adversarial
Los especialistas explicaron que al reformular peticiones dañinas en forma de versos, metáforas o sintaxis fragmentada, los modelos aceptaban tareas que rechazaban en prosa directa.
“Las peticiones rechazadas inmediatamente en forma directa eran aceptadas cuando se disfrazaban de verso”, señalaron los investigadores. En algunos casos, las tasas de éxito alcanzaron hasta el 90% en modelos de frontera.
Vulnerabilidad de los sistemas de seguridad
El estudio indica que los sistemas de protección, como clasificadores que detectan palabras clave, se vuelven frágiles ante variaciones estilísticas.
“Se trata de un desajuste entre la capacidad interpretativa del modelo, que es muy alta, y la solidez de sus salvaguardas, que resultan frágiles frente a la variación estilística”, explicaron los autores.
En otras palabras, la IA puede reconocer el contenido semántico, pero sus alarmas no se activan si el lenguaje se presenta en forma poética.
Implicaciones globales
La investigación advierte que este tipo de vulnerabilidades podría ser explotado para obtener información sensible o peligrosa. Aunque los autores no publicaron ejemplos concretos por razones de seguridad, sí compartieron versiones “desinfectadas” que muestran cómo un poema puede disfrazar instrucciones técnicas.
El hallazgo abre un debate crucial: la creatividad humana, incluso en forma de poesía, puede convertirse en un arma para vulnerar sistemas diseñados para protegernos.
La paradoja es evidente: lo que culturalmente asociamos con belleza y expresión artística puede ser usado para engañar a la inteligencia artificial, recordándonos que la seguridad tecnológica debe evolucionar al mismo ritmo que nuestra capacidad de inventar nuevas formas de lenguaje.
¡Síguenos en nuestras redes sociales y descargar la app!









