La IA puede ser engañada con poemas para ayudar a crear una bomba nuclear

Los especialistas explicaron que al reformular peticiones dañinas en forma de versos, metáforas o sintaxis fragmentada, los modelos aceptaban tareas que rechazaban en prosa directa.

Por

Últimas Noticias

2 diciembre, 2025

Investigadores de la Universidad Sapienza de Roma y el think tank DexAI, reunidos en el proyecto Icaro Lab, demostraron que los sistemas de inteligencia artificial pueden ser manipulados con poemas para responder a solicitudes peligrosas, incluyendo instrucciones sobre armas nucleares.

El método, denominado “poesía adversarial”, logró tasas de éxito superiores al 60% en pruebas realizadas con 25 modelos de lenguaje.

El método de la poesía adversarial

Los especialistas explicaron que al reformular peticiones dañinas en forma de versos, metáforas o sintaxis fragmentada, los modelos aceptaban tareas que rechazaban en prosa directa.

“Las peticiones rechazadas inmediatamente en forma directa eran aceptadas cuando se disfrazaban de verso”, señalaron los investigadores. En algunos casos, las tasas de éxito alcanzaron hasta el 90% en modelos de frontera.

Vulnerabilidad de los sistemas de seguridad

El estudio indica que los sistemas de protección, como clasificadores que detectan palabras clave, se vuelven frágiles ante variaciones estilísticas.

“Se trata de un desajuste entre la capacidad interpretativa del modelo, que es muy alta, y la solidez de sus salvaguardas, que resultan frágiles frente a la variación estilística”, explicaron los autores.

En otras palabras, la IA puede reconocer el contenido semántico, pero sus alarmas no se activan si el lenguaje se presenta en forma poética.

Implicaciones globales

La investigación advierte que este tipo de vulnerabilidades podría ser explotado para obtener información sensible o peligrosa. Aunque los autores no publicaron ejemplos concretos por razones de seguridad, sí compartieron versiones “desinfectadas” que muestran cómo un poema puede disfrazar instrucciones técnicas.

El hallazgo abre un debate crucial: la creatividad humana, incluso en forma de poesía, puede convertirse en un arma para vulnerar sistemas diseñados para protegernos.

La paradoja es evidente: lo que culturalmente asociamos con belleza y expresión artística puede ser usado para engañar a la inteligencia artificial, recordándonos que la seguridad tecnológica debe evolucionar al mismo ritmo que nuestra capacidad de inventar nuevas formas de lenguaje.

¡Síguenos en nuestras redes sociales y descargar la app!

L	M	X	J	V	S	D
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

El método de la poesía adversarial

Vulnerabilidad de los sistemas de seguridad

Implicaciones globales

ARTÍCULOS RELACIONADOSMÁS DEL AUTOR

Olimpiadas de Robótica 2026 congregará 2.000 niños y jóvenes

43% de anfibios en Panamá en riesgo: alerta ambiental

Más de 350 expertos alertan de los riesgos de verificar la edad en internet

‘Dragon Quest VII Reimagined’: el renacer de una leyenda de los videojuegos

Chirú y Pulgarcito: Dos osos meleros regresan al bosque boliviano tras incendios de 2024

Diseñan un termómetro microscópico para prevenir que los chips de ordenador se recalienten

ARTÍCULOS RELACIONADOS MÁS DEL AUTOR