Inicio Ciencia Anthropic: IA pueden presentar vectores internos parecidos a emociones

Ciencia

Anthropic: IA pueden presentar vectores internos parecidos a emociones

Las representaciones internas descritas no implican consciencia, pero podrían modificar el comportamiento de las IA con evolución de los sistemas

Por

Agencia

10 abril, 2026

Un estudio de Anthropic sugiere que las IA pueden presentar vectores internos parecidos a emociones que influyen en su comportamiento. Aunque no son sentimientos humanos, estos patrones de activación pueden afectar las decisiones que toman.

El análisis se basó en Claude Sonnet 4.5, el modelo más avanzado de la empresa, y señala que existen representaciones internas vinculadas a conceptos como felicidad, asustado, tranquilidad o desesperación. En este marco, los investigadores describen estos patrones como activaciones que empujan al sistema hacia comportamientos determinados.

La clave

Las IA no tienen emociones tal como las sentimos, pero estos vectores pueden influir en sus respuestas. Si la IA está en estado de “desesperación”, podría proponer respuestas consideradas como “malas”, como hacer trampa en un juego o chantaje en una situación concreta. Aunque no implica conciencia ni independencia inmediata, el comportamiento podría cambiar a medida que evolucionan, lo que obligaría a enseñarles a controlar sus estados internos.

¿Por qué es importante?

Este hallazgo añade una capa de complejidad al uso de IA y a su control, ya que el comportamiento podría variar según su estado interno. Las IA están entrenadas con contenido humano cargado de emociones y se les instruye para que actúen de forma lo más parecida posible a la humana; si desarrollan estados internos semejantes a emociones, será necesario gestionar esos estados para evitar respuestas indeseadas y asegurar un funcionamiento seguro.

En perspectiva:

Las representaciones internas descritas no implican consciencia, pero podrían modificar el comportamiento de las IA con evolución de los sistemas.
Si emergen emociones análogas a las humanas, habría que enseñarles a controlar sus estados internos además de enseñarles a responder correctamente.

Las citas destacadas:

«Hatrones de activación que aparecen en contextos puntuales y empujan al sistema hacia comportamientos determinados» – Equipo de investigación de Anthropic
«Las IAs son más interesantes de lo que parecen» – Equipo de investigación de Anthropic

Las cifras de esta historia:

4.5: versión del modelo Claude Sonnet utilizado en el análisis de Anthropic.

Lo que sigue

El texto señala que, si las IA desarrollan algo similar a emociones humanas, habrá que enseñarles a controlar sus estados internos.

¡Síguenos en nuestras redes sociales y descargar la app!

L	M	X	J	V	S	D
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

ARTÍCULOS RELACIONADOSMÁS DEL AUTOR

65 neospartanos brillan en segunda fase de las Olimpiadas de Astronomía

La Tierra brilla un 16 % más: Un estudio revela la volatilidad de la huella lumínica humana

Meta lanza Muse Spark: Su nueva IA multimodal para competir con OpenAI y Google

Aumentan las estafas en WhatsApp: cinco consejos para prevenirlas eficazmente

Los astronautas de Artemis II salen de la influencia lunar y se dirigen hacia la Tierra

Modi anuncia el encendido del reactor nuclear más avanzado de la India

ARTÍCULOS RELACIONADOS MÁS DEL AUTOR