Meta presentó a ‘CM3leon’, el primer modelo multimodal de IA generativa capaz de crear imágenes a partir de texto y viceversa.
La compañía liderada por Mark Zuckerberg continúa investigando en modelos generativos de IA, introduciendo avances en el procesamiento del lenguaje natural.
En este caso, para permitir que las páginas entiendan y expresen lenguaje, así como sistemas que pueden generar imágenes basadas en texto.
Además, aunque es un modelo con una cantidad de recursos cinco veces menor que los modelos anteriores, CM3leon es capaz de ofrecer un rendimiento «de última generación» para crear imágenes.
De hecho, Meta ha subrayado que CM3leon tiene la «versatilidad y efectividad de los modelos autorregresivos». Como consecuencia, es un modelo que mantiene bajos costos de entrenamiento y es eficiente.
Igualmente, la empresa matriz de Instagram ha destacado que CM3leon se desempeña bien en una «amplia variedad de tareas de visión y lenguaje», incluida la respuesta visual a preguntas y subtítulos de formato largo.
Capacidades de CM3leon
Puede proceder a la generación y edición de imágenes guiadas por texto, además podrá crear una imagen a partir de un texto con descripciones.
Otra de sus habilidades es que el usuario puede redactar una descripción que incluya la localización exacta de dónde se han de situar los objetos que se hayan incluido en la descripción, dentro de un espacio delimitado.
Igualmente, CM3leon de la empresa Meta es capaz de ofrecer resultados de «súper resolución», esta opción agrega una etapa entrenada por separado para introducir imágenes de mayor resolución a los resultados del modelo original.
¡Síguenos en nuestras redes sociales y descargar la app!