OpenAI presentó durante un directo un innovador modelo de inteligencia artificial (IA) denominado ‘GPT-4o’, destacándose como el más «inteligente y rápido» desarrollado hasta la fecha por la empresa liderada por Sam Altman.
‘GPT-4o’ es inherentemente multimodal, emprendiendo eficazmente la interacción en tiempo real. Este nuevo modelo será accesible para todos los usuarios de ChatGPT, incluyendo a aquellos que usan el sistema gratuito.
En medio de una transmisión en vivo, la CTO de OpenAI, Muri Murati, declaró que el novedoso modelo de IA tiene una «inteligencia al nivel de GPT-4», no obstante, es superior en sus habilidades de audio, visión y texto.
Modo de voz natural
Tal desarrollo tecnológico dio lugar a la creación de una nueva modalidad de voz.
La voz de ChatGPT brindaba respuestas con un periodo de retraso de 2,8 segundos en su versión GPT-3.5 y de 5,4 segundos en la versión GPT-4.
El novedoso modo de voz reduce considerablemente el tiempo de respuesta, siendo de 320 milisegundos y, con la inteligencia de ‘GPT-4o’, crea una interacción bastante natural.
Sus cualidades comunicativas ofrecen la posibilidad de entablar una conversación con un lenguaje totalmente natural, como si se tratara de otra persona.
Un ejemplo de ello es que se podría interrumpir a la IA mientras se encuentra dando una respuestas, acción que nunca había presentado otro modelo.
Durante la presentación en directo, la IA, además de contestar instantáneamente, logra expresarse con diversos tonos de voz, se ríe, canta, muestra distintos estados de ánimo, soluciona problemas matemáticos y realiza traducciones rápidas.
De hecho, la IA será capaz de traducir en tiempo real cualquier conversación que el usuario tenga con una persona que habla en un idioma extranjero.
Asimismo, implementa una capacidad de visión avanzada, donde se le puede presentar una foto o captura de pantalla para que pueda examinarlo y así ofrecer detalles sobre el contenido.
Acceso a ‘GPT-4o’
La empresa especializada en IA lanzó una versión “iterativa” a los usuarios de ChatGPT Plus y Team, que son de pago, además de los que poseen la versión gratuita. Por ahora, solo presenta novedades basadas en el texto e imagen.
Resaltan que los usuarios de pago tendrán ventajas como un límite más extenso para usar el novedoso modelo. De igual manera, en las próximas semanas ya contarán con la función de modo de voz en tiempo real
¡Síguenos en nuestras redes sociales y descargar la app!