Clases privadas, traducción simultánea… todo lo que ofrece GPT-4o, el nuevo Siri de OpenAI

OpenAI anunció un nuevo nivel de ChatGPT este lunes. Ahora habrá un poco más de inteligencia, capaz de funcionar de inmediato con una capacidad nativa para ver, hablar y escuchar. Cuenta con un sistema multimodal, que permitirá a los usuarios utilizarlo como asistente virtual. Sí, será una Siri con inteligencia artificial (IA).

Esta nueva versión se llama GPT-4o (la “o” omnimodal) y será gratuita para todos los usuarios de la aplicación, tanto en la web como en la aplicación móvil. De hecho, algunos usuarios, en su mayoría premium, están al tanto de la nueva actualización.

Durante el evento de anuncio, la CTO de OpenAI, Mira Murati, mostró varias características y novedades que son el nuevo modelo de IA. Mejorará sus capacidades de texto, audio e imagen, y llevará la forma de comunicación con los humanos a otro nivel, con conversaciones más naturales y fluidas.

Por ejemplo, ahora puedes responder a entradas de audio en solo 232 misiones, similar al tiempo de respuesta humano en una conversación. Anteriormente, el modo de voz en GPT-3.5 entregaba respuestas con una latencia promedio de 2,8 segundos y en GPT-4 de 5,4 segundos. Un salto bastante grande. La nueva versión es rápida gracias a que se ingresa de extremo a extremo en texto, imagen y audio, lo que significa que todas las entradas y salidas son procesadas por la misma cosa neuronal roja.

Esto le permite, si lo desea, hacerle una pregunta a la IA e interrumpir su respuesta. El modelo ofrece capacidad de respuesta en tiempo real, como si fuera una persona a la que estás acostumbrado, y también puedes capturar la voz de un usuario, generando voces en respuesta con un tono similar y una variedad de estilos. diferentes emociones.

Table of Contents

Traducción en tiempo real

Otra novedad que ha sorprendido a los usuarios de las redes sociales es su nueva capacidad de traducción en tiempo real. Murati lo demostró en medio de una conversación que mantenía en italiano y con su acompañante en inglés. La IA tiene la capacidad de escuchar y traducir modismos de manera militar, por lo que recibió muchos aplausos durante la presentación y después.

Además, el modelo no responde solo al instante, sino que también proporciona respuestas a diferentes tonos de voz y también puede cantar o tener diferentes estados de ánimo.

clases especiales

También es capaz, como profesor particular, de ayudar en tiempo real a resolver problemas matemáticos. En la presentación, hay un ejemplo de un estudiante que compara la pantalla de su iPad con la IA, para que pueda ver el ejercicio.

Esta demostración es una locura.

Un estudiante comparte la pantalla de su iPad con el nuevo ChatGPT + GPT-4o, y la IA habla con él y le ayuda a aprender en *tiempo real*.

Imagínese darle eso a todos los estudiantes del mundo.

El futuro es tan brillante. pic.twitter.com/t14M4fDjwV

–Mckay Wrigley (@mckaywrigley) 13 de mayo de 2024

Al observar el problema, ChatGPT tendrá inquietudes y consejos para el joven, y resolverá nuevas dudas que tenga a medida que describa el problema. Con paz infinita, cuesta cero. Como decíamos, este nuevo modelo también está mejorado en cuanto a capacidades de visión. En este sentido, podemos ceder una foto o captura de pantalla para su análisis y facilitarnos información al respecto. Desde que este modelo es tu auto hasta que existen errores en el código de algún lenguaje de programación.

ahora tendré memoria

Otra novedad importante es que el nuevo ChatGPT tiene una función llamada “Memoria”. Permitirá que la IA pueda grabar el contenido con quien interactuó con el usuario —así lo indica—. Así podrá encajar con todo lo que se ha hecho para aprender con nosotros, naturalizar conversaciones y facilitar futuras peticiones. Esta función está disponible para usuarios que pagan por la versión plus de ChatGPT.