OpenAI, la compañía estadounidense de inteligencia artificial (IA) ha presentado ChatGPT-4o, la nueva versión gratuita, más rápida y con capacidades mejoradas de su popular chatbot.
Las nuevas capacidades de audio permiten a los usuarios hablar con ChatGPT y obtener respuestas en tiempo real sin demora, así como interrumpir al chatbot mientras habla, dos características distintivas de las conversaciones realistas que los asistentes de voz de IA han encontrado desafiantes, mostraron los investigadores de OpenAI en un evento via streaming en redes sociales.
La jefa tecnológica Mira Murati, en una sesión abierta y retransmitida por internet, dijo que esta versión de la herramienta "mejora sus capacidades en texto, visión y audio", y que supone un "gran paso adelante" en su facilidad de uso.
El máximo ejecutivo de OpenAI, Sam Altman, destacó en la red social X que GPT-4o, el modelo en que se basa, es el mejor hasta la fecha, "multimodal", y que estará disponible para todos los usuarios, incluidos los del plan gratuito.
La nueva versión estará disponible para todos los usuarios, incluidos los del plan gratuito
"Hasta ahora, los modelos de clase GPT-4 solo estaban disponibles para gente que paga una suscripción mensual. Esto es importante para nuestra misión, queremos poner grandes herramientras de AI en las manos de todos", agregó.
La presentación en directo incluyó varias demostraciones de las capacidades del chatbo', que usaba una voz femenina y recordaba en cierto modo a la película Her, de Spike Jonze, sobre un humano que se enamora de una IA.
Pruébelo usted mismo
Pruébelo usted mismo
"Queremos eliminar el misticismo de la tecnología y llevársela para que puedan probarla ustedes mismos. En las próximas semanas, implementaremos estas capacidades para todos", dijo Murati, que adelantó que pronto habrá también novedades sobre "la siguiente frontera" en la IA.
La nueva versión de ChatGPT fue capaz de "percibir la emoción" de un usuario nervioso, le recomendó hacer respiraciones, bromeó con que parecía "una aspiradora", y mostró un rango de estilos y tonos en su voz leyendo un cuento para niños.
Entre otras cosas, el chatbot ahora puede ser interrumpido y responder inmediatamente sin tardar segundos, resolver problemas matemáticos a través de vídeo, o hacer interpretación y traducción simultánea de idiomas de viva voz.
En una de las demostraciones, ChatGPT utilizó sus capacidades de visión y voz para guiar a un investigador en la resolución de una ecuación matemática en una hoja de papel
En la retransmisión en directo, los investigadores de OpenAI mostraron las nuevas funciones de asistente de voz de ChatGPT. En una de las demostraciones, ChatGPT utilizó sus capacidades de visión y voz para guiar a un investigador en la resolución de una ecuación matemática en una hoja de papel.
Murati también señaló que el nuevo modelo GPT-4o ofrece una nueva interfaz de usuario y una nueva aplicación de escritorio de ChatGPT para que todos "puedan usarlo allá donde estén" y se "integre fácilmente en la rutina de trabajo".
Disponible para desarrolladores
Asimismo, estará disponible para desarrolladores a través de la interfaz de programación de aplicaciones (API) de OpenAI con el objetivo de que estos puedan construir apps usándolo, según dijo.
En el evento de OpenAI, programado un día antes de la conferencia de desarrolladores de Google, colaboró la tecnológica NVIDIA, otra líder en IA, pues Murati agradeció a esa empresa y a su ejecutivo, Jensen Huang, haber brindado "los procesadores más avanzados".
Se espera que mañana Google, rival de OpenAI, haga anuncios sobre su herramienta de IA que compite con ChatGPT, llamada Gemini.
Comentarios