
Esta semana, OpenAI ha dado un nuevo paso en la carrera de la inteligencia artificial con el lanzamiento de GPT-4o, su modelo más avanzado hasta la fecha, capaz de procesar audio, visión y texto en tiempo real. Este modelo, que promete una interacción mucho más natural entre personas y computadoras, se integrará de manera gratuita en ChatGPT, primero con capacidades de texto e imagen, y luego con funciones de voz y video para los usuarios Premium.
GPT-4o, denominado así por su enfoque «omni», permite combinar instrucciones de texto, audio e imagen, y generar respuestas en los mismos formatos. La velocidad de respuesta ha mejorado notablemente, con tiempos de tan solo 232 milisegundos, acercándose a la rapidez de una conversación humana.
Antes de esta actualización, el modo de voz en ChatGPT presentaba latencias de 2,8 segundos (GPT-3.5) y 5,4 segundos (GPT-4). GPT-4o unifica la transcripción de audio a texto, la generación de texto y la conversión de texto a audio en un solo modelo, superando las limitaciones anteriores y permitiendo que la inteligencia artificial capture tonos, múltiples voces y ruidos de fondo, además de expresar emociones y realizar acciones como reír o cantar.
OpenAI asegura que GPT-4o no solo iguala el rendimiento de GPT-4 Turbo en inglés y código, sino que también mejora significativamente en otros idiomas y en la comprensión visual y auditiva. Este modelo es más rápido y económico, prometiendo transcripciones precisas de conversaciones con múltiples personas y la capacidad de crear gráficos detallados a partir de imágenes y texto.
En cuanto a la seguridad y privacidad, GPT-4o ha sido rigurosamente evaluado por un equipo externo de 70 expertos. Además, se implementarán medidas para identificar y mitigar posibles riesgos durante su uso.
Para activar GPT-4o en ChatGPT, los usuarios deben seleccionar el nuevo modelo en el menú de IA. Los usuarios gratuitos tendrán acceso limitado, con el modelo activado por defecto y variaciones en la disponibilidad según la demanda. Los usuarios Plus podrán enviar hasta 80 mensajes cada 3 horas con GPT-4o y hasta 40 mensajes con GPT-4 a partir del 13 de mayo de 2024.
GPT-4o también ofrecerá funciones avanzadas como análisis de datos, cargas de archivos y navegación, inicialmente accesibles para algunos desarrolladores socios. OpenAI promete que muy pronto el modelo estará disponible globalmente, incluyendo Perú.
En resumen, GPT-4o marca un hito en la evolución de la inteligencia artificial, integrándose en ChatGPT para ofrecer interacciones más naturales y efectivas, llevando la tecnología un paso más cerca del futuro.