Gemini mejora su inteligencia en matemáticas y otras novedades presentadas en Google I/O

Google presentó durante su conferencia anual para desarrolladores Google I/O las últimas mejoras de Gemini 2.5, su modelo de inteligencia artificial más avanzado hasta la fecha, que supera a competidores como OpenAI en matemáticas y programación.

La nueva versión introduce el modo de razonamiento mejorado llamado Deep Think, que emplea técnicas innovadoras para evaluar múltiples hipótesis antes de ofrecer una respuesta. Gemini 2.5 Pro Deep Think logró un desempeño sobresaliente en el exigente benchmark matemático USAMO 2025, lideró en programación competitiva en LiveCodeBench y obtuvo un 84.0% en la evaluación multimodal MMMU. En todos estos indicadores, supera ampliamente a los modelos recientes de OpenAI, como GPT4o-mini.

Entre sus nuevas capacidades destaca LIVE API, que habilita el diálogo afectivo: el modelo detecta emociones en la voz del usuario y responde acorde a ellas. También cuenta con funciones de Audio proactivo, que permiten ignorar ruidos de fondo y responder solo cuando es necesario, y un modo avanzado de pensamiento para tareas complejas a través de la API en vivo.

Google también anunció Google AI Ultra, un plan de suscripción premium que ofrece acceso exclusivo a los modelos de IA más potentes, con límites de uso ampliados, disponible desde $249.99 mensuales en EE.UU. y con planes de expansión global.

Además, el buscador de Google estrena el AI Mode para usuarios en Estados Unidos, ofreciendo una experiencia interactiva basada en las capacidades de Gemini. La función de Visión general creada por IA ya está disponible en más de 200 países y 40 idiomas.

Gemini avanza para convertirse en un modelo global capaz de planificar y simular nuevas experiencias, integrando funciones en vivo de Proyecto Astra, como comprensión de video, uso compartido de pantalla y memoria, en productos como Gemini Live y Search Live.

En el entorno de trabajo, Gemini añade respuestas inteligentes personalizadas en Gmail, traducción de voz en tiempo real en Meet y soporte ampliado en Documentos, Videos y Presentaciones, facilitando la colaboración y comunicación.

En el campo de las experiencias inmersivas, Google presentó sus modelos generativos Imagen 4 y Veo 3 para imágenes y videos de alta calidad, y Lyria 2 para generación musical. También lanzó Google Beam, una plataforma para comunicación 3D basada en IA, y una vista previa de Speech Translation para traducción de voz en tiempo real con alta fidelidad.

Para creadores, se presentó Flow, una herramienta para la creación visual de películas impulsada por IA, y para compradores, el nuevo AI Mode en Google Shopping permite navegación personalizada, pruebas virtuales de prendas y compras asistidas mediante Google Pay.

Finalmente, Google anunció Jules, un asistente de codificación autónomo que gestiona tareas directamente desde repositorios existentes, disponible en beta privada.

Leer Anterior

21.05.2025

Leer Siguiente

Fiscal pide prisión preventiva para ‘Los Buitres de Las Moras’