
El reciente evento Google I/O 2025 ha sido una vez más una vitrina impresionante del ritmo frenético al que avanza la Inteligencia Artificial. Lejos de guardar las novedades para el gran escenario, Google ya nos venía mostrando avances significativos, como el lanzamiento de modelos más inteligentes o hitos como AlphaEvolve, incluso semanas antes del evento. Esto subraya una clara intención: llevar los mejores modelos de IA a manos de los usuarios lo antes posible.
En la Escuela de Inteligencia Artificial Aplicada de IAEFD, seguimos de cerca estas tendencias porque demuestran la increíble velocidad de progreso de nuestros modelos. Las métricas son asombrosas: desde el modelo Gemini Pro de primera generación, las puntuaciones Elo han aumentado en más de 300 puntos. Hoy, Gemini 2.5 Pro domina el ranking LMArena en todas las categorías.
Este avance incesante es posible gracias a una infraestructura líder a nivel mundial. Ironwood, la TPU de séptima generación de Google, ha sido diseñada específicamente para potenciar el razonamiento y las cargas de trabajo de IA inferencial a gran escala. Ofrece un rendimiento 10 veces superior a la generación anterior y una capacidad de procesamiento increíble de 42,5 exaflops por pod. Esta robusta infraestructura permite a Google ofrecer modelos mucho más rápidos, incluso mientras los precios bajan significativamente. Google no solo lidera en eficiencia según la frontera Pareto, sino que la ha desplazado.
El Mundo Abraza la IA a una Velocidad Sin Precedentes
La IA es ahora más accesible para todos y en cualquier lugar. La respuesta global ha sido una adopción más rápida que nunca. Las cifras hablan por sí solas:
- Hace un año, se procesaban 9,7 billones de tokens al mes en productos y APIs de Google. Hoy, esta cifra supera los 480 billones, es decir, un aumento de 50 veces.
- Más de 7 millones de desarrolladores ya crean con Gemini, cinco veces más que el año pasado. El uso de Gemini en Vertex AI se ha multiplicado por 40.
- La aplicación Gemini cuenta con más de 400 millones de usuarios activos al mes, mostrando un gran crecimiento y uso, especialmente con los modelos de la serie 2.5. El uso de 2.5 Pro en la aplicación Gemini ha aumentado un 45%.
De la Investigación a la Realidad Cotidiana
Todo este progreso nos sitúa en una nueva fase: décadas de investigación se están materializando en una realidad tangible para personas y empresas. Veamos algunos ejemplos destacados:
- Project Starline evoluciona a Google Beam: Recordarán Project Starline, la tecnología de video 3D presentada hace unos años para crear la sensación de estar en la misma sala. Ahora llega Google Beam, una plataforma de comunicación de video basada en IA que transforma flujos 2D en una experiencia 3D realista. Utiliza seis cámaras e IA para renderizar una imagen en una pantalla de campo de luz 3D con seguimiento de cabeza casi perfecto en tiempo real. En colaboración con HP, los primeros dispositivos estarán disponibles para clientes iniciales a finales de este año.
- Traducción Automática de Voz en Google Meet: Siguiendo la línea de experiencias inmersivas, Google Meet incorporará traducción automática de voz. Esta función, próxima al tiempo real, simula el timbre, tono y expresiones del interlocutor, facilitando conversaciones naturales en diferentes idiomas. Inicialmente disponible en beta para inglés y español para suscriptores de Google AI Pro y Ultra, se expandirá a clientes de Workspace Business y añadirá más idiomas.
- Project Astra se convierte en Gemini Live: Este proyecto de investigación sobre un asistente de IA universal con comprensión del entorno ahora integra las funciones de cámara y pantalla compartida en Gemini Live. Los usuarios ya lo aplican de formas creativas, como para preparar entrevistas o entrenar para maratones. Esta función ya está disponible para todos los usuarios de Android y se está implementando en iOS.
La Era de los Agentes de IA
Un avance fascinante es el concepto de Agentes, sistemas que combinan la inteligencia de los modelos de IA avanzados con el acceso a herramientas, de modo que pueden realizar acciones en tu nombre y bajo tu control.
- Project Mariner y el Modo Agente: El prototipo inicial Project Mariner es un primer paso hacia agentes capaces de controlar un ordenador e interactuar con la Web. Permite "enseñar y repetir" tareas. Las funciones de manejo de ordenadores de Project Mariner estarán disponibles para desarrolladores a través de la API de Gemini. Empresas como Automation Anywhere y UiPath ya están trabajando con ella, y se ampliará la disponibilidad este verano.
- Ecosistema de Agentes: Para que los agentes prosperen, se están desarrollando herramientas y protocolos como el protocolo abierto Agent2Agent y el Protocolo de Contexto del Modelo (MCP) de Anthropic. La API y el SDK de Gemini ahora soportan MCP.
- Modo Agente en Productos Google: Funciones de agente se están integrando en Chrome, la Búsqueda y la aplicación Gemini. El nuevo Modo Agente en la app Gemini ayudará, por ejemplo, a buscar pisos, aplicar filtros, acceder a anuncios vía MCP e incluso concertar visitas. Una versión experimental estará disponible para suscriptores, ofreciendo grandes oportunidades para empresas como Zillow para atraer clientes. Estamos ante un área emergente y emocionante.
El Poder de la Personalización con Contexto Personal
Para que la investigación llegue de verdad al mundo real, debe ser útil para tu realidad. Aquí entra la personalización, fundamental en la idea del Contexto Personal. Con tu permiso, los modelos Gemini pueden usar tu contexto relevante de tus aplicaciones de Google de forma privada, transparente y bajo tu control total.
- Respuestas Inteligentes Personalizadas en Gmail: Imagina recibir un correo pidiendo consejo para un viaje que hiciste. Gemini podrá buscar en tus correos y Google Drive (como itinerarios en Google Docs) para sugerir una respuesta con detalles específicos. Incluso emulará tu saludo, tono, estilo y palabras favoritas para sonar como si la hubieras escrito tú. Estas respuestas personalizadas estarán disponibles para suscriptores a finales de año. Piensen en lo útil que será el contexto personal en la Búsqueda o en Gemini.
La Búsqueda se Reinventa con IA
Los modelos Gemini están haciendo que la Búsqueda de Google sea más inteligente, proactiva y personalizada.
- Vista Creada con IA (AI Overviews): Desde su lanzamiento, ha llegado a más de 1.500 millones de usuarios en 200 países. Los usuarios que la usan están más satisfechos y realizan más búsquedas. En mercados clave, impulsa un crecimiento de más del 10% en los tipos de búsqueda donde aparece. ¡Es uno de los lanzamientos más exitosos de la Búsqueda en la última década!.
- Modo IA: Para una experiencia de búsqueda totalmente basada en IA, llega el nuevo Modo IA. Es una reinvención completa. Permite hacer preguntas mucho más largas y complejas (2-3 veces más largas que las tradicionales) y seguir con preguntas de seguimiento. Está disponible en una nueva pestaña de la Búsqueda. Ya está disponible para todos los usuarios de EE.UU.. Con los últimos modelos Gemini, las respuestas de IA son de alta calidad, precisas y las más rápidas del sector. Gemini 2.5 también está disponible en la Búsqueda en EE.UU. desde esta semana.
Mejoras Continuas en Nuestros Modelos Gemini
Google sigue perfeccionando sus modelos, como el potente y eficiente Gemini 2.5 Flash, muy popular entre desarrolladores por su velocidad y bajo coste. La versión 2.5 Flash ha mejorado en casi todos los aspectos, destacando en razonamiento, multimodalidad, código y contexto largo. Se posiciona en segunda posición en el ranking LMArena, solo superado por 2.5 Pro.
Además, Gemini 2.5 Pro mejora con un modo de razonamiento avanzado llamado Deep Think, que utiliza técnicas de pensamiento punteras, incluido el pensamiento paralelo.
Una aplicación Gemini más personal, proactiva y potente. Deep Research se personaliza permitiendo subir archivos y, próximamente, conectarse a Google Drive y Gmail para informes personalizados. Se integra con Canvas para crear infografías, cuestionarios o podcasts. El vibe coding con Canvas permite crear aplicaciones simplemente hablando con Gemini. Gemini Live expande sus funciones de cámara y pantalla compartida a más usuarios (incluido iOS) y pronto se conectará con otras apps de Google para asistencia fluida.
Creación de Contenido Multimedia con IA
Se presentaron nuevos modelos generativos de contenido multimedia:
- Veo 3: El modelo de video más avanzado, ahora con generación nativa de audio.
- Imagen 4: El modelo más reciente y capaz para generación de imágenes. Ambos están disponibles en la aplicación Gemini, que te abre un mundo de posibilidades creativas. Para cineastas, la herramienta Flow permite crear clips cinematográficos y extender clips cortos a escenas más largas.
Una Oportunidad para Mejorar Vidas
La oportunidad que ofrece la IA es inmensa. Lograr que sus beneficios lleguen al mayor número de personas depende de esta ola de desarrolladores, creadores de tecnología y catalizadores de innovación. Es inspirador pensar cómo la investigación actual sentará las bases de la realidad futura, desde robótica y computación cuántica hasta AlphaFold y Waymo.
Esta capacidad de la tecnología para inspirar, asombrar y ayudarnos a avanzar es algo que no debemos subestimar.
Capacítate para el Futuro de la IA Aplicada
Como hemos visto, la velocidad de la innovación en IA es asombrosa y está abriendo puertas a aplicaciones que hace poco parecían futuristas. Desde asistentes que controlan tu ordenador hasta herramientas de creación multimedia y formas completamente nuevas de interactuar con la información. Para no solo ser espectador de esta revolución, sino protagonista, es fundamental contar con la formación especializada necesaria para aplicar estas tecnologías en el mundo real.
En la Escuela de Inteligencia Artificial Aplicada de IAEFD, te ofrecemos los programas y conocimientos necesarios para dominar estas herramientas, comprender sus fundamentos y aplicarlas de forma efectiva en tu campo profesional. La oportunidad de mejorar vidas y crear el futuro con IA está aquí.