El modelo mejora significativamente su capacidad multimodal, permitiendo procesar texto, imágenes, audio y video de forma integrada.

Además, se introduce una función experimental llamada 'Gemini Agent', un agente autónomo capaz de realizar tareas en otras aplicaciones de Google, como gestionar el calendario, organizar la bandeja de entrada de Gmail o añadir recordatorios, solicitando permiso al usuario para acciones críticas. Los análisis de mercado indican que el avance de Gemini es significativo, habiendo duplicado su participación de tráfico en el último año hasta alcanzar un 13,7 %, lo que recorta la distancia con ChatGPT.

Google también ha reforzado la seguridad para evitar sesgos y usos indebidos.