Uno de los avances más visibles es la generación de texto claro y bien formado dentro de las imágenes, eliminando las letras deformes que caracterizaban a las primeras generaciones de IA.
Esta capacidad permite crear diseños, etiquetas y diagramas con mayor claridad.
El modelo también mejora la composición al permitir el uso de hasta 14 imágenes de referencia y conservar la identidad de hasta cinco personas en una misma escena sin distorsionar rasgos. Se integra directamente en el Buscador a través de Google Lens y el Modo IA, así como en aplicaciones de terceros como Adobe Firefly y Photoshop, donde impulsa funciones como Generative Fill.
Además, puede generar contenido en resoluciones de 2K y 4K, con un modelo de precios orientado al uso profesional: 0,139 dólares por imagen 2K y 0,24 dólares por una 4K. Este avance, sin embargo, plantea un desafío en la verificación de contenido, ya que la legibilidad del texto elimina una de las pistas más evidentes para detectar imágenes falsas. Para contrarrestarlo, Google implementa SynthID, un marcador invisible para identificar el origen de las imágenes generadas por sus modelos.






