Uno de sus avances más visibles es la representación precisa de texto, eliminando las letras deformes y frases incompletas que caracterizaban a modelos anteriores.
Esta mejora permite crear con claridad etiquetas, diagramas y diseños en varios idiomas.
La herramienta también mejora el razonamiento visual, permitiendo interpretar instrucciones largas y complejas y utilizar hasta 14 imágenes de referencia, conservando la identidad de hasta cinco personas en una misma composición sin distorsionar rasgos.
Sin embargo, esta sofisticación presenta un desafío: la dificultad para detectar imágenes falsas, ya que las fallas tipográficas eran una pista clave. Google utiliza SynthID, un marcador invisible, para identificar las imágenes generadas, aunque su efectividad ha sido cuestionada.
Nano Banana Pro ofrece controles de nivel profesional para ajustar iluminación, ángulos de cámara y profundidad de campo, y puede generar contenido en 2K y 4K. El servicio está disponible en la app de Gemini, APIs para desarrolladores y se ha integrado en herramientas como Adobe Firefly y Photoshop.
Su costo orientado al uso profesional es de $0,139 dólares por imagen 2K y $0,24 por imagen 4K.












