Gemini 2.5 Flash Image gelanceerd met multi-image fusie en verbeterde karakterconsistentie

Gemini 2.5 Flash Image, ook bekend als nano-banana, is het geavanceerde beeldgeneratie- en bewerkingsmodel van Google, geรฏntroduceerd in augustus 2025. Het model kan meerdere afbeeldingen combineren tot รฉรฉn, behoudt de consistentie van karakters bij bewerkingen, maakt gerichte aanpassingen via natuurlijke taal mogelijk en gebruikt Geminiโ€™s wereldkennis voor verbeterde beeldgeneratie en -bewerking.

Belangrijkste functies

  • Karakterconsistentie: Het model houdt het uiterlijk van karakters of objecten consistent over meerdere prompts en bewerkingen, zodat ze in verschillende omgevingen geplaatst kunnen worden of voor consistente merkassets kunnen worden gebruikt.
  • Prompt-gebaseerde beeldbewerking: Gebruikers kunnen nauwkeurige lokale bewerkingen uitvoeren, zoals achtergronden vervagen, objecten verwijderen, houdingen aanpassen of kleuren toevoegen aan zwart-witbeelden, via eenvoudige natuurlijke taalprompts.
  • Ingebouwde wereldkennis: Gemini 2.5 Flash Image begrijpt context en semantiek uit de echte wereld, wat toepassingen zoals interactieve educatieve tools mogelijk maakt die handgetekende diagrammen en complexe bewerkingsinstructies interpreteren.
  • Multi-image fusie: Meerdere inputafbeeldingen kunnen worden samengevoegd tot รฉรฉn fotorealistisch beeld, bijvoorbeeld voor het plaatsen van objecten in nieuwe scรจnes of het restylen van kamers met verschillende texturen en kleurenschemaโ€™s.

Toegankelijkheid en prijs

Het model is beschikbaar via de Gemini API, Google AI Studio en Vertex AI voor bedrijven. De prijs is $30 per miljoen outputtokens, waarbij รฉรฉn afbeelding gemiddeld $0,039 kost op basis van 1290 outputtokens per afbeelding. Andere input- en outputmodaliteiten volgen het standaard Gemini 2.5 Flash-tarief.

Ontwikkeltools en ondersteuning

Google AI Studio is uitgebreid met een โ€œbuild-modusโ€, waarmee ontwikkelaars snel AI-toepassingen kunnen testen, remixen en uitrollen met Gemini 2.5 Flash Image. Voorbeelden van template-apps demonstreren functies zoals karakterconsistentie, prompt-gebaseerde bewerking, multi-image fusie en interactieve educatieve toepassingen. Ontwikkelaars kunnen code opslaan op GitHub of direct vanuit AI Studio implementeren.

Partnerschappen en community

  • OpenRouter.ai werkt samen met Google om Gemini 2.5 Flash Image beschikbaar te maken voor meer dan 3 miljoen ontwikkelaars, waarmee het het eerste beeldgeneratiemodel op hun platform is.
  • fal.ai, een platform voor generatieve media, helpt de toegang voor de bredere ontwikkelaarscommunity uit te breiden.

Beeldauthenticiteit

Alle beelden die met Gemini 2.5 Flash Image worden gemaakt of bewerkt, bevatten een onzichtbaar SynthID-digitaal watermerk om te identificeren dat ze door AI zijn gegenereerd of bewerkt.

Voorbeeldgebruik (Python)

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client()

prompt = "Maak een afbeelding van mijn kat die een nano-banana eet in een chique restaurant onder het Gemini-constellatie"
image = Image.open('/path/to/image.png')

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))   
    image.save("generated_image.png")

Toekomstige verbeteringen

Google werkt actief aan:

  • Verbetering van lange-tekstrendering
  • Betere betrouwbaarheid van karakterconsistentie
  • Hogere feitelijke nauwkeurigheid in afbeeldingsdetails

Feedback wordt aangemoedigd via het ontwikkelaarsforum en sociale mediakanalen.

Gemini 2.5 Flash Image bevindt zich momenteel in preview, met een stabiele release gepland, en biedt ontwikkelaars krachtige nieuwe tools voor creatieve en praktische beeldgeneratie en -bewerking.