Blog
AI/Voice
22. Februar 20267 min

KI-Bildgenerierung: Gemini, FLUX.1 und der perfekte Prompt

Benutzern ermöglichen, Bilder für ihre Aufgaben direkt aus der App zu generieren. „Erstelle ein Bild für meine Aufgabe“ und schon erscheint eine passende Illustration.

Die Wahl der Anbieter

  • Gemini 2.5 Flash Image (über OpenRouter): ausgezeichnetes Verhältnis von Qualität/Geschwindigkeit
  • Runware FLUX.1: wirtschaftliche Alternative, perfekt für große Mengen

Der Administrator wechselt zwischen den beiden über das Dashboard.

Das Prompt Engineering durch LLM

Einen Benutzer bitten, einen guten Prompt zu schreiben, ist unrealistisch. Das Konversations-LLM analysiert den Kontext – Titel, Beschreibung, Tags – und generiert einen für das Bildmodell optimierten Prompt.

Die Stiloptionen

Vier vordefinierte Stile: flach (Vektorillustrationen), minimalistisch, realistisch, Aquarell. Jeder Stil ändert den an das Modell gesendeten Prompt.

Die technische Pipeline

Benutzeranfrage → LLM-Prompt → Bildanbieter → base64 → Supabase Storage hochladen → signierte URL → Anzeige. Jeder Schritt kann fehlschlagen – Wiederholung mit Backoff und automatischem Fallback Gemini → FLUX.1.

Die Kostenkontrolle

Limits pro Plan: Free hat keinen Zugriff, Pro hat ein tägliches Kontingent, Team ein höheres Kontingent. Ergebnis: Die Benutzer lieben es. Eine Aufgabe mit einem Bild ist sofort ansprechender.