KI-Bildgenerierung: Gemini, FLUX.1 und der perfekte Prompt
Benutzern ermöglichen, Bilder für ihre Aufgaben direkt aus der App zu generieren. „Erstelle ein Bild für meine Aufgabe“ und schon erscheint eine passende Illustration.
Die Wahl der Anbieter
- Gemini 2.5 Flash Image (über OpenRouter): ausgezeichnetes Verhältnis von Qualität/Geschwindigkeit
- Runware FLUX.1: wirtschaftliche Alternative, perfekt für große Mengen
Der Administrator wechselt zwischen den beiden über das Dashboard.
Das Prompt Engineering durch LLM
Einen Benutzer bitten, einen guten Prompt zu schreiben, ist unrealistisch. Das Konversations-LLM analysiert den Kontext – Titel, Beschreibung, Tags – und generiert einen für das Bildmodell optimierten Prompt.
Die Stiloptionen
Vier vordefinierte Stile: flach (Vektorillustrationen), minimalistisch, realistisch, Aquarell. Jeder Stil ändert den an das Modell gesendeten Prompt.
Die technische Pipeline
Benutzeranfrage → LLM-Prompt → Bildanbieter → base64 → Supabase Storage hochladen → signierte URL → Anzeige. Jeder Schritt kann fehlschlagen – Wiederholung mit Backoff und automatischem Fallback Gemini → FLUX.1.
Die Kostenkontrolle
Limits pro Plan: Free hat keinen Zugriff, Pro hat ein tägliches Kontingent, Team ein höheres Kontingent. Ergebnis: Die Benutzer lieben es. Eine Aufgabe mit einem Bild ist sofort ansprechender.