Blog
AI/Voice
22 febbraio 20267 min

Generazione di immagini IA: Gemini, FLUX.1 e il prompt perfetto

Consentire agli utenti di generare immagini per le loro attività, direttamente dall'app. "Crea un'immagine per la mia attività" e voilà, appare un'illustrazione pertinente.

La scelta dei fornitori

  • Gemini 2.5 Flash Image (tramite OpenRouter): eccellente rapporto qualità/velocità
  • Runware FLUX.1: alternativa economica, perfetta per grandi volumi

L'amministratore passa da uno all'altro dalla dashboard.

L'ingegneria dei prompt tramite LLM

Chiedere a un utente di scrivere un buon prompt è irrealistico. Il LLM conversazionale analizza il contesto — titolo, descrizione, tag — e genera un prompt ottimizzato per il modello di immagini.

Le opzioni di stile

Quattro stili predefiniti: piatto (illustrazioni vettoriali), minimalista, realistico, acquerello. Ogni stile modifica il prompt inviato al modello.

La pipeline tecnica

Richiesta utente → prompt LLM → fornitore immagine → base64 → upload Supabase Storage → URL firmato → visualizzazione. Ogni fase può fallire — riprova con backoff e fallback automatico Gemini → FLUX.1.

Il costo controllato

Limiti per piano: Free non ha accesso, Pro ha una quota giornaliera, Team una quota più alta. Risultato: gli utenti lo adorano. Un'attività con un'immagine è immediatamente più coinvolgente.