Blog
AI/Voice
22 de febrero de 20267 min

Generación de imágenes IA: Gemini, FLUX.1 y el prompt perfecto

Permitir a los usuarios generar imágenes para sus tareas, directamente desde la aplicación. "Crea una imagen para mi tarea" y listo, aparece una ilustración relevante.

La elección de los proveedores

  • Gemini 2.5 Flash Image (a través de OpenRouter): excelente relación calidad/velocidad
  • Runware FLUX.1: alternativa económica, perfecta para grandes volúmenes

El administrador alterna entre los dos desde el panel de control.

La ingeniería de prompts por LLM

Pedir a un usuario que escriba un buen prompt es poco realista. El LLM de conversación analiza el contexto (título, descripción, etiquetas) y genera un prompt optimizado para el modelo de imágenes.

Las opciones de estilo

Cuatro estilos predefinidos: plano (ilustraciones vectoriales), minimalista, realista, acuarela. Cada estilo modifica el prompt enviado al modelo.

El pipeline técnico

Solicitud del usuario → prompt LLM → proveedor de imágenes → base64 → carga a Supabase Storage → URL firmada → visualización. Cada paso puede fallar: reintento con backoff y fallback automático Gemini → FLUX.1.

El costo controlado

Límites por plan: Free no tiene acceso, Pro tiene una cuota diaria, Team una cuota más alta. Resultado: a los usuarios les encanta. Una tarea con una imagen es inmediatamente más atractiva.