Blog
AI/Voice
22 de fevereiro de 20267 min

Geração de imagens IA: Gemini, FLUX.1 e o prompt perfeito

Permitir que os usuários gerem imagens para suas tarefas, diretamente do aplicativo. "Crie uma imagem para minha tarefa" e pronto, uma ilustração relevante aparece.

A escolha dos provedores

  • Gemini 2.5 Flash Image (via OpenRouter): excelente relação qualidade/velocidade
  • Runware FLUX.1: alternativa econômica, perfeita para grandes volumes

O administrador alterna entre os dois no painel.

A engenharia de prompt por LLM

Pedir a um usuário para escrever um bom prompt é irrealista. O LLM de conversação analisa o contexto — título, descrição, tags — e gera um prompt otimizado para o modelo de imagens.

As opções de estilo

Quatro estilos predefinidos: plano (ilustrações vetoriais), minimalista, realista, aquarela. Cada estilo modifica o prompt enviado ao modelo.

O pipeline técnico

Solicitação do usuário → prompt LLM → provedor de imagem → base64 → upload para Supabase Storage → URL assinada → exibição. Cada etapa pode falhar — nova tentativa com backoff e fallback automático Gemini → FLUX.1.

O custo controlado

Limites por plano: Free não tem acesso, Pro tem uma cota diária, Team tem uma cota maior. Resultado: os usuários adoram. Uma tarefa com uma imagem é imediatamente mais envolvente.