Blog
AI/Voice
22 de fevereiro de 20269 min

Geração de imagens de IA em um aplicativo de produtividade

Permitir que os usuários gerem imagens para suas tarefas, diretamente do aplicativo. "Crie uma imagem para minha tarefa" e pronto, uma ilustração relevante aparece.

A escolha dos provedores

  • Gemini 2.5 Flash Image (via OpenRouter): excelente relação qualidade/velocidade
  • Runware FLUX.1: alternativa econômica, perfeita para grandes volumes

O administrador alterna entre os dois no painel.

A engenharia de prompt por LLM

Pedir a um usuário para escrever um bom prompt é irrealista. O LLM de conversação analisa o contexto — título, descrição, tags — e gera um prompt otimizado para o modelo de imagens.

As opções de estilo

Quatro estilos predefinidos: plano (ilustrações vetoriais), minimalista, realista, aquarela. Cada estilo modifica o prompt enviado ao modelo.

O pipeline técnico

Solicitação do usuário → prompt LLM → provedor de imagem → base64 → upload para Supabase Storage → URL assinada → exibição. Cada etapa pode falhar — nova tentativa com backoff e fallback automático Gemini → FLUX.1.

O custo controlado

Limites por plano: Free não tem acesso, Pro tem uma cota diária, Team tem uma cota maior. Resultado: os usuários adoram. Uma tarefa com uma imagem é imediatamente mais envolvente.