Construí um gerenciador de tarefas por voz com IA em 650 commits — o que aprendi
Há 6 meses, tive uma ideia. Em casa, éramos 4 com pedaços de papel na geladeira para as compras. No clube de mergulho, tudo passava pelo WhatsApp — impossível encontrar qualquer coisa.
Hoje, o TAMSIV é um aplicativo Android completo com um assistente de voz IA, grupos colaborativos, uma agenda, gamificação e fala 6 idiomas. Mais de 650 commits. Desenvolvimento solo.
O pipeline de voz
O coração do TAMSIV é a voz. Você aperta, fala, a IA entende e cria a tarefa. Por baixo do capô:
- Deepgram para Speech-to-Text (streaming com VAD)
- OpenRouter para LLM (mais de 400 modelos, fallback automático)
- OpenAI TTS para síntese de voz (voz "nova")
Tudo conectado por WebSocket com autenticação JWT. O áudio PCM 16kHz mono sai do telefone, passa pelo backend e retorna como uma resposta de voz estruturada.
A pilha
- Frontend: React Native 0.81 (TypeScript), Nova Arquitetura (Fabric)
- Backend: Node.js/Express + WebSocket
- Banco de dados: Supabase PostgreSQL com 3 esquemas
- Site: Next.js 16, Tailwind CSS 4, Vercel
As funcionalidades que levaram mais tempo
A colaboração foi o maior projeto. Grupos hierárquicos de 6 níveis, funções, checklists com validação, rastreamento de leitura, atribuição. 31 políticas RLS.
A agenda com recorrência foi surpreendentemente complexa. Os LLMs não são bons com datas — foi preciso construir uma tabela de correspondência.
A gamificação: 12 níveis, 10 distintivos, sequências de até 365 dias, desafios diários, placar. Um esquema dedicado com 5 tabelas e gatilhos automáticos.
Os erros
Passei 6 meses sem fazer nenhum marketing. 650 commits e nem uma única postagem para falar sobre isso. Não faça isso.
Também subestimei a i18n. Mudar de 100% francês para 6 idiomas afetou 35 arquivos e 1993 chaves de tradução.
O próximo passo
O TAMSIV está em alfa na Play Store. 12 testadores. O próximo objetivo: produção pública. Se você é um desenvolvedor solo e está hesitando — vá em frente. O primeiro commit é o mais difícil.