Blog
Build in Public
3 octobre 20259 min

Pourquoi j ai cree un gestionnaire de taches vocal avec IA

TAMSIV est ne d'une frustration banale : des listes de courses sur papier collees au frigo, un club de plongee qui gere tout sur WhatsApp, et cette sensation permanente que l'information se perd entre les post-it et les groupes de discussion. Un jour, je me suis dit : pourquoi on ne pourrait pas simplement parler pour organiser sa vie ? Six mois et 700+ commits plus tard, TAMSIV est une app Android complete avec IA conversationnelle, pipeline vocal temps reel et gestion collaborative. Voici comment tout a commence.

Points cles a retenir :
- Les meilleures idees de produit naissent de frustrations personnelles repetees — pas d'etudes de marche abstraites.
- React Native avec la New Architecture (Fabric) permet a un dev web solo de livrer une app mobile performante sans natif pur.
- Supabase offre tout ce dont un projet solo a besoin (auth, DB, storage, Realtime) dans un seul service.
- Le premier prototype fonctionnel (voix vers tache creee) est le meilleur validateur d'idee — mieux que n'importe quel business plan.
Porte de refrigerateur couverte de listes de courses manuscrites et de post-it colores
La realite de la gestion de taches familiale : des bouts de papier sur le frigo qui se perdent chaque semaine.

D'ou vient l'idee d'un gestionnaire de taches vocal ?

Tout a commence par une frustration banale. Mon epouse et moi, on gere une famille de quatre personnes. Les listes de courses ? Sur un bout de papier colle au frigo. Les taches menageres ? Dans nos tetes. Et quand on oublie quelque chose — ce qui arrive souvent — c'est la petite tension du quotidien. "Tu n'avais pas dit que tu t'en occupais ?" Si, mais je l'ai oublie. Comme a chaque fois.

En parallele, je suis membre d'un club de plongee. Et la, c'est le chaos organise : tout passe par WhatsApp. Les sorties, les inscriptions, le materiel, les comptes-rendus. Des dizaines de messages par jour dans un groupe ou l'info se noie. Tu cherches la date de la prochaine sortie ? Bonne chance pour la retrouver entre les memes et les photos de poissons.

Deux contextes differents, le meme probleme : l'information se perd parce que les outils qu'on utilise ne sont pas faits pour ca. Le papier ne rappelle pas. WhatsApp n'organise pas. Et les apps de gestion de taches existantes ? Trop compliquees, trop de champs a remplir, trop de friction.

Pourquoi la voix est-elle la reponse a la surcharge mentale ?

L'insight qui a tout declenche : on pense et on communique par la parole, pas par des formulaires. Quand tu dis a ton conjoint "n'oublie pas d'acheter du lait demain", c'est une instruction claire. Mais quand tu ouvres une app de taches, tu dois :

  1. Ouvrir l'app
  2. Appuyer sur "+"
  3. Taper le titre
  4. Selectionner une date
  5. Choisir un projet/tag
  6. Sauvegarder

Six etapes pour une action qui prend 3 secondes a dire. C'est exactement le probleme que decrit le concept de capture friction dans la methodologie GTD (Getting Things Done) de David Allen : plus la capture d'une idee est facile, plus le systeme est utilise.

Je me suis dit : pourquoi on ne pourrait pas simplement dire ce qu'on veut faire ? "Ajoute du lait a la liste de courses." "Rappelle-moi de preparer les bouteilles pour samedi." Sans ouvrir une app, sans taper, sans chercher le bon champ dans un formulaire.

C'est comme ca que TAMSIV est ne. Un gestionnaire de taches et memos pilote par la voix, avec une IA conversationnelle qui comprend ce que tu veux et agit en consequence.

Quels choix techniques pour un dev solo qui lance un projet mobile ?

Developpeur configurant un nouveau projet sur un laptop avec les premieres lignes de code
Le premier commit : octobre 2025. Un monorepo, trois dossiers, et une montagne de decisions a prendre.

Premier commit en octobre 2025. Chaque choix technique a ce stade est critique — tu es seul, tu n'as pas de marge d'erreur, et revenir en arriere coute cher.

Pourquoi React Native et pas du natif pur ?

Je suis developpeur web de formation. Le natif pur (Kotlin/Swift) m'aurait ralenti de plusieurs mois pour un resultat equivalent. React Native avec la New Architecture (Fabric) offre des performances au rendez-vous — le jank et les problemes de bridge qui plagaient les versions anterieures sont resolus.

Le choix du monorepo avec trois dossiers etait une evidence :

  • frontend/ — React Native TypeScript pour l'app mobile
  • backend/ — Node.js Express avec WebSocket pour le serveur IA
  • website/Next.js pour la landing page et le dashboard web

Un seul repo, un seul git log, des types TypeScript partages entre frontend et backend. La coherence est maximale.

Pourquoi Supabase plutot que Firebase ou un backend custom ?

Supabase offre tout ce dont un projet solo a besoin dans un seul service : PostgreSQL manage, authentification integree (email, magic links, et plus tard QR code), stockage de fichiers, et Realtime pour la synchronisation temps reel.

Firebase aurait ete l'autre option evidente, mais le modele NoSQL (Firestore) ne convient pas a des donnees relationnelles comme les taches, memos, groupes et evenements. PostgreSQL est fait pour ca — et Supabase le rend accessible sans gerer un serveur.

La structuration de la base de donnees viendrait plus tard, mais le choix de Supabase des le debut a permis d'iterer vite sans se soucier de l'infrastructure.

Comment fonctionne le pipeline vocal au coeur de TAMSIV ?

Personne parlant dans son smartphone en marchant en exterieur
Le cas d'usage ideal : dire ce qu'on veut faire, les mains libres, sans ouvrir de menu ni remplir de formulaire.

Le coeur du projet, c'est le pipeline vocal. Des le premier prototype, j'ai cable la chaine complete :

  1. Audio PCM 16kHz — capture depuis le micro du telephone
  2. WebSocket temps reel — envoi du flux audio au backend
  3. STT (Speech-to-Text) — transcription par le moteur natif du device (avec fallback Deepgram)
  4. LLM (Large Language Model) — analyse du texte et decision d'action via OpenRouter
  5. Function calling — le LLM appelle une fonction (create_task, create_memo, etc.)
  6. TTS (Text-to-Speech) — reponse vocale via OpenAI TTS

L'utilisateur parle, le backend transcrit, envoie le texte a un LLM qui decide quoi faire, et renvoie une reponse vocale. Tout ca en quelques secondes.

Les premiers tests etaient magiques. Dire "cree une tache acheter du pain pour demain" et voir la tache apparaitre avec la bonne date... c'est le genre de moment qui te confirme que tu es sur la bonne voie. Pas besoin d'un business plan de 50 pages — quand le prototype marche et que tu te dis "je veux utiliser ca tous les jours", l'idee est validee.

Quels sont les defis d'un developpeur solo sur un projet aussi ambitieux ?

Etre developpeur solo, c'est une liberte totale sur les choix techniques. Pas de reunion, pas de compromis, pas de "on en discute lundi". Tu vois un probleme, tu le corriges. Tu as une idee, tu la codes.

Mais c'est aussi la solitude face aux bugs a 23h. Personne pour relire ton code, personne pour challenger tes choix, personne pour te dire "tu es sur la bonne voie" quand tu doutes. C'est un sentiment que connaissent beaucoup de fondateurs techniques solos.

Le build in public — raconter l'aventure via ce blog et les reseaux — est devenu ma facon de compenser cette solitude. Chaque article est un checkpoint, une preuve que le projet avance, un moyen de recevoir du feedback meme sans equipe.

Comment est-on passe du premier commit a 700+ commits en 6 mois ?

Le parcours depuis ce premier commit a suivi une trajectoire que je n'aurais pas pu planifier :

L'article detaille sur les 650+ commits retrace chaque etape en profondeur.

Quelles lecons retenir pour lancer un projet solo ?

  1. Pars de ta propre frustration. Les meilleurs produits resolvent un probleme que le createur vit au quotidien. Tu seras ton premier utilisateur et ton meilleur testeur.
  2. Choisis des outils qui multiplient ta productivite. React Native, Supabase, OpenRouter — chaque choix doit te faire gagner des semaines, pas des heures.
  3. Prototype vite, valide vite. Le premier pipeline vocal fonctionnel m'a pris 3 jours. Ce prototype a valide l'idee mieux que n'importe quelle etude.
  4. Documente l'aventure. Le build in public n'est pas du marketing — c'est un journal de bord qui te force a prendre du recul et qui cree une communaute autour du projet.

Questions frequentes

Faut-il savoir coder en natif pour creer une app mobile avec IA ?

Non. React Native avec TypeScript permet a un developpeur web de creer une app mobile performante. Pour l'IA, des services comme OpenRouter et OpenAI fournissent des API qui ne necessitent pas de competences en machine learning. Le plus important est de comprendre l'architecture client-serveur et les WebSockets.

Combien coute le developpement d'une app comme TAMSIV en dev solo ?

En couts directs : Supabase (plan gratuit au debut, puis ~25 EUR/mois), OpenRouter (~0.001 EUR/message LLM), OpenAI TTS (~0.015 EUR/1000 caracteres), Runware pour les images (~0.003 EUR/image). Le cout principal est le temps : 6 mois a temps partiel, soit environ 500-600 heures de travail.

Pourquoi un monorepo plutot que des repos separes ?

Pour un dev solo, la coherence prime. Un seul repo signifie un seul historique git, des types TypeScript partages, et pas de synchronisation de versions entre packages. Le monorepo devient plus complexe a gerer a partir de 3-4 developpeurs, mais pour un projet solo, c'est ideal.

Le pipeline vocal fonctionne-t-il hors connexion ?

Partiellement. Le STT natif du device fonctionne sans internet (reconnaissance vocale locale). Mais le LLM et le TTS necessitent une connexion au backend. Un mode offline avec mise en file d'attente est sur la roadmap — les commandes vocales seraient stockees localement et traitees a la reconnexion.

WhatsApp n'est-il pas suffisant pour gerer des taches en groupe ?

Non, et c'est exactement le probleme qui a inspire TAMSIV. WhatsApp est un outil de communication, pas d'organisation. Les informations se noient dans le flux de messages, rien n'est structurel, il n'y a pas de rappels, pas de dates d'echeance, pas d'assignation. C'est le chaos organise — et les groupes collaboratifs de TAMSIV resolvent precisement ce probleme.