Blog
AI/Voice
8 janvier 20267 min

Le Dictaphone : quand la voix devient l'interface principale

La promesse de TAMSIV : créer une tâche en parlant, plus vite qu'en tapant. Toute l'UX du Dictaphone découle de cette promesse.

Push-to-talk

J'ai choisi le push-to-talk plutôt que l'écoute continue. Trois raisons : la batterie, la vie privée, et le bruit ambiant. Le push-to-talk est explicite — pas d'ambiguïté. Le VAD de Deepgram gère la fin de phrase automatiquement.

Le pattern PendingCreation

Le pattern le plus important de TAMSIV. L'IA analyse la dictée et crée une preview. Rien n'est sauvé en base. L'utilisateur voit la proposition, modifie si besoin, puis valide ou annule.

Pourquoi ? La reconnaissance vocale n'est pas parfaite. L'IA peut mal interpréter. L'utilisateur doit garder le contrôle. La voix accélère la saisie, mais l'humain décide.

STT natif vs cloud

Deux modes configurables : natif (gratuit, local, variable en qualité) et cloud Deepgram (consistant, précis, payant). Le STT natif pour le plan Free, Deepgram pour Pro/Team.

L'UX du bouton

Le bouton du Dictaphone est le premier onglet de l'app. Pas les tâches, pas les mémos. Le micro. Parce que dans TAMSIV, la voix n'est pas une feature — c'est LE produit. Feedback haptique à chaque changement d'état. L'utilisateur sent physiquement quand l'app écoute.