Blog
AI/Voice
12. März 20267 min

KI-Bilder und Inline-Diktiergerät: Die Neuerungen von v1.3.2

Version 1.3.2 ist die ambitionierteste, die ich bisher veröffentlicht habe. Zwei wichtige Funktionen und eine heikle technische Migration.

Integrierte KI-Bilder

Das generierte Bild wird direkt an die Aufgabe angehängt. Der Benutzer fragt den Sprachassistenten, und das LLM erstellt einen optimierten Prompt, indem es den Kontext analysiert. Gespeichert in privat.task_attachments mit dem Typ ai_generated.

Das Inline-Diktiergerät

Kein Vollbild-Overlay mehr. Das Diktiergerät ist direkt am unteren Bildschirmrand integriert. Die entscheidende Optimierung: Der transkribierte Text erscheint vor dem Ende der TTS. Die Transkription wird sofort angezeigt, während der Ton parallel generiert wird.

Option zum Überspringen von TTS hinzugefügt: Einige Benutzer benötigen keine Sprachantwort. Doppelter Vorteil: kürzere Antwortzeit und geringere Kosten.

Die Migration des Gesten-Handlers

Goldene Regel: In jedem GestureDetector sollten die Komponenten von react-native-gesture-handler verwendet werden, niemals die von React Native Standard. Der Fehler war tückisch: funktionierte auf iOS, aber nicht auf Android, oder im Debug-Modus, aber nicht in der Release-Version. Ich habe jede Datei durchgesehen, um die Importe zu korrigieren.

Leistung

Kein unnötiges Re-Rendering, Animation über useNativeDriver, aggressive Bereinigung mit 30s Timeout von AudioPlayerService. Version 1.3.2 markiert einen Wendepunkt: Die App beginnt, die Flüssigkeit zu haben, die sie von einer einfachen To-Do-Liste unterscheidet.