Entrada de transacción por voz

Di «doce dólares café esta mañana» y Budgie lo registra. whisper.rn (backend whisper.cpp) y el LLM en el dispositivo se ejecutan localmente — ningún audio sale de tu teléfono.

Por qué cada app de presupuesto por voz actual es un agujero de privacidad

La voz es el modo de entrada más rápido para un gasto — pero cada app de presupuesto por voz hoy transmite datos del micrófono a un servidor del proveedor. Budgie mantiene el flujo de audio completamente en el dispositivo, luego ejecuta whisper.rn (una biblioteca React Native respaldada por whisper.cpp) para la transcripción y un LLM local para la extracción de entidades.

El resultado es un formulario de transacción rellenado previamente: importe, categoría, cuenta y comercio, con la misma sugerencia de categoría con IA que las entradas manuales.

Lo que obtienes

whisper.rn (backend whisper.cpp) ejecuta Whisper-small localmente para una transcripción precisa y multilingüe

El LLM en el dispositivo extrae importe, comercio, fecha y categoría del habla natural

El audio nunca sale del dispositivo: sin viaje de ida y vuelta a la nube al estilo Siri

Rellena el mismo formulario de entrada rápida que usarías al escribir: confirma o corrige

Funciona también durante la fase de carga del modelo de IA: indicador de progreso visual integrado

Cómo funciona

Toca el micrófono en la hoja de entrada rápida. whisper.rn transcribe localmente usando el motor whisper.cpp. El LLM local extrae pistas de importe, comercio y fecha de la transcripción y aplica el mismo proceso de sugerencia de categoría en el dispositivo usado para las transacciones escritas.

Tres pasos del habla al guardado

Toca el micrófono en el formulario de entrada rápida

Dilo con naturalidad: "doce dólares café en el aeropuerto"

Confirma o corrige el formulario rellenado previamente y guarda

Preguntas Frecuentes

¿Qué idiomas admite la entrada por voz?
whisper.rn incluye el modelo Whisper-small, que cubre inglés, ucraniano, alemán, francés y español como idiomas principales, más docenas adicionales. La calidad de transcripción escala con la cobertura de idiomas del modelo.
¿Mi voz se graba en algún lugar?
No. El flujo del micrófono alimenta whisper.rn directamente en proceso; el búfer de audio se descarta tras la transcripción. Nada se guarda, envía ni registra.
¿Qué ocurre si Whisper me entiende mal?
La transcripción aparece en el formulario antes de guardar. Edita cualquier campo manualmente o toca el micrófono de nuevo para reintentar.
¿Funciona sin conexión?
Sí: una vez que el modelo de Whisper está almacenado en caché en el dispositivo, la entrada por voz funciona sin ninguna conexión a internet.

¿Listo para probar Budgie?

Únete a la lista de espera: sé el primero en probar el rastreador de gastos offline-first.