Entrada de transacción por voz

Di «doce dólares café esta mañana» y Budgie lo registra. whisper.rn (backend whisper.cpp) y el LLM en el dispositivo se ejecutan localmente — ningún audio sale de tu teléfono.

Unirse a la Lista de Espera Todas las funciones

Por qué cada app de presupuesto por voz actual es un agujero de privacidad

La voz es el modo de entrada más rápido para un gasto — pero cada app de presupuesto por voz hoy transmite datos del micrófono a un servidor del proveedor. Budgie mantiene el flujo de audio completamente en el dispositivo, luego ejecuta whisper.rn (una biblioteca React Native respaldada por whisper.cpp) para la transcripción y un LLM local para la extracción de entidades.

El resultado es un formulario de transacción rellenado previamente: importe, categoría, cuenta y comercio, con la misma sugerencia de categoría con IA que las entradas manuales.

Lo que obtienes

whisper.rn (backend whisper.cpp) ejecuta Whisper-small localmente para una transcripción precisa y multilingüe

El LLM en el dispositivo extrae importe, comercio, fecha y categoría del habla natural

El audio nunca sale del dispositivo: sin viaje de ida y vuelta a la nube al estilo Siri

Rellena el mismo formulario de entrada rápida que usarías al escribir: confirma o corrige

Funciona también durante la fase de carga del modelo de IA: indicador de progreso visual integrado

Cómo funciona

Toca el micrófono en la hoja de entrada rápida. whisper.rn transcribe localmente usando el motor whisper.cpp. El LLM local extrae pistas de importe, comercio y fecha de la transcripción y aplica el mismo proceso de sugerencia de categoría en el dispositivo usado para las transacciones escritas.

Tres pasos del habla al guardado

Toca el micrófono en el formulario de entrada rápida

Dilo con naturalidad: "doce dólares café en el aeropuerto"

Confirma o corrige el formulario rellenado previamente y guarda

Preguntas Frecuentes

¿Qué idiomas admite la entrada por voz?

whisper.rn incluye el modelo Whisper-small, que cubre inglés, ucraniano, alemán, francés y español como idiomas principales, más docenas adicionales. La calidad de transcripción escala con la cobertura de idiomas del modelo.

¿Mi voz se graba en algún lugar?

No. El flujo del micrófono alimenta whisper.rn directamente en proceso; el búfer de audio se descarta tras la transcripción. Nada se guarda, envía ni registra.

¿Qué ocurre si Whisper me entiende mal?

La transcripción aparece en el formulario antes de guardar. Edita cualquier campo manualmente o toca el micrófono de nuevo para reintentar.

¿Funciona sin conexión?

Sí: una vez que el modelo de Whisper está almacenado en caché en el dispositivo, la entrada por voz funciona sin ninguna conexión a internet.

Funciones relacionadas

Categorización automática con IA en el dispositivo

Dos modelos en el dispositivo — Qwen3 1.7B para chat y un modelo de embedding de 768 dimensiones — impulsan de forma privada las sugerencias de categoría, etiqueta y comercio.

Seguimiento de gastos, sin la carga de la nube

De abrir a guardar en dos toques: un formulario de entrada rápida en hoja inferior diseñado para uso con una sola mano.

Traducción de nombres de comercio con IA

Cadenas de comercio en cirílico, griego y árabe: el LLM en el dispositivo translitéra y añade palabras clave de búsqueda.

Leer más en el blog

Como Budgie mantiene tus datos financieros fuera de la nube

Una mirada técnica a la arquitectura offline-first de Budgie: SQLite, cifrado AES-256 y sincronización entre dispositivos que mantienen tus datos financieros en tu dispositivo.

Por qué el enfoque Offline-First es la única forma de proteger tu privacidad financiera

Descubre por qué la arquitectura offline-first es el único enfoque verdaderamente privado para apps financieras. Aprende sobre riesgos de datos, privacidad por diseño y cómo Budgie mantiene tus finanzas seguras.

¿Listo para probar Budgie?

Únete a la lista de espera: sé el primero en probar el rastreador de gastos offline-first.

Unirse a la Lista de Espera Explorar todas las funciones