Categorización automática con IA en el dispositivo
Dos modelos en el dispositivo — Qwen3 1.7B para chat y un modelo de embedding Nomic de 768 dimensiones — categorizan transacciones, sugieren etiquetas y aprenden de tus correcciones. Tus extractos nunca salen del teléfono.
Por qué la IA en el dispositivo es la única IA que protege tus extractos
Las apps de presupuesto con «IA» en la nube transmiten cada cadena de comercio a un LLM remoto, lo que a menudo significa que OpenAI ve tus hábitos de supermercado. Budgie carga ambos modelos una vez, luego mantiene cada inferencia local — misma precisión, cero exfiltración de datos.
La canalización de dos etapas ejecuta primero la búsqueda de embedding para la categorización instantánea de vecino más cercano desde tu propio historial, luego recurre a Qwen3 1.7B para transacciones novedosas que el índice de embedding no ha visto antes. Cada sugerencia aceptada o editada actualiza el índice de 768 dimensiones inmediatamente — la precisión se acumula con el tiempo.
Flujo de categorización en dos etapas
Búsqueda de embedding — el modelo Nomic de 768 dimensiones encuentra la transacción histórica más cercana instantáneamente mediante búsqueda SIMD de sqlite-vec
Alternativa LLM — Qwen3 1.7B Q4 maneja transacciones nuevas que el índice de embedding no ha visto, proponiendo categoría y etiquetas desde el contexto
Bucle de corrección — cada sugerencia aceptada o editada actualiza el índice de embedding inmediatamente para que la siguiente transacción similar caiga más cerca sin necesidad de re-entrenamiento
Lo que obtienes
El modelo Qwen3 1.7B Q4 se ejecuta completamente en tu teléfono tras una descarga única
Modelo de embedding Nomic de 768 dimensiones + sqlite-vec para búsqueda de similitud acelerada con SIMD
Dos señales complementarias: búsqueda vectorial sobre tu historial más una sugerencia LLM generativa
Cada corrección actualiza el índice de embedding al instante — la precisión mejora cuanto más lo usas
Los extractos nunca salen del dispositivo: sin OpenAI, sin inferencia remota, nunca
Cómo funciona
En la primera ejecución, Budgie descarga Qwen3 1.7B Q4 y un modelo de embedding Nomic de 768 dimensiones desde el hub de Hugging Face. Ambos se almacenan en el sandbox de tu app. Para cada nueva transacción, el modelo de embedding se ejecuta primero — si existe un vecino más cercano sólido en tu historial, el resultado es instantáneo. Si no, Qwen3 1.7B genera una sugerencia. Tu respuesta (aceptar, editar o rechazar) se retroalimenta en el índice de embedding sin ninguna llamada de red.
Preguntas Frecuentes
¿La IA funciona sin conexión?
¿Cuánto pesa la descarga del modelo?
¿Puedo corregir las sugerencias de la IA?
¿Budgie usa OpenAI o algún LLM en la nube?
Funciones relacionadas
Leer más en el blog
¿Listo para probar Budgie?
Únete a la lista de espera: sé el primero en probar el rastreador de gastos offline-first.