Categorización automática con IA en el dispositivo

Dos modelos en el dispositivo — Qwen3 1.7B para chat y un modelo de embedding Nomic de 768 dimensiones — categorizan transacciones, sugieren etiquetas y aprenden de tus correcciones. Tus extractos nunca salen del teléfono.

Por qué la IA en el dispositivo es la única IA que protege tus extractos

Las apps de presupuesto con «IA» en la nube transmiten cada cadena de comercio a un LLM remoto, lo que a menudo significa que OpenAI ve tus hábitos de supermercado. Budgie carga ambos modelos una vez, luego mantiene cada inferencia local — misma precisión, cero exfiltración de datos.

La canalización de dos etapas ejecuta primero la búsqueda de embedding para la categorización instantánea de vecino más cercano desde tu propio historial, luego recurre a Qwen3 1.7B para transacciones novedosas que el índice de embedding no ha visto antes. Cada sugerencia aceptada o editada actualiza el índice de 768 dimensiones inmediatamente — la precisión se acumula con el tiempo.

Flujo de categorización en dos etapas

Búsqueda de embedding — el modelo Nomic de 768 dimensiones encuentra la transacción histórica más cercana instantáneamente mediante búsqueda SIMD de sqlite-vec

Alternativa LLM — Qwen3 1.7B Q4 maneja transacciones nuevas que el índice de embedding no ha visto, proponiendo categoría y etiquetas desde el contexto

Bucle de corrección — cada sugerencia aceptada o editada actualiza el índice de embedding inmediatamente para que la siguiente transacción similar caiga más cerca sin necesidad de re-entrenamiento

Lo que obtienes

El modelo Qwen3 1.7B Q4 se ejecuta completamente en tu teléfono tras una descarga única

Modelo de embedding Nomic de 768 dimensiones + sqlite-vec para búsqueda de similitud acelerada con SIMD

Dos señales complementarias: búsqueda vectorial sobre tu historial más una sugerencia LLM generativa

Cada corrección actualiza el índice de embedding al instante — la precisión mejora cuanto más lo usas

Los extractos nunca salen del dispositivo: sin OpenAI, sin inferencia remota, nunca

Cómo funciona

En la primera ejecución, Budgie descarga Qwen3 1.7B Q4 y un modelo de embedding Nomic de 768 dimensiones desde el hub de Hugging Face. Ambos se almacenan en el sandbox de tu app. Para cada nueva transacción, el modelo de embedding se ejecuta primero — si existe un vecino más cercano sólido en tu historial, el resultado es instantáneo. Si no, Qwen3 1.7B genera una sugerencia. Tu respuesta (aceptar, editar o rechazar) se retroalimenta en el índice de embedding sin ninguna llamada de red.

Preguntas Frecuentes

¿La IA funciona sin conexión?
Sí. Ambos modelos viven en tu dispositivo tras la descarga de una sola vez. La categorización se ejecuta tanto si estás conectado como si no.
¿Cuánto pesa la descarga del modelo?
Aproximadamente 1 GB en total: Qwen3 1.7B Q4 para el modelo de lenguaje y un modelo de embedding Nomic de 768 dimensiones. La descarga ocurre en el primer uso de las funciones de IA y es completamente opcional — puedes seguir usando Budgie sin IA.
¿Puedo corregir las sugerencias de la IA?
Siempre. Cada transacción te permite aceptar, editar o rechazar la sugerencia. Tus correcciones se retroalimentan inmediatamente en el índice de embedding de 768 dimensiones para que la siguiente transacción similar caiga más cerca de la categoría correcta.
¿Budgie usa OpenAI o algún LLM en la nube?
No. La inferencia usa ONNX Runtime localmente. No hay fallback a un modelo en la nube ni telemetría sobre tus transacciones.

¿Listo para probar Budgie?

Únete a la lista de espera: sé el primero en probar el rastreador de gastos offline-first.