Catégorisation automatique par IA sur l’appareil
Deux modèles sur l'appareil — Qwen3 1.7B pour la conversation et un modèle d'embedding Nomic à 768 dimensions — catégorisent les transactions, suggèrent des étiquettes et apprennent de vos corrections. Vos relevés ne quittent jamais le téléphone.
Pourquoi l'IA sur l'appareil est la seule IA qui protège vos relevés
Les applications de budget « IA » cloud transmettent chaque chaîne de commerçant à un LLM distant, ce qui signifie souvent qu'OpenAI voit vos habitudes de supermarché. Budgie charge les deux modèles une seule fois, puis garde chaque inférence locale — même précision, zéro exfiltration de données.
Le pipeline en deux étapes exécute d'abord la recherche par embedding pour une catégorisation instantanée du plus proche voisin depuis votre propre historique, puis se replie sur Qwen3 1.7B pour les nouvelles transactions que l'index d'embedding n'a pas encore vues. Chaque suggestion acceptée ou modifiée met à jour immédiatement l'index à 768 dimensions — la précision s'améliore au fil du temps.
Pipeline de catégorisation en deux étapes
Recherche d'embedding — le modèle Nomic 768 dimensions trouve la transaction historique la plus proche instantanément via la recherche SIMD sqlite-vec
Repli sur le LLM — Qwen3 1.7B Q4 gère les nouvelles transactions que l'index d'embedding n'a pas vues, proposant catégorie et étiquettes à partir du contexte
Boucle de correction — chaque suggestion acceptée ou modifiée met à jour l'index d'embedding immédiatement pour que la prochaine transaction similaire soit plus proche sans ré-entraînement
Ce que vous obtenez
Le modèle Qwen3 1.7B Q4 fonctionne entièrement sur votre téléphone après un téléchargement unique
Modèle d'embedding Nomic 768 dimensions + sqlite-vec pour recherche de similarité accélérée par SIMD
Deux signaux complémentaires : recherche vectorielle sur votre historique plus une suggestion de LLM génératif
Chaque correction met à jour l'index d'embedding instantanément — la précision s'améliore au fil de l'utilisation
Les relevés ne quittent jamais l'appareil — sans OpenAI, sans inférence distante, jamais
Comment ça fonctionne
Au premier lancement, Budgie télécharge Qwen3 1.7B Q4 et un modèle d'embedding Nomic à 768 dimensions depuis le hub Hugging Face. Les deux sont stockés dans votre sandbox d'application. Pour chaque nouvelle transaction, le modèle d'embedding s'exécute en premier — si un voisin le plus proche fort existe dans votre historique, le résultat est instantané. Sinon, Qwen3 1.7B génère une suggestion. Votre réponse (accepter, modifier ou rejeter) est réintégrée dans l'index d'embedding sans aucun appel réseau.
Foire aux questions
L'IA fonctionne-t-elle hors ligne ?
Quelle est la taille du téléchargement du modèle ?
Puis-je corriger les suggestions de l’IA ?
Budgie utilise-t-il OpenAI ou un LLM cloud ?
Fonctionnalités associées
Lire plus sur le blog
Prêt à essayer Budgie ?
Rejoignez la liste d'attente — soyez le premier à essayer le gestionnaire de dépenses hors ligne.