Logo Budgie
Budgie

Catégorisation automatique par IA sur l’appareil

Deux modèles sur l'appareil — Qwen3 1.7B pour la conversation et un modèle d'embedding Nomic à 768 dimensions — catégorisent les transactions, suggèrent des étiquettes et apprennent de vos corrections. Vos relevés ne quittent jamais le téléphone.

Pourquoi l'IA sur l'appareil est la seule IA qui protège vos relevés

Les applications de budget « IA » cloud transmettent chaque chaîne de commerçant à un LLM distant, ce qui signifie souvent qu'OpenAI voit vos habitudes de supermarché. Budgie charge les deux modèles une seule fois, puis garde chaque inférence locale — même précision, zéro exfiltration de données.

Le pipeline en deux étapes exécute d'abord la recherche par embedding pour une catégorisation instantanée du plus proche voisin depuis votre propre historique, puis se replie sur Qwen3 1.7B pour les nouvelles transactions que l'index d'embedding n'a pas encore vues. Chaque suggestion acceptée ou modifiée met à jour immédiatement l'index à 768 dimensions — la précision s'améliore au fil du temps.

Pipeline de catégorisation en deux étapes

Recherche d'embedding — le modèle Nomic 768 dimensions trouve la transaction historique la plus proche instantanément via la recherche SIMD sqlite-vec

Repli sur le LLM — Qwen3 1.7B Q4 gère les nouvelles transactions que l'index d'embedding n'a pas vues, proposant catégorie et étiquettes à partir du contexte

Boucle de correction — chaque suggestion acceptée ou modifiée met à jour l'index d'embedding immédiatement pour que la prochaine transaction similaire soit plus proche sans ré-entraînement

Ce que vous obtenez

Le modèle Qwen3 1.7B Q4 fonctionne entièrement sur votre téléphone après un téléchargement unique

Modèle d'embedding Nomic 768 dimensions + sqlite-vec pour recherche de similarité accélérée par SIMD

Deux signaux complémentaires : recherche vectorielle sur votre historique plus une suggestion de LLM génératif

Chaque correction met à jour l'index d'embedding instantanément — la précision s'améliore au fil de l'utilisation

Les relevés ne quittent jamais l'appareil — sans OpenAI, sans inférence distante, jamais

Comment ça fonctionne

Au premier lancement, Budgie télécharge Qwen3 1.7B Q4 et un modèle d'embedding Nomic à 768 dimensions depuis le hub Hugging Face. Les deux sont stockés dans votre sandbox d'application. Pour chaque nouvelle transaction, le modèle d'embedding s'exécute en premier — si un voisin le plus proche fort existe dans votre historique, le résultat est instantané. Sinon, Qwen3 1.7B génère une suggestion. Votre réponse (accepter, modifier ou rejeter) est réintégrée dans l'index d'embedding sans aucun appel réseau.

Foire aux questions

L'IA fonctionne-t-elle hors ligne ?
Oui. Les deux modèles vivent sur votre appareil après le téléchargement unique. La catégorisation s'exécute que vous soyez en ligne ou non.
Quelle est la taille du téléchargement du modèle ?
Environ 1 Go combiné : Qwen3 1.7B Q4 pour le modèle de langage et un modèle d'embedding Nomic à 768 dimensions. Le téléchargement se produit lors de la première utilisation des fonctionnalités IA et est entièrement optionnel — vous pouvez continuer à utiliser Budgie sans IA.
Puis-je corriger les suggestions de l’IA ?
Toujours. Chaque transaction vous permet d'accepter, modifier ou rejeter la suggestion. Vos corrections alimentent immédiatement l'index d'embedding 768 dimensions pour que la prochaine transaction similaire soit plus proche de la bonne catégorie.
Budgie utilise-t-il OpenAI ou un LLM cloud ?
Non. L’inférence utilise ONNX Runtime localement. Il n’y a pas de recours à un modèle cloud et aucune télémétrie sur vos transactions.

Prêt à essayer Budgie ?

Rejoignez la liste d'attente — soyez le premier à essayer le gestionnaire de dépenses hors ligne.