Auf-Gerät-KI-Auto-Kategorisierung
Zwei geräteeigene Modelle – Qwen3 1.7B für Chat und ein 768-dim Nomic-Embedding-Modell – kategorisieren Transaktionen, schlagen Tags vor und lernen aus Ihren Korrekturen. Ihre Kontoauszüge verlassen das Smartphone nie.
Warum KI auf dem Gerät die einzige KI ist, die Ihre Kontoauszüge schützt
Cloud-„KI“-Haushaltsapps streamen jeden Händlerstring an ein Remote-LLM, was oft bedeutet, dass OpenAI Ihre Supermarktgewohnheiten sieht. Budgie lädt beide Modelle einmalig und hält jede Inferenz lokal – gleiche Genauigkeit, null Datenexfiltration.
Die zweistufige Pipeline führt zuerst den Embedding-Lookup für sofortige Nächster-Nachbar-Kategorisierung aus Ihrer eigenen Historie durch, und fällt dann auf Qwen3 1.7B für neue Transaktionen zurück, die der Embedding-Index noch nicht gesehen hat. Jeder akzeptierte oder bearbeitete Vorschlag aktualisiert den 768-dim Index sofort – die Genauigkeit steigt im Laufe der Zeit.
Zweistufiger Kategorisierungsablauf
Embedding-Lookup – das 768-dim Nomic-Modell findet die nächste historische Transaktion sofort über sqlite-vec SIMD-Suche
LLM-Fallback – Qwen3 1.7B Q4 behandelt neue Transaktionen, die der Embedding-Index noch nicht gesehen hat, und schlägt Kategorie und Tags aus dem Kontext vor
Korrekturschleife – jeder akzeptierte oder bearbeitete Vorschlag aktualisiert den Embedding-Index sofort, sodass die nächste ähnliche Transaktion ohne erneutes Training näher landet
Was Sie erhalten
Qwen3 1,7B Q4-Modell läuft nach einem einmaligen Download vollständig auf Ihrem Telefon
768-dim Nomic-Embedding-Modell + sqlite-vec für SIMD-beschleunigte Ähnlichkeitssuche
Zwei komplementäre Signale: Vektor-Lookup über Ihre Historie plus ein generativer LLM-Vorschlag
Jede Korrektur aktualisiert den Embedding-Index sofort – die Genauigkeit verbessert sich mit der Nutzung
Kontoauszüge verlassen das Gerät nie – kein OpenAI, keine externe Inferenz, jemals
Wie es funktioniert
Beim ersten Start lädt Budgie Qwen3 1.7B Q4 und ein 768-dim Nomic-Embedding-Modell vom Hugging Face Hub herunter. Beide werden in Ihrer App-Sandbox gespeichert. Für jede neue Transaktion läuft zuerst das Embedding-Modell – wenn ein starker nächster Nachbar in Ihrer Historie vorhanden ist, ist das Ergebnis sofort. Andernfalls generiert Qwen3 1.7B einen Vorschlag. Ihre Antwort (akzeptieren, bearbeiten oder ablehnen) fließt ohne Netzwerkaufruf in den Embedding-Index zurück.
Häufig gestellte Fragen
Funktioniert die KI offline?
Wie groß ist der Modell-Download?
Kann ich die Vorschläge der KI korrigieren?
Verwendet Budgie OpenAI oder ein Cloud-LLM?
Verwandte Funktionen
Mehr im Blog lesen
Bereit, Budgie auszuprobieren?
Auf die Warteliste setzen – als Erster den Offline-First-Ausgabentracker ausprobieren.