Budgie-Logo
Budgie

Auf-Gerät-KI-Auto-Kategorisierung

Zwei geräteeigene Modelle – Qwen3 1.7B für Chat und ein 768-dim Nomic-Embedding-Modell – kategorisieren Transaktionen, schlagen Tags vor und lernen aus Ihren Korrekturen. Ihre Kontoauszüge verlassen das Smartphone nie.

Warum KI auf dem Gerät die einzige KI ist, die Ihre Kontoauszüge schützt

Cloud-„KI“-Haushaltsapps streamen jeden Händlerstring an ein Remote-LLM, was oft bedeutet, dass OpenAI Ihre Supermarktgewohnheiten sieht. Budgie lädt beide Modelle einmalig und hält jede Inferenz lokal – gleiche Genauigkeit, null Datenexfiltration.

Die zweistufige Pipeline führt zuerst den Embedding-Lookup für sofortige Nächster-Nachbar-Kategorisierung aus Ihrer eigenen Historie durch, und fällt dann auf Qwen3 1.7B für neue Transaktionen zurück, die der Embedding-Index noch nicht gesehen hat. Jeder akzeptierte oder bearbeitete Vorschlag aktualisiert den 768-dim Index sofort – die Genauigkeit steigt im Laufe der Zeit.

Zweistufiger Kategorisierungsablauf

Embedding-Lookup – das 768-dim Nomic-Modell findet die nächste historische Transaktion sofort über sqlite-vec SIMD-Suche

LLM-Fallback – Qwen3 1.7B Q4 behandelt neue Transaktionen, die der Embedding-Index noch nicht gesehen hat, und schlägt Kategorie und Tags aus dem Kontext vor

Korrekturschleife – jeder akzeptierte oder bearbeitete Vorschlag aktualisiert den Embedding-Index sofort, sodass die nächste ähnliche Transaktion ohne erneutes Training näher landet

Was Sie erhalten

Qwen3 1,7B Q4-Modell läuft nach einem einmaligen Download vollständig auf Ihrem Telefon

768-dim Nomic-Embedding-Modell + sqlite-vec für SIMD-beschleunigte Ähnlichkeitssuche

Zwei komplementäre Signale: Vektor-Lookup über Ihre Historie plus ein generativer LLM-Vorschlag

Jede Korrektur aktualisiert den Embedding-Index sofort – die Genauigkeit verbessert sich mit der Nutzung

Kontoauszüge verlassen das Gerät nie – kein OpenAI, keine externe Inferenz, jemals

Wie es funktioniert

Beim ersten Start lädt Budgie Qwen3 1.7B Q4 und ein 768-dim Nomic-Embedding-Modell vom Hugging Face Hub herunter. Beide werden in Ihrer App-Sandbox gespeichert. Für jede neue Transaktion läuft zuerst das Embedding-Modell – wenn ein starker nächster Nachbar in Ihrer Historie vorhanden ist, ist das Ergebnis sofort. Andernfalls generiert Qwen3 1.7B einen Vorschlag. Ihre Antwort (akzeptieren, bearbeiten oder ablehnen) fließt ohne Netzwerkaufruf in den Embedding-Index zurück.

Häufig gestellte Fragen

Funktioniert die KI offline?
Ja. Beide Modelle leben nach dem einmaligen Download auf Ihrem Gerät. Die Kategorisierung läuft, ob Sie online sind oder nicht.
Wie groß ist der Modell-Download?
Zusammen etwa 1 GB: Qwen3 1.7B Q4 für das Sprachmodell und ein 768-dim Nomic-Embedding-Modell. Der Download erfolgt beim ersten Gebrauch der KI-Funktionen und ist vollständig optional – Sie können Budgie weiterhin ohne KI nutzen.
Kann ich die Vorschläge der KI korrigieren?
Immer. Bei jeder Transaktion können Sie den Vorschlag akzeptieren, bearbeiten oder ablehnen. Ihre Korrekturen fließen sofort in den 768-dim Embedding-Index ein, sodass die nächste ähnliche Transaktion näher an der richtigen Kategorie landet.
Verwendet Budgie OpenAI oder ein Cloud-LLM?
Nein. Die Inferenz verwendet ONNX Runtime lokal. Es gibt keinen Fallback zu einem Cloud-Modell und keine Telemetrie über Ihre Transaktionen.

Bereit, Budgie auszuprobieren?

Auf die Warteliste setzen – als Erster den Offline-First-Ausgabentracker ausprobieren.