Gfacility

KI

Verbrauchskontrolle

Begrenze Nutzung und Kosten von KI-Agenten – pro Agent, pro Nutzer, pro Organisation. Verhindert Rechnungsüberraschungen und steuert, wohin das KI-Budget wirklich fließt.

Aktualisiert am 18. Mai 2026

Konfiguration · KI · 8.4

Die Verbrauchskontrolle deckelt die KI-Nutzung in Gfacility – pro Agent, pro Nutzer, pro Organisation oder pro Monat. KI-Kosten sind variabel; ohne Limits kann ein durchgedrehter Agent oder ein begeisterter Nutzer dein KI-Budget in einer Woche aufzehren. Hier setzt du die Grenzen, die das System selbst durchsetzt.

Warum das für das Business wichtig ist

„KI-Rechnung 3× so hoch wie erwartet"

Monatsbudget pro Tenant → harter Deckel verhindert das Runaway-Szenario.

„Ein Nutzer verbraucht alles"

Limit pro Nutzer → faire Verteilung, kein Monopol einzelner Nutzer.

„Pilot und Produktion gleiches Kontingent"

Unterschiedliche Limits pro Agent – experimenteller Agent klein, Produktivagent großzügig.

„Keine Transparenz, wohin das Geld geht"

Verbrauchs-Dashboard pro Agent/Nutzer → Entscheidungen auf Zahlen, nicht aus dem Bauch.

Limit-Ebenen

Tenant

Monatsbudget für die gesamte Organisation. Harter Deckel; bei Überschreitung pausieren alle Agenten.

Agent

Limit pro KI-Agent – jeder Agent erhält sein eigenes Budget innerhalb des Tenant-Totals.

Nutzer

Maximale Anfragen pro Nutzer pro Tag/Woche. Verhindert, dass eine Person unverhältnismäßig viel verbraucht.

Organisation / Abteilung

Multi-Tenant oder Verrechnung? Budget pro Abteilung – Aufschlüsselung für das Finanzwesen.

Was du pro Limit einstellst

FeldBeispiel
EinheitAnfragen · Input-Tokens · Output-Tokens · Euro.
ZeitraumTag · Woche · Monat · Kalendermonat. Automatischer Reset.
Harter / weicher DeckelHart = sofort stoppen; weich = warnen, aber durchlassen.
AlarmschwellenBei 50 %, 80 %, 100 % – Benachrichtigung an Admin.
Verhalten bei ÜberschreitungAgent pausieren · Freigabe anfordern · an Mensch weiterleiten.

Welche Entscheidungen triffst du?

Monatsbudget Tenant

Konservativ starten, anhand realer Nutzung skalieren. Erst 3 Monate messen, dann Budget fixieren.

Hart vs. weich

Produktivagenten hart (bekanntes Verhalten); experimentelle weich (laufen lassen, lernen).

Verrechnung pro Abteilung?

Multi-Org und Verrechnung aktiv? Budget pro Abteilung mit Monatsbericht – speist den Finanz-Export.

Alarmrouten

Wer erhält die 80-%-Warnung? IT-Plattform-Admin + KI-Owner + Finance.