KI
Verbrauchskontrolle
Begrenze Nutzung und Kosten von KI-Agenten – pro Agent, pro Nutzer, pro Organisation. Verhindert Rechnungsüberraschungen und steuert, wohin das KI-Budget wirklich fließt.
Aktualisiert am 18. Mai 2026
Konfiguration · KI · 8.4
Die Verbrauchskontrolle deckelt die KI-Nutzung in Gfacility – pro Agent, pro Nutzer, pro Organisation oder pro Monat. KI-Kosten sind variabel; ohne Limits kann ein durchgedrehter Agent oder ein begeisterter Nutzer dein KI-Budget in einer Woche aufzehren. Hier setzt du die Grenzen, die das System selbst durchsetzt.
Warum das für das Business wichtig ist
„KI-Rechnung 3× so hoch wie erwartet"
Monatsbudget pro Tenant → harter Deckel verhindert das Runaway-Szenario.
„Ein Nutzer verbraucht alles"
Limit pro Nutzer → faire Verteilung, kein Monopol einzelner Nutzer.
„Pilot und Produktion gleiches Kontingent"
Unterschiedliche Limits pro Agent – experimenteller Agent klein, Produktivagent großzügig.
„Keine Transparenz, wohin das Geld geht"
Verbrauchs-Dashboard pro Agent/Nutzer → Entscheidungen auf Zahlen, nicht aus dem Bauch.
Limit-Ebenen
Tenant
Monatsbudget für die gesamte Organisation. Harter Deckel; bei Überschreitung pausieren alle Agenten.
Agent
Limit pro KI-Agent – jeder Agent erhält sein eigenes Budget innerhalb des Tenant-Totals.
Nutzer
Maximale Anfragen pro Nutzer pro Tag/Woche. Verhindert, dass eine Person unverhältnismäßig viel verbraucht.
Organisation / Abteilung
Multi-Tenant oder Verrechnung? Budget pro Abteilung – Aufschlüsselung für das Finanzwesen.
Was du pro Limit einstellst
| Feld | Beispiel |
|---|---|
| Einheit | Anfragen · Input-Tokens · Output-Tokens · Euro. |
| Zeitraum | Tag · Woche · Monat · Kalendermonat. Automatischer Reset. |
| Harter / weicher Deckel | Hart = sofort stoppen; weich = warnen, aber durchlassen. |
| Alarmschwellen | Bei 50 %, 80 %, 100 % – Benachrichtigung an Admin. |
| Verhalten bei Überschreitung | Agent pausieren · Freigabe anfordern · an Mensch weiterleiten. |
Welche Entscheidungen triffst du?
Monatsbudget Tenant
Konservativ starten, anhand realer Nutzung skalieren. Erst 3 Monate messen, dann Budget fixieren.
Hart vs. weich
Produktivagenten hart (bekanntes Verhalten); experimentelle weich (laufen lassen, lernen).
Verrechnung pro Abteilung?
Multi-Org und Verrechnung aktiv? Budget pro Abteilung mit Monatsbericht – speist den Finanz-Export.
Alarmrouten
Wer erhält die 80-%-Warnung? IT-Plattform-Admin + KI-Owner + Finance.