Agentic AI in Produktion
Einen Agenten zum Laufen für die Demo zu bringen ist leicht. Ihn einen ganzen Monat laufen zu lassen, ohne dass er das Budget verbrennt oder Dinge behauptet, die nicht stimmen — das ist die eigentliche Arbeit, und genau die mache ich.
Wann Sie mich anrufen
- Ihr Agent-Prototyp überzeugt in der Demo, aber in Produktion klettert die LLM-Rechnung, und niemand kann sagen, welche Calls ihr Geld wert sind.
- Sie brauchen Tool-Calling, das zuverlässig das richtige Werkzeug wählt — keinen Prompt, der vier von fünf Malen funktioniert.
- Der Agent behauptet gelegentlich Dinge, die schlicht falsch sind, und in Ihrer Domäne ist "gelegentlich" zu oft.
- Ihr Team kreist seit Wochen um dasselbe Zuverlässigkeitsproblem und braucht jemanden, der dieses Lehrgeld schon bezahlt hat.
Was ich mache
- Budget-Envelopes — jeder Agent-Lauf bekommt eine harte Kostengrenze, durchgesetzt im Code, nicht erhofft im Prompt.
- Retry- und Fallback-Ketten — erst das günstige Modell, Eskalation nur bei sinkender Konfidenz, ein definierter Stopp statt einer Endlosschleife.
- Adaptive Tiefe — einfache Anfragen nehmen den kurzen Weg; die teure Reasoning-Schleife bleibt den Anfragen vorbehalten, die sie verdienen.
- Model-Tiering — Routing über Modellgrößen nach Aufgabenprofil, mit pro Aufgabe gemessener statt geschätzter Kostendifferenz.
- Verifikationsschichten — Behauptungen werden gegen Quellen geprüft, bevor ein Nutzer sie je zu sehen bekommt.
Zahlen statt Adjektive
Novas Agentic-Tool-Selection-System startete bei rund 4.000 Dollar im Monat für seine Last. Nach Budget-Envelopes, Model-Tiering und adaptiver Tiefe lief dieselbe Last für etwa 40 Dollar. Das ist kein Benchmark aus einem Paper — das ist eine Produktionsrechnung, die ich habe sinken sehen.
Notizen aus der Praxis
Wo wir anfangen
Discovery, ein bis zwei Wochen zum Festpreis: Ich prüfe Ihren bestehenden Agenten — Call-Traces, Prompt-Architektur, Kosten pro Aufgabe — und Sie bekommen eine Kostenprojektion plus einen konkreten Plan. Wenn der ehrliche Befund lautet, dass Sie gar keinen Agenten brauchen, steht auch das im Dokument.