Production Agentic AI

Bir agent'ı demoda çalıştırmak kolay. Bütçeyi yakmadan ve doğru olmayan şeyler söylemeden bütün ay çalıştırmak — asıl iş o, ve benim yaptığım kısım da o.

Beni ne zaman ararsınız

Agent prototipi demoda iyi görünüyor ama production'da LLM faturası tırmanıyor ve hangi çağrının parasını hak ettiğini kimse söyleyemiyor.
Doğru aracı güvenilir biçimde seçen bir tool-calling sistemi lazım — beşte dört kez tutturan bir prompt değil.
Agent ara sıra düpedüz yanlış şeyler iddia ediyor ve sizin alanınızda "ara sıra" bile fazla.
Ekip haftalardır aynı güvenilirlik sorununun etrafında dönüyor ve bu dersin parasını zaten ödemiş birine ihtiyaç var.

Ne yapıyorum

Bütçe zarfları — her agent çalışmasına kodda zorlanan sert bir maliyet tavanı; prompt'a yazılıp dua edilen değil.
Retry ve fallback zincirleri — önce ucuz model, güven düşünce yükseltme, sonsuz döngü yerine tanımlı bir durma noktası.
Adaptif derinlik — basit istekler kısa yoldan gidiyor; pahalı muhakeme döngüsü onu hak eden sorgulara saklanıyor.
Model katmanlama — görev profiline göre model boyutları arasında yönlendirme; maliyet farkı tahminle değil, görev başına ölçülerek.
Doğrulama katmanları — iddialar kullanıcıya ulaşmadan önce kaynaklarla karşılaştırılıyor.

Sıfat değil, sayı

Nova'nın agentic tool-selection sistemi taşıdığı yük için ayda yaklaşık 4.000 dolardan başladı. Bütçe zarfları, model katmanlama ve adaptif derinlikten sonra aynı yük yaklaşık 40 dolara çalıştı. Bu bir makaledeki benchmark değil — düşüşünü kendi gözümle izlediğim bir production faturası.

Saha notları

Ayda 4.000 dolardan 40 dolara: agent guardrail'lerinin gerçek maliyet eğrisiHer optimizasyon katmanı, sayılarıyla birlikte.Agentic AI guardrail'leri: while(true) döngüsünü token bütçeni yakmasından durdurmakAncak demodan sonra ortaya çıkan hata türleri.Bir LLM'in siyasi pozisyon halüsine ettiği hafta — ve bir gazetecinin az kalsın bunu alıntılayacağıDoğrulamayı neden bir temenni değil, bir katman olarak ele aldığım.

Nereden başlarız

Discovery, bir-iki hafta, sabit ücret: mevcut agent'ınızı inceliyorum — çağrı izleri, prompt mimarisi, görev başına maliyet — karşılığında bir maliyet projeksiyonu ve somut bir plan alıyorsunuz. Dürüst bulgu "aslında agent'a ihtiyacınız yok" ise, o da dokümana giriyor.

Agent'ınızı anlatın