Autonome KI-Agenten auf Azure bauen: Muster, Guardrails und wann man es lassen sollte
Drei produktionsreife KI-Agent-Muster auf Azure — Single-Agent, Multi-Agent-Orchestrierung und Human-in-the-Loop — mit Guardrails für Kosten, Sicherheit und Governance.
KI-Agenten sind das meistgehypte und am wenigsten durchkonstruierte Muster in der Enterprise-KI. Die Demos sind beeindruckend. Die Produktionsrealität ist anders: unvorhersagbare Kosten, Halluzinations-getriebene Fehler und Sicherheitsrisiken, die traditionelle Software nicht hat.
Dieser Beitrag schneidet durch den Hype. Er beschreibt drei Agent-Muster, die tatsächlich in Produktion funktionieren, die Guardrails, die sie enterprise-sicher machen, und — entscheidend — wann man Agenten überhaupt nicht verwenden sollte.
Wann Agenten Mehrwert schaffen (und wann nicht)
Agenten verwenden wenn:
- Die Aufgabe dynamische Planung erfordert — die Schritte sind nicht vorab bekannt
- Die Aufgabe mehrere Tools umfasst, die basierend auf Kontext ausgewählt werden müssen
- Iteration und Selbstkorrektur wertvoll sind
- Die Kosten menschlicher Ausführung hoch sind relativ zu den Kosten von Agentenfehlern
Keine Agenten verwenden wenn:
- Der Workflow deterministisch ist — Nutzen Sie eine Pipeline (Durable Functions, Logic Apps)
- Einfaches Retrieval ausreicht — Nutzen Sie RAG
- Latenz wichtig ist — Agent-Planungsschleifen fügen 2-10 Sekunden pro Schritt hinzu
- Genauigkeit 100% sein muss — Agenten halluzinieren
Muster 1: Single Agent mit Tools
Implementierung mit Semantic Kernel
var kernel = Kernel.CreateBuilder()
.AddAzureOpenAIChatCompletion(
deploymentName: "gpt-4o",
endpoint: config["AzureOpenAI:Endpoint"],
apiKey: config["AzureOpenAI:Key"])
.Build();
kernel.Plugins.AddFromType<OrderPlugin>();
kernel.Plugins.AddFromType<InventoryPlugin>();
var agent = new ChatCompletionAgent
{
Name = "OrderAssistant",
Instructions = """
Sie sind ein Auftragsmanagement-Assistent.
Verifizieren Sie immer Daten vor Änderungen.
Geben Sie niemals interne Preis- oder Margendaten preis.
""",
Kernel = kernel,
Arguments = new KernelArguments(
new OpenAIPromptExecutionSettings
{
ToolCallBehavior = ToolCallBehavior.AutoInvokeKernelFunctions
})
};Einsatz: Interne Tools, Kundensupport-Assistenten, Datenexploration per natürlicher Sprache.
Muster 2: Multi-Agent-Orchestrierung
Mehrere spezialisierte Agenten arbeiten an einer komplexen Aufgabe zusammen. Jeder Agent hat eigene Tools und Expertise.
Einsatz: Berichtsgenerierung, Code Review mit getrennten Qualitäts- und Sicherheitsprüfungen, komplexe Recherche-Aufgaben.
Muster 3: Human-in-the-Loop
Der Agent arbeitet autonom bei risikoarmen Schritten, fordert aber menschliche Genehmigung für High-Impact-Aktionen an.
Guardrails für Enterprise-Agenten
Kostenkontrolle
public sealed class CostGuardrail : IAgentMiddleware
{
private readonly decimal _maxCostPerSession = 5.00m;
private decimal _sessionCost = 0;
public async Task OnToolCall(ToolCallContext context)
{
_sessionCost += EstimateTokenCost(context);
if (_sessionCost > _maxCostPerSession)
context.Cancel("Sitzungskostenlimit überschritten.");
}
}Content Safety
- Input-Filterung — Azure AI Content Safety gegen Prompt Injection und schädliche Inhalte
- Output-Filterung — Validierung, dass Agent-Antworten keine internen Daten oder PII enthalten
- Tool-Input-Validierung — LLM-generierten Tool-Parametern niemals vertrauen
Audit Logging
Jede Agent-Aktion protokollieren: Session-ID, Benutzer, Aktion, Input, Output, Token-Kosten, Latenz.
Iterationslimits
Immer maximale Iterationszahlen setzen. Ein Agent ohne Limits kann endlos loopen und Tokens verbrauchen.
Deployment auf Azure
- Azure Container Apps -- Scale-to-Zero fuer Agent-Workloads
- Azure OpenAI -- Managed LLM-Endpoints mit integrierter Content-Filterung
- Azure Service Bus -- Fuer Human-in-the-Loop-Genehmigungsqueues
- Application Insights -- Tracing von Agent-Ausfuehrungspfaden und Token-Verbrauch
- Azure Key Vault -- API Keys und Connection Strings fuer Agent-Tools
Bereit, produktionsreife KI-Agenten auf Azure zu bauen? Kontaktieren Sie uns — wir helfen Unternehmen, Agent-Muster mit den Guardrails zu implementieren, die Produktion erfordert.
Themen