Cloud-Kostenoptimierung: 10 Strategien, die Unternehmen 30 %+ sparen

In den meisten Unternehmen sind die Cloud-Ausgaben außer Kontrolle. Gartner schätzt, dass Organisationen 25–35 % ihres Cloud-Budgets verschwenden — für ungenutzte, überdimensionierte oder schlecht architekturierte Ressourcen. Das ist kein Rundungsfehler: Bei einem Unternehmen, das EUR 2 Millionen pro Jahr für Azure oder AWS ausgibt, sind das EUR 500.000–700.000, die zwei Engineering-Teams finanzieren könnten.

Die gute Nachricht: Cloud-Kostenoptimierung ist ein lösbares Problem. Die folgenden zehn Strategien sind erprobt, praxistauglich und anwendbar auf jedes Unternehmen, das Azure, AWS oder GCP nutzt. Sie sind nach Umsetzungsgeschwindigkeit sortiert — von den schnellsten Gewinnen bis zu strukturelleren Veränderungen.

Strategie 1: Tagging-Richtlinie implementieren und durchsetzen

Man kann nicht optimieren, was man nicht sieht. Tagging ist das Fundament jedes Kostenmanagements.

Minimum erforderliche Tags

CostCenter — ordnet Cloud-Ausgaben internen Kostenstellen zu für Chargeback/Showback
Owner — die verantwortliche Person oder das Team
Environment — Produktion, Staging, Entwicklung, Sandbox
Application — welcher Workload oder Service die Ressource nutzt
DataClassification — Öffentlich, Intern, Vertraulich, Eingeschränkt

Durchsetzung

In Azure verwenden Sie Azure Policy mit Deny-Effekt, um Ressourcenerstellung ohne Pflicht-Tags zu verhindern
In AWS verwenden Sie Service Control Policies (SCPs) und AWS Config Rules
Auditieren Sie bestehende ungetaggte Ressourcen und beheben Sie die Lücken. Die meisten Unternehmen stellen beim ersten Audit fest, dass 30–50 % der Ressourcen ungetaggt oder falsch getaggt sind

Nüchtern betrachtet: Tagging allein spart kein Geld. Aber ohne Tagging operieren alle anderen Strategien auf dieser Liste im Blindflug. Investieren Sie zwei Wochen in sauberes Tagging, bevor Sie anderes angehen.

Strategie 2: Virtuelle Maschinen und Datenbanken richtig dimensionieren

Right-Sizing ist die Einzelmaßnahme mit dem höchsten Impact bei geringstem Aufwand. Die meisten Unternehmen überprovisionieren um 40–60 %, weil jemand die Serverdimensionierung auf Basis von Spitzenlastschätzungen festgelegt hat, die nie eingetreten sind.

So geht Right-Sizing

Auslastungsdaten sammeln über mindestens 14 Tage (30 Tage sind besser). Nutzen Sie Azure Monitor, AWS CloudWatch oder Drittanbieter-Tools wie Spot by NetApp oder Datadog
Kandidaten identifizieren: Jede VM oder Datenbank, die konstant unter 40 % CPU und 60 % Speicherauslastung liegt, ist ein Right-Sizing-Kandidat
Verkleinern, nicht neu aufbauen. Die meisten Cloud-VMs können mit einem kurzen Neustart in-place skaliert werden. Planen Sie Verkleinerungen in Wartungsfenstern
Vierteljährlich wiederholen. Lastmuster ändern sich. Right-Sizing ist keine Einmalaktion

Azure-spezifische Tipps

Azure Advisor liefert kostenlose Right-Sizing-Empfehlungen. Wöchentlich prüfen
Erwägen Sie B-Series-VMs für Workloads mit variablem CPU-Bedarf — sie sammeln CPU-Credits in Leerlaufphasen und bursten bei Bedarf
Für Azure SQL nutzen Sie Elastic Pools, um DTUs/vCores über Datenbanken mit komplementären Nutzungsmustern zu teilen

Typische Einsparungen

Erwarten Sie 20–40 % Compute-Kostenreduktion durch eine erste Right-Sizing-Runde. Diese Strategie hat das beste Aufwand-zu-Ersparnis-Verhältnis.

Strategie 3: Reservierte Instanzen und Savings Plans nutzen

Wenn Sie wissen, dass ein Workload 1–3 Jahre laufen wird (und die meisten Produktions-Workloads tun das), zahlen Sie weniger durch Commitment.

Azure

Azure Reservations: Commitment für 1-Jahres- oder 3-Jahres-Laufzeiten für VMs, Azure SQL, Cosmos DB und andere Dienste. Ersparnis: 30–72 % je nach Laufzeit und VM-Familie
Azure Savings Plans: Flexibler als Reservierungen — Commitment auf einen Dollar-pro-Stunde-Betrag über Compute-Dienste hinweg. Der Rabatt wird automatisch auf die bestpassenden Ressourcen angewendet

AWS

Reserved Instances (RIs): Standard und Convertible, 1- oder 3-Jahres-Laufzeiten
Savings Plans: Compute Savings Plans (am flexibelsten) und EC2 Instance Savings Plans

Best Practices

Starten Sie mit Produktions-Workloads, die stabile, vorhersagbare Auslastung haben
Erst Right-Sizing, dann reservieren. Eine 3-Jahres-Reservierung für eine überdimensionierte VM zementiert Verschwendung
Nutzen Sie Reservation Exchanges (Azure) oder Convertible RIs (AWS) für Flexibilität bei Workload-Änderungen
Decken Sie 60–70 % Ihres Steady-State-Compute mit Reservierungen ab, den Rest für On-Demand und Spot

Strategie 4: Spot- und Preemptible-Instanzen nutzen

Spot-Instanzen (Azure Spot VMs, AWS Spot Instances, GCP Preemptible VMs) bieten 60–90 % Rabatt für Workloads, die Unterbrechungen tolerieren.

Geeignete Kandidaten für Spot

Batch-Verarbeitung (Datenpipelines, Video-Rendering, wissenschaftliche Berechnungen)
CI/CD-Build-Agents — wenn ein Build unterbrochen wird, starten Sie ihn einfach neu
Dev/Test-Umgebungen — Nicht-Produktions-Workloads, die keine 100 % Verfügbarkeit erfordern
Kubernetes-Node-Pools — nicht-kritische Pods auf Spot-Nodes mit entsprechenden Pod Disruption Budgets

Implementierungstipps

Definieren Sie immer eine Fallback-Strategie: Bei Rücknahme der Spot-Kapazität automatisch auf On-Demand-Instanzen zurückfallen
Verwenden Sie mehrere VM-Größen in Ihrer Spot-Konfiguration, um die Verfügbarkeit über verschiedene Hardware-Pools zu erhöhen
Überwachen Sie Spot-Preise und Eviction-Raten — AWS Spot Advisor und Azure Spot Pricing History helfen dabei

Strategie 5: Nicht-Produktions-Ressourcen außerhalb der Arbeitszeit herunterfahren

Dev-, Test- und Staging-Umgebungen, die 24/7 laufen, aber nur 10 Stunden am Tag, 5 Tage die Woche genutzt werden, verschwenden 70 % ihrer Kosten.

Automatisierungsoptionen

Azure: Azure Automation, Azure DevTest Labs Auto-Shutdown oder die Start/Stop VMs v2 Lösung
AWS: AWS Instance Scheduler oder Lambda-Funktionen, getriggert durch EventBridge
Cloud-übergreifend: Terraform oder Pulumi mit geplanter Pipeline oder ein FinOps-Tool wie Spot.io oder CloudHealth

Was herunterfahren?

Entwicklungs- und Test-VMs
Nicht-Produktions-Kubernetes-Cluster (oder Node-Pools auf null skalieren)
Nicht-Produktions-Datenbanken (erwägen Sie Serverless-Tiers, die auto-pausieren, wie Azure SQL Serverless)
Sandbox- und Demo-Umgebungen

Schnelle Rechnung: Eine D4s_v5 VM in West Europe kostet ca. EUR 140/Monat bei 24/7-Betrieb. Herunterfahren außerhalb der Geschäftszeiten spart EUR 98/Monat — pro VM. Multipliziert mit 50 Dev-VMs sind das EUR 4.900/Monat.

Strategie 6: Verwaiste und ungenutzte Ressourcen eliminieren

Cloud-Landschaften sammeln Müll wie Dachböden Gerümpel. Ressourcen werden für ein Projekt angelegt, das Projekt endet, und niemand löscht die Ressourcen.

Häufige verwaiste Ressourcen

Nicht angehängte Disks: Managed Disks, die keiner VM zugeordnet sind (Azure Advisor markiert diese)
Ungenutzte öffentliche IP-Adressen: Statische IPs, die allokiert, aber keiner Ressource zugeordnet sind — sie verursachen trotzdem Kosten
Alte Snapshots: VM- und Disk-Snapshots von vor Monaten oder Jahren, die für Recovery nicht mehr benötigt werden
Leere Ressourcengruppen oder ungenutzte Load Balancer
Idle Application Gateways und VPN Gateways — diese haben signifikante Stundenkosten, auch im Leerlauf

Bereinigungsprozess

Bericht über alle Ressourcen mit null oder nahezu null Auslastung in den letzten 30 Tagen erstellen
Über Tags mit Verantwortlichen abgleichen (deshalb ist Strategie 1 so wichtig)
Verantwortliche mit 14-tägiger Frist benachrichtigen
Ressourcen, die nicht beansprucht werden, löschen oder deallokieren

Erwarten Sie 5–10 % Kostenreduktion durch den ersten Bereinigungszyklus.

Strategie 7: Storage-Kosten optimieren

Storage ist oft die zweitgrößte Cloud-Kostenkategorie und die am meisten vernachlässigte.

Tiering

Hot → Cool → Cold → Archive: Daten basierend auf Zugriffshäufigkeit auf günstigere Tiers verschieben. In Azure Blob Storage automatisieren Lifecycle-Management-Richtlinien dies
Intelligent Tiering (AWS S3 Intelligent-Tiering) verschiebt Objekte automatisch zwischen Tiers basierend auf Zugriffsmustern
Archive-Tier kostet 90 %+ weniger als Hot Storage, hat aber höhere Abrufkosten und Latenz. Für Compliance-Daten, alte Backups und Audit-Logs nutzen

Weitere Storage-Einsparungen

Alte Backups und Snapshots löschen, die Ihre Aufbewahrungsrichtlinie überschreiten
Daten vor der Speicherung komprimieren — besonders Logs und Telemetriedaten
Reserved Capacity nutzen für Azure Blob Storage oder S3 bei großen, vorhersagbaren Speichervolumina (1- oder 3-Jahres-Commitments, 20–38 % Ersparnis)
Redundanzstufen prüfen: Nicht jedes Storage Account braucht GRS (georedundanter Speicher). Dev/Test-Daten können LRS (lokal redundanter Speicher) zum halben Preis nutzen

Strategie 8: Serverless und PaaS gezielt einsetzen

Serverless- und PaaS-Dienste berechnen den tatsächlichen Verbrauch statt der provisionierten Kapazität und eliminieren damit Leerlauf-Verschwendung.

Kandidaten für Serverless/PaaS-Migration

API-Backends: Von VMs mit Nginx + Node.js auf Azure Functions oder AWS Lambda migrieren
Datenbanken: Von selbst verwaltetem SQL auf VMs auf Azure SQL Serverless, Aurora Serverless oder Cosmos DB Serverless umsteigen
Event-Verarbeitung: Dauerhaft laufende Consumer-Dienste durch Azure Event Grid oder AWS EventBridge + Lambda ersetzen
Container: Azure Container Apps oder AWS Fargate statt eigenem Kubernetes-Cluster verwenden (für einfachere Workloads)

Wann NICHT Serverless

Workloads mit anhaltend hohem, vorhersagbarem Durchsatz — Serverless kann bei Skalierung teurer sein
Anwendungen, die langläufige Prozesse erfordern (>15 Minuten für Lambda, >30 Minuten für Azure Functions im Consumption Plan)
Workloads mit strikten Cold-Start-Latenzanforderungen

Strategie 9: Eine FinOps-Praxis etablieren

FinOps ist das Operating-Modell, das Kostenoptimierung nachhaltig macht. Ohne FinOps erodieren die Einsparungen aus den Strategien 1–8 innerhalb von 6 Monaten, wenn neue Ressourcen undiszipliniert deployed werden.

FinOps-Kernfähigkeiten

Kostentransparenz: Dashboards, die Ausgaben nach Team, Anwendung und Umgebung zeigen. Täglich aktualisiert
Budgets und Alerts: Monatliche Budgets pro Subscription/Account setzen und bei 80 % und 100 % alarmieren
Anomalieerkennung: Azure Cost Management Anomaly Alerts oder AWS Cost Anomaly Detection nutzen, um unerwartete Spitzen innerhalb von Stunden zu erkennen — nicht erst am Monatsende
Chargeback/Showback: Kosten den Geschäftsbereichen zuordnen, damit diese die finanziellen Auswirkungen ihrer Architekturentscheidungen verstehen
Governance: Richtlinien, die Tagging erzwingen, teure VM-Familien in Dev-Umgebungen einschränken und Genehmigungen für große Ressourcen-Deployments erfordern

FinOps-Teamstruktur

Sie brauchen kein großes Team. Starten Sie mit:

Einem FinOps-Lead, der die Praxis verantwortet, Dashboards baut und den Optimierungsrhythmus steuert
Engineering-Champions in jedem Team, die monatlich die Cloud-Ausgaben ihres Teams prüfen
Einem monatlichen FinOps-Review, bei dem die Top-5-Kostenanomalien und Top-5-Optimierungsmöglichkeiten mit der Führung besprochen werden

Tools

Azure Cost Management + Billing (integriert, keine Zusatzkosten)
AWS Cost Explorer + Cost Anomaly Detection (integriert)
Drittanbieter: Spot by NetApp, CloudHealth by VMware, Apptio Cloudability, Infracost (für Terraform-Kostenschätzung zum Planungszeitpunkt)

Strategie 10: Azure Advisor und AWS Trusted Advisor konsequent nutzen

Diese kostenlosen, integrierten Tools liefern personalisierte Empfehlungen basierend auf Ihrer tatsächlichen Nutzung. Die meisten Unternehmen ignorieren sie.

Azure Advisor Kategorien

Kosten: Right-Sizing, Reservierungsempfehlungen, Identifikation ungenutzter Ressourcen
Sicherheit: Fehlende Sicherheitskonfigurationen, MFA-Lücken
Zuverlässigkeit: Availability-Zone-Abdeckung, Backup-Lücken
Leistung: Unterperformende Ressourcen, Caching-Möglichkeiten
Operational Excellence: Diagnoseeinstellungen, Policy-Compliance

Implementierungsprozess

Advisor wöchentlich prüfen — weisen Sie dies Ihrem FinOps-Lead oder einem rotierenden Teammitglied zu
Empfehlungen triagieren in sofort (diese Woche umsetzen), geplant (nächster Sprint) und zurückgestellt (für später tracken)
Wo möglich automatisieren: Einige Advisor-Empfehlungen können über Azure Automation oder Logic Apps automatisch umgesetzt werden
Umsetzungsrate tracken: Streben Sie an, dass 80 %+ der Kostenempfehlungen innerhalb von 30 Tagen umgesetzt werden

Alles zusammen: Das 30-%-Sparziel

Strategie	Typische Einsparung	Aufwand
Tagging-Richtlinie	Ermöglicht alles andere	Niedrig
Right-Sizing	20–40 % auf Compute	Niedrig
Reservierte Instanzen / Savings Plans	30–72 % auf committed Compute	Mittel
Spot-Instanzen	60–90 % auf geeignete Workloads	Mittel
Non-Prod nach Feierabend herunterfahren	70 % auf Non-Prod Compute	Niedrig
Verwaiste Ressourcen bereinigen	5–10 % gesamt	Niedrig
Storage-Optimierung	20–50 % auf Storage	Mittel
Serverless/PaaS-Adoption	Variabel (20–60 %)	Hoch
FinOps-Praxis	Sichert alle Einsparungen	Mittel
Advisor-Empfehlungen	5–15 % inkrementell	Niedrig

Zusammen angewendet liefern diese Strategien konsistent 30–50 % Reduktion der gesamten Cloud-Ausgaben. Der Schlüssel liegt darin, sie systematisch umzusetzen — nicht als einmalige Sparmaßnahme.

Wie CC Conceptualise unterstützt

Wir helfen Unternehmen, FinOps-Praktiken zu implementieren und Cloud-Kostenoptimierung von der Analyse bis zur nachhaltigen Governance umzusetzen. Unsere Berater arbeiten direkt in Ihrer Azure- oder AWS-Umgebung, identifizieren Verschwendung, setzen Änderungen um und bauen die Dashboards und Prozesse, die Einsparungen dauerhaft sichern.

Kontaktieren Sie uns für ein Cloud-Cost-Assessment. Die meisten Kunden sehen innerhalb der ersten zwei Wochen einen klaren Weg zu 30 %+ Ersparnis.