Cloud-Kostenoptimierung: 10 Strategien, die Unternehmen 30 %+ sparen
Zehn bewährte Strategien zur Cloud-Kostenoptimierung, die Unternehmen 30 % und mehr einsparen — von Reservierungen bis FinOps.
In den meisten Unternehmen sind die Cloud-Ausgaben außer Kontrolle. Gartner schätzt, dass Organisationen 25–35 % ihres Cloud-Budgets verschwenden — für ungenutzte, überdimensionierte oder schlecht architekturierte Ressourcen. Das ist kein Rundungsfehler: Bei einem Unternehmen, das EUR 2 Millionen pro Jahr für Azure oder AWS ausgibt, sind das EUR 500.000–700.000, die zwei Engineering-Teams finanzieren könnten.
Die gute Nachricht: Cloud-Kostenoptimierung ist ein lösbares Problem. Die folgenden zehn Strategien sind erprobt, praxistauglich und anwendbar auf jedes Unternehmen, das Azure, AWS oder GCP nutzt. Sie sind nach Umsetzungsgeschwindigkeit sortiert — von den schnellsten Gewinnen bis zu strukturelleren Veränderungen.
Strategie 1: Tagging-Richtlinie implementieren und durchsetzen
Man kann nicht optimieren, was man nicht sieht. Tagging ist das Fundament jedes Kostenmanagements.
Minimum erforderliche Tags
- CostCenter — ordnet Cloud-Ausgaben internen Kostenstellen zu für Chargeback/Showback
- Owner — die verantwortliche Person oder das Team
- Environment — Produktion, Staging, Entwicklung, Sandbox
- Application — welcher Workload oder Service die Ressource nutzt
- DataClassification — Öffentlich, Intern, Vertraulich, Eingeschränkt
Durchsetzung
- In Azure verwenden Sie Azure Policy mit Deny-Effekt, um Ressourcenerstellung ohne Pflicht-Tags zu verhindern
- In AWS verwenden Sie Service Control Policies (SCPs) und AWS Config Rules
- Auditieren Sie bestehende ungetaggte Ressourcen und beheben Sie die Lücken. Die meisten Unternehmen stellen beim ersten Audit fest, dass 30–50 % der Ressourcen ungetaggt oder falsch getaggt sind
Nüchtern betrachtet: Tagging allein spart kein Geld. Aber ohne Tagging operieren alle anderen Strategien auf dieser Liste im Blindflug. Investieren Sie zwei Wochen in sauberes Tagging, bevor Sie anderes angehen.
Strategie 2: Virtuelle Maschinen und Datenbanken richtig dimensionieren
Right-Sizing ist die Einzelmaßnahme mit dem höchsten Impact bei geringstem Aufwand. Die meisten Unternehmen überprovisionieren um 40–60 %, weil jemand die Serverdimensionierung auf Basis von Spitzenlastschätzungen festgelegt hat, die nie eingetreten sind.
So geht Right-Sizing
- Auslastungsdaten sammeln über mindestens 14 Tage (30 Tage sind besser). Nutzen Sie Azure Monitor, AWS CloudWatch oder Drittanbieter-Tools wie Spot by NetApp oder Datadog
- Kandidaten identifizieren: Jede VM oder Datenbank, die konstant unter 40 % CPU und 60 % Speicherauslastung liegt, ist ein Right-Sizing-Kandidat
- Verkleinern, nicht neu aufbauen. Die meisten Cloud-VMs können mit einem kurzen Neustart in-place skaliert werden. Planen Sie Verkleinerungen in Wartungsfenstern
- Vierteljährlich wiederholen. Lastmuster ändern sich. Right-Sizing ist keine Einmalaktion
Azure-spezifische Tipps
- Azure Advisor liefert kostenlose Right-Sizing-Empfehlungen. Wöchentlich prüfen
- Erwägen Sie B-Series-VMs für Workloads mit variablem CPU-Bedarf — sie sammeln CPU-Credits in Leerlaufphasen und bursten bei Bedarf
- Für Azure SQL nutzen Sie Elastic Pools, um DTUs/vCores über Datenbanken mit komplementären Nutzungsmustern zu teilen
Typische Einsparungen
Erwarten Sie 20–40 % Compute-Kostenreduktion durch eine erste Right-Sizing-Runde. Diese Strategie hat das beste Aufwand-zu-Ersparnis-Verhältnis.
Strategie 3: Reservierte Instanzen und Savings Plans nutzen
Wenn Sie wissen, dass ein Workload 1–3 Jahre laufen wird (und die meisten Produktions-Workloads tun das), zahlen Sie weniger durch Commitment.
Azure
- Azure Reservations: Commitment für 1-Jahres- oder 3-Jahres-Laufzeiten für VMs, Azure SQL, Cosmos DB und andere Dienste. Ersparnis: 30–72 % je nach Laufzeit und VM-Familie
- Azure Savings Plans: Flexibler als Reservierungen — Commitment auf einen Dollar-pro-Stunde-Betrag über Compute-Dienste hinweg. Der Rabatt wird automatisch auf die bestpassenden Ressourcen angewendet
AWS
- Reserved Instances (RIs): Standard und Convertible, 1- oder 3-Jahres-Laufzeiten
- Savings Plans: Compute Savings Plans (am flexibelsten) und EC2 Instance Savings Plans
Best Practices
- Starten Sie mit Produktions-Workloads, die stabile, vorhersagbare Auslastung haben
- Erst Right-Sizing, dann reservieren. Eine 3-Jahres-Reservierung für eine überdimensionierte VM zementiert Verschwendung
- Nutzen Sie Reservation Exchanges (Azure) oder Convertible RIs (AWS) für Flexibilität bei Workload-Änderungen
- Decken Sie 60–70 % Ihres Steady-State-Compute mit Reservierungen ab, den Rest für On-Demand und Spot
Strategie 4: Spot- und Preemptible-Instanzen nutzen
Spot-Instanzen (Azure Spot VMs, AWS Spot Instances, GCP Preemptible VMs) bieten 60–90 % Rabatt für Workloads, die Unterbrechungen tolerieren.
Geeignete Kandidaten für Spot
- Batch-Verarbeitung (Datenpipelines, Video-Rendering, wissenschaftliche Berechnungen)
- CI/CD-Build-Agents — wenn ein Build unterbrochen wird, starten Sie ihn einfach neu
- Dev/Test-Umgebungen — Nicht-Produktions-Workloads, die keine 100 % Verfügbarkeit erfordern
- Kubernetes-Node-Pools — nicht-kritische Pods auf Spot-Nodes mit entsprechenden Pod Disruption Budgets
Implementierungstipps
- Definieren Sie immer eine Fallback-Strategie: Bei Rücknahme der Spot-Kapazität automatisch auf On-Demand-Instanzen zurückfallen
- Verwenden Sie mehrere VM-Größen in Ihrer Spot-Konfiguration, um die Verfügbarkeit über verschiedene Hardware-Pools zu erhöhen
- Überwachen Sie Spot-Preise und Eviction-Raten — AWS Spot Advisor und Azure Spot Pricing History helfen dabei
Strategie 5: Nicht-Produktions-Ressourcen außerhalb der Arbeitszeit herunterfahren
Dev-, Test- und Staging-Umgebungen, die 24/7 laufen, aber nur 10 Stunden am Tag, 5 Tage die Woche genutzt werden, verschwenden 70 % ihrer Kosten.
Automatisierungsoptionen
- Azure: Azure Automation, Azure DevTest Labs Auto-Shutdown oder die Start/Stop VMs v2 Lösung
- AWS: AWS Instance Scheduler oder Lambda-Funktionen, getriggert durch EventBridge
- Cloud-übergreifend: Terraform oder Pulumi mit geplanter Pipeline oder ein FinOps-Tool wie Spot.io oder CloudHealth
Was herunterfahren?
- Entwicklungs- und Test-VMs
- Nicht-Produktions-Kubernetes-Cluster (oder Node-Pools auf null skalieren)
- Nicht-Produktions-Datenbanken (erwägen Sie Serverless-Tiers, die auto-pausieren, wie Azure SQL Serverless)
- Sandbox- und Demo-Umgebungen
Schnelle Rechnung: Eine D4s_v5 VM in West Europe kostet ca. EUR 140/Monat bei 24/7-Betrieb. Herunterfahren außerhalb der Geschäftszeiten spart EUR 98/Monat — pro VM. Multipliziert mit 50 Dev-VMs sind das EUR 4.900/Monat.
Strategie 6: Verwaiste und ungenutzte Ressourcen eliminieren
Cloud-Landschaften sammeln Müll wie Dachböden Gerümpel. Ressourcen werden für ein Projekt angelegt, das Projekt endet, und niemand löscht die Ressourcen.
Häufige verwaiste Ressourcen
- Nicht angehängte Disks: Managed Disks, die keiner VM zugeordnet sind (Azure Advisor markiert diese)
- Ungenutzte öffentliche IP-Adressen: Statische IPs, die allokiert, aber keiner Ressource zugeordnet sind — sie verursachen trotzdem Kosten
- Alte Snapshots: VM- und Disk-Snapshots von vor Monaten oder Jahren, die für Recovery nicht mehr benötigt werden
- Leere Ressourcengruppen oder ungenutzte Load Balancer
- Idle Application Gateways und VPN Gateways — diese haben signifikante Stundenkosten, auch im Leerlauf
Bereinigungsprozess
- Bericht über alle Ressourcen mit null oder nahezu null Auslastung in den letzten 30 Tagen erstellen
- Über Tags mit Verantwortlichen abgleichen (deshalb ist Strategie 1 so wichtig)
- Verantwortliche mit 14-tägiger Frist benachrichtigen
- Ressourcen, die nicht beansprucht werden, löschen oder deallokieren
Erwarten Sie 5–10 % Kostenreduktion durch den ersten Bereinigungszyklus.
Strategie 7: Storage-Kosten optimieren
Storage ist oft die zweitgrößte Cloud-Kostenkategorie und die am meisten vernachlässigte.
Tiering
- Hot → Cool → Cold → Archive: Daten basierend auf Zugriffshäufigkeit auf günstigere Tiers verschieben. In Azure Blob Storage automatisieren Lifecycle-Management-Richtlinien dies
- Intelligent Tiering (AWS S3 Intelligent-Tiering) verschiebt Objekte automatisch zwischen Tiers basierend auf Zugriffsmustern
- Archive-Tier kostet 90 %+ weniger als Hot Storage, hat aber höhere Abrufkosten und Latenz. Für Compliance-Daten, alte Backups und Audit-Logs nutzen
Weitere Storage-Einsparungen
- Alte Backups und Snapshots löschen, die Ihre Aufbewahrungsrichtlinie überschreiten
- Daten vor der Speicherung komprimieren — besonders Logs und Telemetriedaten
- Reserved Capacity nutzen für Azure Blob Storage oder S3 bei großen, vorhersagbaren Speichervolumina (1- oder 3-Jahres-Commitments, 20–38 % Ersparnis)
- Redundanzstufen prüfen: Nicht jedes Storage Account braucht GRS (georedundanter Speicher). Dev/Test-Daten können LRS (lokal redundanter Speicher) zum halben Preis nutzen
Strategie 8: Serverless und PaaS gezielt einsetzen
Serverless- und PaaS-Dienste berechnen den tatsächlichen Verbrauch statt der provisionierten Kapazität und eliminieren damit Leerlauf-Verschwendung.
Kandidaten für Serverless/PaaS-Migration
- API-Backends: Von VMs mit Nginx + Node.js auf Azure Functions oder AWS Lambda migrieren
- Datenbanken: Von selbst verwaltetem SQL auf VMs auf Azure SQL Serverless, Aurora Serverless oder Cosmos DB Serverless umsteigen
- Event-Verarbeitung: Dauerhaft laufende Consumer-Dienste durch Azure Event Grid oder AWS EventBridge + Lambda ersetzen
- Container: Azure Container Apps oder AWS Fargate statt eigenem Kubernetes-Cluster verwenden (für einfachere Workloads)
Wann NICHT Serverless
- Workloads mit anhaltend hohem, vorhersagbarem Durchsatz — Serverless kann bei Skalierung teurer sein
- Anwendungen, die langläufige Prozesse erfordern (>15 Minuten für Lambda, >30 Minuten für Azure Functions im Consumption Plan)
- Workloads mit strikten Cold-Start-Latenzanforderungen
Strategie 9: Eine FinOps-Praxis etablieren
FinOps ist das Operating-Modell, das Kostenoptimierung nachhaltig macht. Ohne FinOps erodieren die Einsparungen aus den Strategien 1–8 innerhalb von 6 Monaten, wenn neue Ressourcen undiszipliniert deployed werden.
FinOps-Kernfähigkeiten
- Kostentransparenz: Dashboards, die Ausgaben nach Team, Anwendung und Umgebung zeigen. Täglich aktualisiert
- Budgets und Alerts: Monatliche Budgets pro Subscription/Account setzen und bei 80 % und 100 % alarmieren
- Anomalieerkennung: Azure Cost Management Anomaly Alerts oder AWS Cost Anomaly Detection nutzen, um unerwartete Spitzen innerhalb von Stunden zu erkennen — nicht erst am Monatsende
- Chargeback/Showback: Kosten den Geschäftsbereichen zuordnen, damit diese die finanziellen Auswirkungen ihrer Architekturentscheidungen verstehen
- Governance: Richtlinien, die Tagging erzwingen, teure VM-Familien in Dev-Umgebungen einschränken und Genehmigungen für große Ressourcen-Deployments erfordern
FinOps-Teamstruktur
Sie brauchen kein großes Team. Starten Sie mit:
- Einem FinOps-Lead, der die Praxis verantwortet, Dashboards baut und den Optimierungsrhythmus steuert
- Engineering-Champions in jedem Team, die monatlich die Cloud-Ausgaben ihres Teams prüfen
- Einem monatlichen FinOps-Review, bei dem die Top-5-Kostenanomalien und Top-5-Optimierungsmöglichkeiten mit der Führung besprochen werden
Tools
- Azure Cost Management + Billing (integriert, keine Zusatzkosten)
- AWS Cost Explorer + Cost Anomaly Detection (integriert)
- Drittanbieter: Spot by NetApp, CloudHealth by VMware, Apptio Cloudability, Infracost (für Terraform-Kostenschätzung zum Planungszeitpunkt)
Strategie 10: Azure Advisor und AWS Trusted Advisor konsequent nutzen
Diese kostenlosen, integrierten Tools liefern personalisierte Empfehlungen basierend auf Ihrer tatsächlichen Nutzung. Die meisten Unternehmen ignorieren sie.
Azure Advisor Kategorien
- Kosten: Right-Sizing, Reservierungsempfehlungen, Identifikation ungenutzter Ressourcen
- Sicherheit: Fehlende Sicherheitskonfigurationen, MFA-Lücken
- Zuverlässigkeit: Availability-Zone-Abdeckung, Backup-Lücken
- Leistung: Unterperformende Ressourcen, Caching-Möglichkeiten
- Operational Excellence: Diagnoseeinstellungen, Policy-Compliance
Implementierungsprozess
- Advisor wöchentlich prüfen — weisen Sie dies Ihrem FinOps-Lead oder einem rotierenden Teammitglied zu
- Empfehlungen triagieren in sofort (diese Woche umsetzen), geplant (nächster Sprint) und zurückgestellt (für später tracken)
- Wo möglich automatisieren: Einige Advisor-Empfehlungen können über Azure Automation oder Logic Apps automatisch umgesetzt werden
- Umsetzungsrate tracken: Streben Sie an, dass 80 %+ der Kostenempfehlungen innerhalb von 30 Tagen umgesetzt werden
Alles zusammen: Das 30-%-Sparziel
| Strategie | Typische Einsparung | Aufwand |
|---|---|---|
| Tagging-Richtlinie | Ermöglicht alles andere | Niedrig |
| Right-Sizing | 20–40 % auf Compute | Niedrig |
| Reservierte Instanzen / Savings Plans | 30–72 % auf committed Compute | Mittel |
| Spot-Instanzen | 60–90 % auf geeignete Workloads | Mittel |
| Non-Prod nach Feierabend herunterfahren | 70 % auf Non-Prod Compute | Niedrig |
| Verwaiste Ressourcen bereinigen | 5–10 % gesamt | Niedrig |
| Storage-Optimierung | 20–50 % auf Storage | Mittel |
| Serverless/PaaS-Adoption | Variabel (20–60 %) | Hoch |
| FinOps-Praxis | Sichert alle Einsparungen | Mittel |
| Advisor-Empfehlungen | 5–15 % inkrementell | Niedrig |
Zusammen angewendet liefern diese Strategien konsistent 30–50 % Reduktion der gesamten Cloud-Ausgaben. Der Schlüssel liegt darin, sie systematisch umzusetzen — nicht als einmalige Sparmaßnahme.
Wie CC Conceptualise unterstützt
Wir helfen Unternehmen, FinOps-Praktiken zu implementieren und Cloud-Kostenoptimierung von der Analyse bis zur nachhaltigen Governance umzusetzen. Unsere Berater arbeiten direkt in Ihrer Azure- oder AWS-Umgebung, identifizieren Verschwendung, setzen Änderungen um und bauen die Dashboards und Prozesse, die Einsparungen dauerhaft sichern.
Kontaktieren Sie uns für ein Cloud-Cost-Assessment. Die meisten Kunden sehen innerhalb der ersten zwei Wochen einen klaren Weg zu 30 %+ Ersparnis.