Glossar

SRE

Site Reliability Engineering

Site Reliability Engineering ist eine von Google entwickelte Disziplin, die Software-Engineering-Methoden auf den IT-Betrieb anwendet. SREs automatisieren manuelle Betriebsaufgaben, definieren SLOs und Error Budgets, und bauen widerstandsfähige, selbstheilende Systeme. Das Ziel: Verlässlichkeit und Geschwindigkeit in Einklang bringen – schnelle Releases ohne Stabilitätsopfer.