In dieser Funktion bist du verantwortlich für den Aufbau und die Leitung der Site Reliability Engineering (SRE)-Praktiken bei der Mobiliar. Dabei entwickelst du strategische Ansätze zur Systemverbesserung und arbeitest eng mit den Bereichen Architektur, DevOps, Test und Security zusammen. Ein wichtiger Fokus liegt auf der Förderung einer dezentralen Verantwortung für die Leistungsfähigkeit der produktiven Systeme, insbesondere in Bezug auf Stabilität, Performance, Skalierbarkeit, Sicherheit und Verfügbarkeit.
Gemeinsam sorgt ihr für den Aufbau und die Pflege von Monitoring- und Observability-Systemen sowie die Etablierung von Best Practices für Systemsicherheit, Skalierbarkeit und Resilienz. Durch das Incident Management und Major Incident Reviews unterstützt ihr die Verbesserung von Systemen und Prozessen. Du unterstützt zudem dezentrale Organisationen bei der Analyse komplexer Fragestellungen.
Darüber hinaus entwirfst, schreibst und stellst du Softwarelösungen bereit, die die Verfügbarkeit, Skalierbarkeit, Latenz und Effizienz steigern. Bei auftretenden Störungen agierst Du unterstützenden und stellst sicher, dass nach der Wiederherstellung nachhaltige Massnahmen erarbeitet und umgesetzt werden.