Senior Site reliability Engineer
A industry leading global investment firm is seeking a Senior Site Reliability Engineer to join its core engineering platform team. This is a high‑impact role where you will help shape the reliability, observability, and operational excellence of a rapidly scaling technology environment that underpins cutting‑edge research and trading systems.
If you are passionate about building resilient platforms, automating everything, and influencing engineering standards across an organisation, this role offers exceptional scope and technical challenge.
As a Senior SRE, you will:
- Lead the development and evolution of the firm's observability stack, ensuring high‑quality metrics, alert fidelity, and scalable system health monitoring.
- Build reliable, low‑noise dashboards and alerting using modern tooling across metrics and logs.
- Improve incident detection, response, and post‑incident processes through automation, configuration improvements, and engineering changes.
- Define and apply SLIs/SLOs to support operational and strategic decision‑making.
- Enhance reliability, scalability, and operability of core services through hands‑on development work.
- Reduce manual operational tasks by identifying recurring issues and implementing automation.
- Apply Infrastructure as Code principles across observability and platform components.
- Develop tooling and automation primarily in Go (preferred) or Python.
- Shape engineering standards by introducing best‑practice patterns, documentation, and platform defaults.
- Collaborate with service‑owning teams to deliver measurable, sustained platform reliability improvements.
What You'll Bring
- Strong, practical SRE and SWE experience within production environments.
- Hands‑on experience operating containerised workloads (Docker or Podman).
- Essential development experience in Go (preferred) or Python.
- Experience with Grafana (dashboards and alerting).
- Strong Infrastructure-as-Code experience across Terraform and/or Ansible.
- Familiarity with OpenTelemetry: metrics, logs, and tracing.
- Kubernetes and cloud-native engineering experience.
- Exposure to datacentre compute platforms and hardware-backed services.
- AWS configuration and deployment experience.
FAQs
Herzlichen Glückwunsch – wir wissen, dass es ein großer Schritt ist, sich die Zeit für eine Bewerbung zu nehmen. Wenn Sie sich bewerben, werden Ihre Angaben direkt an den zuständigen Berater weitergeleitet, der aktiv nach passenden Talenten sucht. Aufgrund der hohen Nachfrage können wir uns möglicherweise nicht bei allen Bewerbern zurückmelden. Wir behalten Ihren Lebenslauf und Ihre Daten jedoch stets in unserer Datenbank und melden uns bei Ihnen, sobald wir ähnliche Positionen sehen oder Fähigkeiten identifizieren, die das Wachstum von Unternehmen vorantreiben können.
Ja. Auch wenn diese Position nicht perfekt zu Ihrem nächsten Karriereschritt passt, hilft uns Ihre Bewerbung dabei, Ihre Fachkenntnisse und Ziele besser zu verstehen. So stellen wir sicher, dass Sie bei der passenden Gelegenheit auf unserem Radar sind.
Wir arbeiten auf unterschiedliche Weise: Zum einen veröffentlichen wir die aktuell verfügbaren Positionen auf unserer Website. Häufig können wir jedoch aus Gründen der Vertraulichkeit nicht alle Vakanzen ausschreiben. Darüber hinaus arbeiten wir mit Kunden zusammen, die einen stärkeren Fokus auf Fähigkeiten legen und darauf, was erforderlich ist, um ihr Unternehmen zukunftssicher aufzustellen.
Aus diesem Grund empfehlen wir, Ihren Lebenslauf zu registrieren, damit Sie auch für Positionen berücksichtigt werden können, die noch nicht geschaffen wurden.
Ja, wir unterstützen Sie bei der Optimierung Ihres Lebenslaufs und der Vorbereitung auf Vorstellungsgespräche. Von individueller Beratung über die gezielte Vorbereitung auf Interviews bis hin zu Gehalts- und Vertragsverhandlungen stehen wir Ihnen während Ihres gesamten nächsten Karriereschritts zur Seite.
