← Back to all jobs
envelio

Site Reliability Engineer (all genders)

envelio

12h ago

0DevopsGermanyhimalayas
Site-Reliability-EngineeringDevOpsInfrastructure-EngineeringCloud-EngineeringPlatform-EngineeringMid-level

Job Description

über das arbeiten bei envelioZu einfach ist langweilig! Gemeinsam haben wir die Mission, die Energiewende voranzutreiben. Wir lieben, was wir tun und dabei ist uns kein Thema zu groß. Wir übernehmen Verantwortung für unsere Arbeit und wachsen an jeder neuen Aufgabe. Kurz gesagt: Own it, love it, grow with it. Wir sind ein bodenständiges Team aus Kaffee- und Mate-Liebhaber:innen. Unser Geek-Humor resultiert in einer rituellen Nutzung von Emojis und der enzyklopädischen Herausarbeitung von unnützem Wissen. Mehr als 150 envelianer:innen mit über 20 verschiedenen Nationalitäten sind bereits an Bord. Komm dazu und wachse mit uns!deine rolleAls Site Reliability Engineer (all genders) wirst du Teil eines hochspezialisierten Squads von ca. 6 Engineers, das für den zuverlässigen Betrieb und die Infrastruktur der Intelligent Grid Platform (IGP) verantwortlich ist. Die Plattform läuft auf über 100 Kundeninstanzen auf Kubernetes, verteilt über Azure, Open Telekom Cloud und On-Premise-Umgebungen. Du entwirfst, baust und pflegst die Plattform-Grundlage: Cluster-Provisionierung, Deployment-Pipelines, Observability, Secrets-Management und Infrastructure-as-Code. Du arbeitest eng mit dem neuen Operations-Team zusammen, das den täglichen IGP-Betrieb für Kunden übernehmen wird, und stellst Tooling, Monitoring und Automatisierung bereit, die sie dafür brauchen. Du arbeitest in einem Squad zusammen mit anderen SRElern und berichtest an den Engineering Manager.wie du etwas bewirkstDu betreibst und verbesserst Kubernetes-Cluster über mehrere Clouds und On-Premise-Umgebungen hinweg und stellst sicher, dass sie zuverlässig, sicher und kosteneffizient sindDu entwickelst und pflegst Infrastructure-as-Code (Terraform, SaltStack) zur Verwaltung von über 100 Kundeninstanzen mit geschichteter KonfigurationDu entwirfst und pflegst Observability (Monitoring, Alerting, SLOs), damit Produktionsprobleme frühzeitig erkannt und schnell behoben werdenDu verantwortest und entwickelst Secrets-Management, Zertifikatsautomatisierung und Security-Tooling über die gesamte PlattformDu reduzierst operativen Aufwand durch Automatisierung, besseres Tooling und solide RunbooksDu beteiligst dich an Incident Response, Root-Cause-Analyse und treibst Follow-ups voran, damit sich dieselben Probleme nicht wiederholenDu arbeitest mit Entwicklungs-Squads und dem Operations-Team zusammen, um die Gesamtzuverlässigkeit der IGP zu verbesserndein profilPerfektion ist ein Mythos! Uns interessiert der Mensch hinter dem Bildschirm — betrachte diese Kriterien als hilfreiche Orientierung. Wir freuen uns zu sehen, wie deine individuellen Stärken zu uns passen. Du hast nachweisliche Erfahrung im Betrieb von Produktions-Workloads auf Kubernetes in einer Cloud- oder Hybrid-UmgebungDu bist vertraut mit LinuxAdministration, Netzwerken und verteilten SystemenDu hast praktische Erfahrung mit Infrastructure-as-CodeTools wie Terraform oder CloudFormationDu hast mit Configuration-ManagementTools wie SaltStack, Ansible oder Chef gearbeitetDu hast Erfahrung mit Container- und Orchestrierungs-Technologie (Docker, Kubernetes, Helm) im produktiven EinsatzDu verstehst Monitoring und Observability und hast mit Tools wie Datadog, Prometheus oder Grafana gearbeitetDu kommunizierst effektiv in asynchronen, Remote-first-UmgebungenDu bist neugierig, lernst gerne und bist offen für den Einsatz von KI-Tools in deiner täglichen ArbeitDu verfügst über verhandlungssichere Englischkenntnisse (Niveau C1)Nice to have: Erfahrung mit einer Programmiersprache wie Python oder GoNice to have: Deutschkenntnissewie wir software entwickelnAgile Arbeitsweise mit Kanban in cross-funktionalen SquadsContinuous Integration / Continuous DeliveryArbeiten in kleinen Batches mit schnellen ReviewsKnowledge-Sharing-Sessions zwischen Entwickler:innen"You Code it – You Own it" – Squad-Verantwortung für definierte Funktionsbereiche des ProduktsBlameless Post-Mortems und Kultur der kontinuierlichen Verbesserungunser tech stackMulti-Cloud, hybrides On-Prem-Setup mit Kubernetes und Helm als gemeinsamer NennerApplikation primär geschrieben in Python und TypeScriptStandard-Backing-Services wie PostgreSQL, RabbitMQ, RedisGitlab & Gitlab CI für das Management des Software Delivery LifecycleTerraform für Infrastructure as Codedeine benefitsPasse den Arbeitsmodus an deinen Lifestyle an – fully remote oder hybrid mit Office-Option in KölnOption zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von überall in der EU oder den USA)State of the Art Technologie und moderner Tech StackSehr gute Hardware-Ausstattung (16 Zoll MacBooks, 2 Bildschirme an deinem Arbeitsplatz)30 Urlaubstage + 3 Corporate HolidaysUnterstützung deiner Gesundheit mit der Urban Sports Club KooperationFlexible Nutzung eines monatlichen Mobilitätsbudgets (z.B. Jobrad, ÖPNV)Zeit und Budget für individuelles WachstumOptionale betriebliche AltersvorsorgeRegelmäßige Firmen- und TeameventsOriginally posted on Himalayas