Team Lead Operations (all genders)

envelio

11h ago

0ManagementGermanyhimalayas

Platform-OperationsSite-Reliability-EngineeringDevOpsTeam-LeadIT-OperationsSenior

Apply Now →

Job Description

über das arbeiten bei envelioZu einfach ist langweilig! Gemeinsam haben wir die Mission, die Energiewende voranzutreiben. Wir lieben, was wir tun und dabei ist uns kein Thema zu groß. Wir übernehmen Verantwortung für unsere Arbeit und wachsen an jeder neuen Aufgabe. Kurz gesagt: Own it, love it, grow with it. Wir sind ein bodenständiges Team aus Kaffee- und Mate-Liebhaber:innen. Unser Geek-Humor resultiert in einer rituellen Nutzung von Emojis und der enzyklopädischen Herausarbeitung von unnützem Wissen. Mehr als 150 envelianer:innen mit über 20 verschiedenen Nationalitäten sind bereits an Bord. Komm dazu und wachse mit uns!deine rolleAlsTeam Lead Platform Operations (all genders) baust du ein hoch technisches Team von rund 6 Personen auf und führst es mit Fokus auf den stabilen, sicheren und planbaren Betrieb unseres Produkts: der Intelligent Grid Platform (IGP). Dein Team verantwortet Product Operations: Ihr stellt sicher, dass Kunden-IGP-Umgebungen zuverlässig laufen, ihr treibt operative Prozesse wie Incident Handling und Releases voran und ihr leitet aus realen Produktionssignalen systematische Verbesserungen ab. Du arbeitest eng mit Product, Customer Success und Engineering Teams zusammen. Außerdem arbeitest du eng mit dem SRE/Infrastructure Team zusammen, das die Plattform-Grundlage verantwortet (Cluster Provisioning, Deployment Pipelines, Observability-Tooling etc.), während dein Team den Fokus auf den operativen Betrieb der IGP für Kunden im Tagesgeschäft legt. Du hilfst dabei, unser Operating Model schrittweise in Richtung 24/7 Zuverlässigkeit für Kunden-Umgebungen weiterzuentwickeln (Prozesse, Ownership und Eskalation) – gemeinsam mit Engineering, SRE/Infrastructure und Customer Success.wie du etwas bewirkstDu coachst und betreust deine Mitarbeitenden und hilfst ihnen durch 1:1-Gespräche und regelmäßiges Feedback, sich weiterzuentwickelnDu verantwortest und entwickelst die operative Ausführung des IGP-Betriebs über Kunden-Umgebungen hinwegDu stellst schnelle und strukturierte Bearbeitung von kundenrelevanten Problemen sicher (z.B. IGP Incidents / HOTs) und sorgst für nachhaltige Follow-upsDu schaffst Klarheit über Ownership und Eskalationswege für Production-Themen und koordinierst effizient über Squads hinweg mit Customer SuccessDu treibst Operational Excellence: ruhige Incident-Kommunikation, pragmatische Problemlösung und eine Kultur kontinuierlicher Verbesserung (blameless)Du balancierst kurzfristige operative Arbeit (Service wiederherstellen) mit langfristigen Investments (Toil reduzieren, Reliability verbessern, Tooling und Runbooks verbessern)Du setzt Prioritäten, planst Kapazitäten und steuerst Roadmap/Backlog für Operations-relevante ArbeitDu formst das Team im Rekrutierungsprozess und gestaltest individuelle Entwicklungspfadedein profilPerfektion ist ein Mythos! Viel mehr interessiert uns der Mensch hinter dem Bildschirm. Diese Kriterien sind also eher als Orientierungshilfe für dich gedacht. Wir sind gespannt, wie deine individuellen Fähigkeiten zu uns passen.Du hast starke Erfahrung im Betrieb komplexer Cloud-Applikationen und weißt, wie man Services unter realen Constraints zuverlässig betreibtDu betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-ModesDu hast Praxis mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity)Du kennst moderne Betriebsmodelle wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks)Du bist sicher in Incident Management, Root Cause Analyse und Priorisierung unter ZeitdruckDu hast nachweisliche Erfahrung in der Führung und Entwicklung eines Teams in einem operativ geprägten UmfeldDu kannst Stakeholder gut managen und über Teams hinweg koordinieren (Engineering Squads, Product, Customer Success)Du reduzierst operativen Aufwand nachhaltig durch bessere Prozesse, Automatisierung und DokumentationDu kommunizierst klar, gerade in High-Pressure-Situationen, und sorgst für Alignment auf Next StepsDu beherrschst Deutsch und Englisch fließend in Wort und Schrift.wie wir software entwickelnKlar definierte Verantwortung für Produktthemen und effiziente Koordination zwischen Squads und Customer SuccessStrukturiertes Incident Management (Service wiederherstellen, klar kommunizieren, dann Ursachenanalyse)Release-Prozesse mit pragmatischem Risikomanagement (sichere Änderungen, schnelle Rollbacks bei Bedarf)Monitoring- und Alerting-Hygiene (signal over noise)Umfassende Runbooks und Automatisierung zur langfristigen Reduzierung operativer Belastungunser tech stackMulti-cloud, hybrid on-prem Setup mit Kubernetes und Helm als StandardAnwendung primär in Python und TypeScriptStandard Backing Services wie PostgreSQL, RabbitMQ, RedisGitlab & Gitlab CITerraform für Infrastructure as Codedeine benefitsPasse den Arbeitsmodus an deinen Lifestyle an – fully remote ( oder hybrid mit Office-OptionOption zum mobilen Arbeiten aus dem Ausland (bis zu drei Mo

Apply for this position →