Locatie: Sittard, Nederland (op locatie)
Fulltime
Selectiecriteria:
- HBO/WO-niveau (informatica of vergelijkbaar) met minimaal 3 jaar relevante werkervaring
- Ervaring met AWS- of Azure cloudplatformen is noodzakelijk AWS heeft sterke voorkeur)
- Ervaring met Amazon CloudWatch / Azure Monitor is een must
- AWS Certified CloudOps Engineer – Associate of gelijkwaardig certificaat is een must
Over de rol:
Als Technical Reliability Engineer bouw je aan de betrouwbaarheid en stabiliteit van onze dienstverlening. Je speelt een sleutelrol in het borgen en overdragen van kennis en bent betrokken bij de stabiliteit en de support van onze klant- en cloudomgevingen.
Zie jij het als een uitdaging om complexe technische projecten eigen te maken en nieuwe diensten in beheer te nemen? Ben je van nature nieuwsgierig en schrikt het je niet af om de meest complexe incidenten en bugs op te sporen en op te lossen? En vind je het niet erg om in diensten te werken?
Dan is deze rol echt iets voor jou!
Jouw missie: een zorgeloze operatie. Je bent de brug tussen ons cloud beheerteam en supportorganisatie. Jouw kernmissie is het borgen van de algehele systeembetrouwbaarheid en het maximaliseren van de beschikbaarheid van onze oplossingen via geoptimaliseerde processen.
Jouw taken vallen onder twee hoofdpijlers:
- Operationele Onboarding: Zorgen dat cloudoplossingen en diensten zo efficiënt mogelijk en op een beheersbare manier in beheer worden genomen en gemonitord. Dit doe je door intensieve kennisborging en overdracht naar de support teams. Daarnaast ontwikkel je actief mee aan zowel technische- als supportprocessen
- Continue Verbetering: Je voert zelfstandig verbeteringen door aan onze bestaande, grootschalige klantnetwerken op gebied van o.a. monitoring, alerting en automatisering. Je doel: incidenten voorkomen en eventuele storingstijden minimaliseren
Jouw belangrijkste verantwoordelijkheden:
- Supportstrategie & optimalisatie: Je zoekt naar de meest efficiënte manier om cloudoplossingen actief in beheer te nemen. Je analyseert hoe de support voor de diensten het beste ingericht kan worden en implementeert de benodigde structuren om stabiliteit en beheersbaarheid te waarborgen
- Incident & Bug Management: Je test proactief nieuwe softwareversies en cloudoplossingen en bent in de lead als er grote storingen optreden. Daarnaast stel je zelfstandig Root Cause Analysis RCA) rapportages op wanneer er grote storingen optreden. Bugs meldt je zelfstandig bij verschillende development teams
- Netwerkmonitoring: Je speelt een belangrijke rol in het waarborgen en het in de lucht houden van grote klantnetwerken en monitort actief voor problemen zoals: systeemprestaties, netwerkproblemen en error rates
- Escalaties: Je fungeert als technisch expert voor onze supportteams en beantwoordt dagelijks vragen vanuit de verschillende teams