Site Reliability Engineer / Cloud Engineer - #7479582
Walters People
La persona que se incorpore será responsable de garantizar la confiabilidad, el rendimiento y la excelencia operativa de los sistemas de TI. Este rol combina las prácticas de SRE con la gestión de programas para liderar y supervisar las iniciativas de operaciones de TI y confiabilidad en varios productos.
Como SRE, sus tareas incluirán:
* Participación en la planificación y ejecución estratégicas de la supervisión, estableciendo métricas y KPI de planificación de confiabilidad y trabajo para monitorear el rendimiento y la mejora.
* Realización de evaluaciones de riesgos para identificar los principales riesgos de confiabilidad.
* Configuración y optimización de nuestra infraestructura de supervisión/métricas/alertas (Datadog) trabajando a través de registros, trazas y dependencias.
* Expansión y optimización de nuestra pila de observabilidad.
Habilidades informáticas y experiencia requeridas:
* Experiencia con tecnologías DevOps que incluyen Datadog, Docker, Ansible, Jenkins, etc.
* Experiencia en un equipo de desarrollo ágil interdisciplinario.
* Enfoque estructurado para problemas complejos con habilidades de comprensión rápida.
* Participación en la planificación y ejecución estratégicas de la supervisión.
* Familiaridad con los principios y herramientas de observabilidad, por ejemplo, Grafana, Prometheus, Opensearch/ElasticSearch + Kibana, etc.
* Configuración y optimización de nuestra infraestructura de supervisión/métricas/alertas (DataDog).
* Familiaridad con registros, métricas, trazas, dependencias, paneles e alertas.
* Comprensión básica de SLI y SLO.
* Expansión y optimización de nuestra pila de observabilidad.
* Excelente trabajo en equipo y conciencia de la calidad.
* Descubrir e identificar lo desconocido, promover la resolución de problemas antes de que impacten al cliente.
* Escalar automáticamente la observabilidad, habilitar la remediación automatizada y la infraestructura de aplicación autocurativa.
* Idealmente, conocimiento de desarrollo.
Las habilidades deseadas para el puesto incluyen Python, Java, Ansible, Docker, Jenkins y Kubernetes.
Si estás interesado o conoces a alguien que pueda encajar, no dudes en inscribirte para más información.