Descripción del Rol
Buscamos un SRE Senior para liderar la confiabilidad, seguridad y performance de nuestra plataforma de ticketing y cashless, utilizada en algunos de los eventos más grandes de LATAM.
El rol ofrece alta autonomía técnica y participación directa en decisiones de infraestructura, arquitectura y operación de sistemas críticos con picos de uso muy elevados.
Responsabilidades Principales
Infraestructura y Operaciones
- Operar y optimizar infraestructura
- Ejecutar y coordinar migraciones, actualizaciones y gestión de entornos (dev, staging, producción).
- Participar en el diseño de arquitectura y en el despliegue de nuevos productos.
- Automatizar procesos y reemplazar tareas manuales (scripts, intervenciones en DB, etc.).
en AWS (Aurora MySQL, Lambda, API Gateway, CloudFront, DynamoDB, Redis).
Confiabilidad y Performance
- Diseñar y mantener observabilidad real: dashboards, métricas y tracing en DataDog.
- Configurar alarmas efectivas, libres de ruido y orientadas a diagnóstico rápido.
- Realizar pruebas de stress y análisis de rendimiento, en conjunto con el equipo de desarrollo.
- Trabajar con desarrolladores para identificar cuellos de botella y optimizar performance a nivel aplicación + infraestructura.
- Preparar la plataforma para picos extremos de tráfico.
Seguridad y Compliance
- Implementar y mantener controles de seguridad (WAF, IAM, mTLS).
- Aportar en segmentación de entornos y prácticas relacionadas con PCI DSS.
- Gestionar rotación de claves, políticas de acceso y hardening general.
Incidentes y Continuidad Operativa
- Responder a incidentes de infraestructura y aplicar mitigaciones claras.
- Liderar postmortems orientados a prevención y mejora continua.
- Mantener runbooks y procesos de continuidad operativa bien documentados.
Requisitos Excluyentes
- 5+ años operando infraestructura en AWS en entornos productivos reales.
- Experiencia sólida en Aurora MySQL, Redis, Lambda, API Gateway y CloudFront.
- Dominio de DataDog (o equivalente): dashboards, alertas, tracing.
- Experiencia en sistemas con altos picos de carga o tráfico.
- Conocimientos fuertes de seguridad en cloud (WAF, IAM, redes, TLS).
- Mentalidad de automatización y eliminación de procesos manuales.
- Excelente criterio técnico bajo presión.
Requisitos Deseables
- Experiencia en entornos regulados o con compliance (PCI, ISO, etc.).
- Experiencia en plataformas transaccionales o de tiempo real.
- Background o interés en performance engineering.
Nuestro Stack
AWS (Aurora MySQL, Lambda, API Gateway, CloudFront, DynamoDB, ElastiCache), Redis, DataDog.
Por Qué Sumarte
Pocas industrias tecnológicas enfrentan picos de demanda tan extremos como el ticketing y el cashless en eventos masivos. Nuestra plataforma procesa miles de transacciones por segundo en ventanas críticas, integrando ventas, accesos y consumos en tiempo real.
Acá vas a trabajar con problemas desafiantes, de impacto directo, en un entorno donde la confiabilidad y la performance importan de verdad.