Estamos em busca de um Engenheiro de Infraestrutura Sênior e assumir um papel fundamental no planejamento, manutenção e escalabilidade da infraestrutura que sustenta uma plataforma logística em múltiplas regiões. Essa pessoa garantirá que os sistemas sejam altamente disponíveis, observáveis e eficientes, impulsionando a automação e a resiliência necessárias para lidar com milhões de transações por mês.
Precisamos de alguém que não apenas saiba construir sistemas confiáveis, mas que também lidere iniciativas de infraestrutura, melhore o desempenho e colabore de perto com os membros de SRE e DBA para moldar uma plataforma robusta e escalável.
Responsabilidades:
Projetar, implementar e manter uma infraestrutura escalável na AWS, garantindo alta disponibilidade, tolerância a falhas e eficiência de custos.
Desenvolver e otimizar pipelines de CI/CD para implantações rápidas e seguras em diferentes ambientes.
Gerenciar clusters Kafka e arquiteturas de streaming de eventos para comunicação em tempo real entre sistemas.
Colaborar com os membros de SRE e DBA para garantir confiabilidade e observabilidade em todos os serviços.
Implementar soluções de monitoramento, alertas e logging.
Automatizar o provisionamento de infraestrutura usando ferramentas como Terraform.
Melhorar a confiabilidade e segurança de rede, garantindo conformidade e isolamento entre ambientes.
Participar da resposta a incidentes, análise de causa raiz e iniciativas de melhoria contínua.
Oferecer mentoria técnica e promover as melhores práticas em nuvem, observabilidade e automação.
Requisitos:
Graduação em Ciência da Computação, Engenharia de Sistemas ou experiência equivalente.
5+ anos de experiência gerenciando infraestrutura em nuvem em ambientes de produção.
Forte conhecimento em AWS (EC2, S3, ECS, Lambda, RDS, VPC, CloudWatch).
Experiência comprovada com Kafka e sistemas orientados a eventos.
Proficiência em Terraform ou outras ferramentas de Infrastructure-as- Code.
Sólido entendimento de redes, balanceamento de carga e roteamento em sistemas distribuídos.
Experiência em manutenção e ajuste de clusters Elasticsearch e pipelines de logs.
Familiaridade com Docker.
Excelentes habilidades de troubleshooting, mentalidade proativa e capacidade de trabalhar de forma colaborativa entre áreas.
Disponibilidade para trabalhar em turnos noturnos (escala de plantão).
Disponibilidade para cobrir turnos de trabalho durante períodos de alta demanda e suporte técnico (escalas de plantão).
Disponibilidade para trabalhar horas extras remuneradas, caso seja necessário resolver um problema técnico.
Diferenciais:
Experiência com DataListeners, Redis ou outras filas de mensagens além do Kafka.
Compreensão dos princípios de SRE SLOs, SLIs, error budgets). Familiaridade com práticas de segurança e hardening de infraestrutura.
Experiência com arquiteturas multi-região ou multi-conta na AWS. Fluência em inglês (falado e escrito).
***
Contrato PJ ( cooperado)
Trabalho remoto
Etapas do processo: Entrevista técnica (live code)
K2 Solutions
https://www.k2solutions.com.br
Não Informado
Cooperado
Publicada há 3 dias