Garantir a visibilidade total da saúde técnica da infraestrutura e sistemas tecnológicos da empresa. Desenvolver monitores, painéis e relatórios de monitoramento e observabilidade com base nas métricas, logs e traces do ambiente visando a redução do MTTR (Tempo médio de reparo) e antecipar incidentes. Participar nas definições de projetos, novas tecnologias, padrões, normas e documentações da área de Infraestrutura de TI.
Administrar e evoluir plataformas de monitoramento e observabilidade (Datadog, Solarwinds, Grafana, Zabbix e ou similares). Manter esses sistemas robustos, assegurando detecção precoce de anomalias e visibilidade em tempo real da saúde do ambiente.
Desenvolver painéis intuitivos e relatórios (dashboards) que traduzam dados técnicos em indicadores.
Apoiar times de desenvolvimento e sustentação na instrumentação de aplicações para coleta de traces distribuídos e logs estruturados.
Desenvolver, gerenciar e refinar regras de alertas garantindo que as notificações sejam precisas e evitando falso / positivo.
Realizar a análise dos dados de monitoramento identificando gargalos de performance e tendências de capacidade do ambiente produtivo e direcionar o time técnico no suporte ao ambiente afim de evitar incidentes e indisponibilidades.
Garantir que todo o parque tecnológico tenham implantando e configurado os agentes e configurações de monitoramento.
Identificar oportunidades de automação de tarefas repetitivas e processos operacionais.
Atuar na resposta a incidentes e suportar o time técnico de gestão de crises, coordenando ações técnicas e apoiando na comunicação com seus respectivos stakeholders. Conduzir post-mortems estruturados, promovendo a cultura de melhoria contínua.
Apoiar nas análises de causa raíz de incidentes e propor melhorias principalmente relacionadas ao monitoramento, observabilidade e automação de processos com intuito de evitar recorrências.
Atuar na melhoria contínua dos processos de Infraestrutura de TI e apoiar demais analistas e especialistas garantindo a disponibilidade do ambiente tecnológico.
Garantir a correta integração das plataformas de monitoramento e observabilidade com a ferramenta de ITSM da empresa, garantindo a abertura automática de incidentes e alertas.
Criar documentações e bases de conhecimento técnico.
Cumprir o regulamento interno, os requisitos dos sistemas de gestão da qualidade, as regulamentações da ANS e as normas de saúde, higiene e segurança do trabalho, utilizando EPI’s/EPC’s sempre que necessário.
Desenvolver outras atividades inerentes ao cargo ou a critério de seu superior imediato, desde que habilitado e estejam de acordo com o seu conhecimento e experiência.
Aplicar-se a Vaga
inventCloud
https://Inventcloud.com.br
R$7000
Pessoa Jurídica
Publicada há 5 horas