SRE para Devs

Build & Run

Este é nosso derivado do trabalho de uma pessoa SRE, só que centrado na perspectiva de trabalho de uma pessoa dev que precisa sustentar seus serviços em produção. Todo o curso é executado através do repositório GitHub.

49 aulas
Leonardo Santos

Leonardo Santos

Staff Engineer

Conteúdo do curso

9 módulos • 49 aulas

O que você vai aprender

Conteúdo técnico e prático para você dominar os conceitos de escalabilidade

Observabilidade em sistemas distribuídos
Métricas com Victoria Metrics e PromQL
Logs estruturados com Grafana Loki
Tracing distribuído com Open Telemetry
Sistema de alertas com Vmalert e Alertmanager
Cálculo de SLI, SLO e Error Budget
Criação de dashboards no Grafana
Engenharia do Caos com Chaos Mesh
Gestão de incidentes e postmortems

Seu instrutor

Leonardo Santos

Leonardo Santos

Staff Engineer

Engenheiro de Confiabilidade e Plataforma com certificação CKA, operando clusters Kubernetes em produção desde 2018. Especialista em ambientes multi-cluster EKS na AWS, GitOps (Argo CD, Helm), entrega progressiva e operações baseadas em SLOs para sistemas financeiros de grande escala. Atualmente na IARA GenAI, plataforma interna de inteligência artificial generativa do Itaú, desenvolvendo SDKs para que áreas de negócio consumam LLMs de forma segura, respeitando as rígidas exigências regulatórias do setor bancário. A plataforma atende mais de 400 aplicações internas e processa cerca de 300 bilhões de tokens por mês, rodando em clusters Kubernetes com centenas de nós e workloads. Anteriormente atuou no Camada Zero, iniciativa estratégica de resiliência construída sobre arquitetura celular com dezenas de clusters Kubernetes, Kafka como backbone de eventos e Istio service mesh para alta disponibilidade, controle de tráfego e isolamento de falhas.

Domine Engenharia de IA e Desenvolvimento de Software de Alta Qualidade

Rafael
Alberto
Daniel
COMEÇAR AGORA