Ercan Ermis

Sou Ercan Ermis. Engenheiro senior de plataforma cloud nos Paises Baixos. Escrevo aqui sobre cloud, AWS, EKS, Terraform, observabilidade e as decisoes de engenharia de plataforma que determinam se um sistema permanece no ar as 3 da manha.

Os posts neste site vem de sistemas de producao reais, nao de slides. Calculo de risco bancario na BMW Bank com exigencia de disponibilidade 24/7/365. A migracao de uma plataforma de apostas on-prem de 16 anos para a AWS com zero tempo de inatividade e zero perda de dados. Jogos mobile multiplayer em escala de aquisicao via Miniclip. Um pipeline de ingestao de streaming ao vivo que eu gerenciei ponta a ponta como unico engenheiro. Cada uma dessas experiencias deixou cicatrizes, e as cicatrizes viram posts.

Como cheguei ate aqui

O primeiro computador da minha vida foi um Amstrad com dois drives de disquete de 5,25 polegadas (Floppy A e Floppy B), comprado pelo meu pai em 1986 para o negocio dele. O caso de amor de verdade comecou em 1998, na quarta serie, quando minha professora instalou Linux em uma das maquinas com Windows 95 do laboratorio de informatica da escola e disse “isto e Linux, e software livre”. Entao o Pac-Man apareceu naquela tela preta e eu estava perdido.

Por que essa coisa funciona. Como ela funciona de verdade. O que mais posso fazer com ela. Como faco para que ela faca isso de outro jeito. Mais de trinta anos depois ainda estou fazendo essas quatro perguntas e ainda estou no teclado. Horas em frente a um computador sempre foram o lugar onde me sinto mais confortavel e mais em paz. Esse fio, da curiosidade infantil em um laboratorio escolar para a disciplina de operar plataformas em producao, e o que se chama hoje de platform engineering.

Como eu trabalho

Platform Engineering, SRE e DevOps sao um unico trabalho para mim, nao tres. Eu projeto a arquitetura alvo, escrevo o Terraform que a provisiona, construo o CI/CD que faz deploy nela e fico no pager pelo resultado. A divisao em papeis separados e um organograma; o trabalho real e um ciclo. Escrevo de dentro desse ciclo.

O vies e para:

  • Modulos reutilizaveis e Paved Roads, nao infraestrutura sob medida por equipe.
  • IAM de privilegio minimo, KMS e isolamento de rede como padrao, nao como retrofit.
  • Consciencia de custo no mesmo dashboard que latencia e taxa de erro.
  • Analise honesta de modos de falha. “Deve estar bem” nao e um SLO.

O que voce encontrara aqui

A maioria dos posts se encaixa em uma de tres categorias:

  • AWS e EKS em producao. Operando clusters, dimensionando nodegroups, padroes IAM que realmente escalam, armadilhas de rede, upgrades de control plane sem drama.
  • Terraform e Terragrunt em escala organizacional. Limites de modulo, propriedade de estado, drift, automacao de revisao, a infraestrutura entediante que paga juros compostos.
  • Observabilidade e confiabilidade. Prometheus, Grafana, CloudWatch, logs estruturados, runbooks que alguem alem do autor pode realmente seguir.

O publico que tenho em mente e o engenheiro que ja conhece a AWS CLI, ja roda Kubernetes em algum lugar e quer o detalhe nao obvio, o trade-off ou o modo de falha que eu encontrei para que ele nao precise.

Credenciais e comunidade

  • UptimeCoach, um laboratorio SaaS pessoal provisionado em 20 regioes AWS como referencia multi-regiao funcional.

Consultoria e advisory

Aceito um pequeno numero de projetos de consultoria por ano, e genuinamente gosto disso. A variedade de equipes, stacks e restricoes e o que mantem meus instintos de plataforma afiados. O trabalho que faco para os clientes alimenta diretamente os textos neste site, e vice-versa.

Como trabalho com equipes:

  • Advisory de engenharia de plataforma. Sua equipe esta chegando ao ponto em que “so Terraform e esperanca” para de funcionar. Ajudo com limites de modulos, propriedade de estado, design de CI/CD, IAM de privilegio minimo e o modelo operacional que transforma plataforma em produto, nao em centro de custo.
  • Otimizacao de custos AWS. Otimizacao de verdade, nao a variedade “compre Savings Plans e pronto”. Reviso sua fatura linha por linha, rastreio o desperdicio ate cargas de trabalho especificas e reestruturo. A maioria dos projetos encontra 30-50% sem tocar em uma linha de codigo de aplicacao.
  • Lead de plataforma interino. Sua equipe esta entre leads ou passando por uma fase critica de crescimento. Assumo por um periodo definido, estabeleco a direcao tecnica, construo as Paved Roads e ajudo a contratar ou promover o lead de longo prazo.
  • Migracao e modernizacao. Levando legado para a AWS, quebrando monolitos em servicos ou desembaracando um caos multi-conta. Fiz o suficiente para saber quais partes doem e como sequencia-las para que nao doam.

A superficie completa em que consulto: AWS, arquitetura cloud, pipelines de CI/CD, Linux, ferramentas GitHub e GitLab, Terraform e Terragrunt, Kubernetes e EKS, observabilidade, otimizacao de custos, migracao, e o modelo operacional de platform engineering que sustenta o resto. Se roda em uma conta cloud de producao ou em um pipeline de build, esta no escopo.

Projetos pequenos e focados. Um ou dois por vez. Se o que voce esta lidando soa como o tipo de coisa sobre a qual escrevo aqui, me encontre no LinkedIn. Uma mensagem curta sobre o problema e o formato da sua equipe e tudo o que precisamos para comecar.

Leia a seguir