Incidente:
Após recebermos um alerta da nossa monitoria, identificamos um problema em nossos servidores que estava impactando a estabilidade de parte das nossas APIs de integração (Layer).
Impacto:
Parte dos nossos lojistas ficaram com dificuldade em usar a nossa Layer. Isso acabou gerando lentidão ou timeout nas APIs de integração da Linx Commerce.
Causa:
Os nossos engenheiros identificaram um consumo anormal de memória em alguns servidores que hospedam as APIs de integração (serviço da Layer). A origem do problema foi causada por algumas conexões que não estavam sendo encerradas de maneira adequada pelo sistema operacional, deixando o serviço sem portas o suficiente para atender as requisições.
Solução:
O time executou um procedimento de limpeza para retirar todas as conexões que estavam presas nas máquinas. Após a liberação das conexões, os serviços voltaram à normalidade.