Incidente:
Após recebermos alertas das nossas monitorias, identificamos uma sobrecarga em alguns dos nossos sites que gerava lentidão durante a navegação de algumas sessões.
Impacto:
Alguns consumidores destas lojas podem sido afetados por lentidão durante a sua navegação.
Causa:
Nossos engenheiros identificaram que o serviço do PagSeguro ficou indisponível por 30 minutos. Essa indisponibilidade causou uma sobrecarga, em partes do sites, que estavam utilizando o parceiro. O motivo disso é que a PagSeguro conta com um recurso que realiza o calcula juros dos produtos durante a navegação dos consumidores. Esse cálculo de juros é feito de forma online, com base nas configurações do Gateway e, com a indisponibilidade, o recurso foi severamente comprometido, impactando os sites e elevando o consumo de memória pelas nossas aplicações.
Solução:
O time de engenharia da Linx Commerce subiu máquinas adicionais para comportar a sobrecarga gerada pela indisponibilidade do parceiro. Assim que o serviço da PagSeguro foi restabelecido, as aplicações voltaram ao normal.
Próximos passos:
O time da Linx está em contato com o parceiro para entender o motivo da indisponibilidade e alinhando o desenvolvimento da integração com a nova versão do serviço da PagSeguro. Também estamos analisando um controle de timeout e fallback, em caso de indisponibilidade desse parceiro, para evitar esse tipo de sobrecarga.