Passava pouco das 8h. Londres Quando Governo BritânicoOs sites começaram a piscar e desaparecer.

A maior parte da América estava dormindo, mas alguns pernoites na Costa Leste encontraram seus serviços de streaming da Disney pausados.

Aqueles que chamavam de elevador para voltar para casa depois de uma festa de domingo à noite estavam com dificuldades. As atividades cotidianas estavam paralisadas.

À medida que o leste dos Estados Unidos acordou, a escala do problema tornou-se clara.

A United Airlines e a Delta descobriram que seus passageiros não conseguiam acessar os serviços online. Os passageiros são viciados em digitalização New York Times“O jornal da manhã ficou sem. Snapchatters ficaram em silêncio; reddit Os fóruns foram silenciados.

De acordo com a Deepfield Networks, um terço de todos os usuários online em todo o mundo interage diariamente com a Amazon Web Services (AWS): Venmo Todos, do Reddit ao Ring, dependem de servidores AWS. E, na segunda-feira de manhã, o sistema caiu – Uma parte significativa da Internet está falhando,

O especialista em segurança cibernética James Knight, diretor sênior, disse que o fato de tal interrupção poder acontecer é “surpreendente”. guerra digitalO que ajuda as empresas a identificar e remover vulnerabilidades online. É também um indicador preocupante de um novo tipo de anarquia da qual nenhum de nós está imune.

“Meu primeiro pensamento foi como isso poderia acontecer”, disse Knight ao Daily Mail. Aparentemente, algum tipo de banco de dados caiu.

De acordo com a Deepfield Networks, um terço de todos os usuários online em todo o mundo interage diariamente com a Amazon Web Services (AWS): empresas como Venmo, Reddit e Ring dependem de servidores AWS. No entanto, o sistema caiu na manhã de segunda-feira.

De acordo com a Deepfield Networks, um terço de todos os usuários online em todo o mundo interage diariamente com a Amazon Web Services (AWS): empresas como Venmo, Reddit e Ring dependem de servidores AWS. No entanto, o sistema caiu na manhã de segunda-feira.

“É surpreendente que algo tenha afetado a rede deles, porque normalmente os backups e os sistemas redundantes funcionam todos ao mesmo tempo. O desaparecimento de um sistema específico é muito, muito surpreendente.’

Knight reconheceu que ficou surpreso com a interrupção, que, segundo ele, custaria milhões de dólares à Amazon.

Tudo começou às 3h11 ET. O problema foi identificado às 5h01 ET e uma ‘correção’ foi implantada em 20 minutos.

Mesmo assim, o problema permaneceu sem solução e, às 8h48, horário do leste dos EUA, a Amazon lançou outra atualização informando que mais correções estavam sendo feitas.

A ameaça de um ataque cibernético foi inevitavelmente levantada, mas, segundo Knight, é improvável.

Ele explicou: “Um profissional cibernético como eu, ou quem quer que esteja olhando para isso, seria capaz de ver se era um hack. Isso é chamado de sinal de acordo, COI.

‘Provavelmente veremos uma assinatura de malware; Qualquer tipo de acesso não autorizado; Algo nos logs mostrando que algum tipo de acesso foi obtido ou algum tráfego incomum. Não há nada aqui que indique isso.

Além disso, disse ele, a Amazon é legalmente obrigada a divulgar quaisquer hacks.

Em vez disso, a empresa disse que o problema se originou em suas instalações na Virgínia, conhecida como região US-East-1.

Sua última grande falha foi em 2021 – um sinal da real resiliência dos sistemas da AWS, disse Knight. Mas os problemas podem ser devastadores quando ocorrem.

A empresa de segurança cibernética CrowdStrike fechou por vários dias em julho de 2024, causando a maior interrupção de TI da história.

A falha durou apenas 90 minutos, mas as empresas demoraram alguns dias para corrigi-la. Uma seguradora calculou que o problema causou mais de 5 mil milhões de dólares em perdas diretas apenas às empresas da Fortune 500, sendo as companhias aéreas e os hospitais os mais afetados.

A empresa de telecomunicações AT&T encontrou sua rede indisponível várias vezes no ano passado, principalmente com uma interrupção de 11 horas em fevereiro.

Knight disse que é um sinal dos tempos e que temos que aprender a conviver com isso.

Imagem: Um data center da Amazon Web Services na Virgínia

Imagem: Um data center da Amazon Web Services na Virgínia

Na foto: relatórios do DownDetector sobre interrupções da AWS aumentaram

Na foto: relatórios do DownDetector sobre interrupções da AWS aumentaram

Knight disse que é um sinal dos tempos e temos que aprender a conviver com isso

Knight disse que é um sinal dos tempos e temos que aprender a conviver com isso

“Nossas vidas estão online e isso simplesmente vai acontecer”, disse ele. ‘A AWS, juntamente com o Google e a Microsoft, são o padrão ouro em computação em nuvem. Portanto, não é que os rivais da AWS sejam complacentes, porque o mesmo poderá acontecer com eles amanhã.

‘Eu realmente não posso criticar a AWS. Ele reagiu muito bem. Não sei se alguém vai ficar com a cabeça girando, mas isso será levado muito a sério e acho que eles levarão as lições aprendidas para que possam melhorar.’

No entanto, dado o espaço altamente competitivo da computação em nuvem, a AWS não compartilhará suas melhorias com seus rivais.

Isso significa que as empresas hoje têm muitos ovos na mesma cesta? Eles deveriam usar mais de uma empresa de computação em nuvem para fornecer seus serviços?

Knight disse que teoricamente eles poderiam fazer isso, mas seria difícil de administrar e não necessariamente útil.

Ele disse: ‘A AWS já está dividida em muitas cestas e é por isso que as pessoas mantêm as coisas na nuvem.’ ‘Eles têm alguns servidores em um local e alguns na nuvem em outro local: alguns na costa leste dos EUA, alguns na costa oeste, alguns na Ásia e estão espalhados por toda parte.’

Às 11h43 de segunda-feira, mais de oito horas após os primeiros sinais de problemas, a Amazon parecia otimista de que o fim estava próximo.

“Restringimos a origem dos problemas de conectividade de rede que afetam os serviços da AWS”, disse a empresa. ‘A causa raiz é um subsistema interno subjacente responsável por monitorar a integridade de nossos balanceadores de carga de rede.’

Afirmaram que estavam a abrandar deliberadamente alguns serviços “para ajudar na recuperação” e que ainda estavam “a trabalhar activamente na mitigação”.

Knight disse que a Amazon estudaria detalhadamente o que deu errado e aprenderia lições com a interrupção.

“Eles vão encontrar a causa raiz”, disse ele. ‘E então eles vão melhorar seus processos.’

“Eles sairão mais fortes para isso”, disse ele, “e farão tudo o que puderem para garantir que isso não aconteça novamente”. Mas a verdade é que todos temos que conviver com isso. E da próxima vez poderia ser pior.

Source link