A interrupção da Cloudflare na terça-feira, que interrompeu o acesso a muitos sites e serviços, incluindo OpenAI, Spotify, X, Grindr, Letterboxd e Canva, foi a pior interrupção da empresa desde 2019, disse o CEO Matthew Prince.
Outras interrupções centram-se em funções específicas da rede. Príncipe escreveu Em uma postagem no blog. “No entanto, nos últimos seis anos, nunca tivemos uma falha que impedisse uma parte significativa do nosso tráfego principal de fluir através da nossa rede.”
Cloudflare é uma empresa de serviços em nuvem e segurança cibernética com sede em São Francisco, usada por aproximadamente 20% de todos os sites. De acordo com W3Techs. Este é um dos poucos serviços que Amazon Web Services, ataque de nuvem e rapidamente (Ambos sofreram grandes interrupções nos últimos anos.) Talvez você nunca tenha ouvido falar deles, mas eles fornecem infraestrutura crítica de Internet.
A maioria dos sites e serviços afetados pela interrupção, que começou por volta das 3h30, horário do Pacífico, na terça-feira, pareceu ser restaurada em pouco mais de três horas. No final do dia, tudo voltou ao normal e a Cloudflare começou a explicar o que deu errado. Aqui está o que você precisa saber:
O que está causando a interrupção do Cloudflare?
A Cloudflare fez questão de enfatizar que a interrupção não foi causada direta ou indiretamente por um ataque cibernético. Prince disse em seu blog que a empresa inicialmente suspeitou que um “ataque DDoS em grande escala” fosse o culpado. No entanto, a interrupção ocorreu devido a uma falha interna de software.
Uma mudança em um dos bancos de dados da Cloudflare produziu um arquivo de recursos maior do que o esperado, grande demais para ser executado pelo software da empresa, disse Prince. Isso fez com que o software falhasse.
Depois que a Cloudflare identificou o problema, conseguimos substituir o arquivo incorreto por uma versão anterior e, às 6h30, horário do Pacífico, a maior parte do tráfego estava fluindo normalmente novamente.
“Pedimos desculpas pelo impacto em nossos clientes e na internet em geral”, disse Prince. “Dada a importância da Cloudflare para o ecossistema da Internet, qualquer interrupção em nossos sistemas é inaceitável. Passar por um período em que nossa rede não conseguiu rotear o tráfego tem sido extremamente angustiante para todos os membros da nossa equipe. Sabemos que os decepcionamos hoje.”
Quais sites e serviços foram afetados?
A Cloudflare tem uma ampla gama de clientes na Internet, desde sites conhecidos até pequenos serviços dos quais você nunca ouviu falar. Devido à sua escala, muitos sites e serviços também foram perdidos quando ele caiu.
Downdetector estava entre os afetados por esta interrupção. É onde a maioria das pessoas vai para relatar problemas quando o serviço fica offline. (O Downdetector é propriedade de Ziff Davis, a mesma empresa-mãe da CNET.)
Depois de voltar a funcionar, o Downdetector disse ter recebido mais de 2,1 milhões de relatórios durante a interrupção. Mais de 435.000 destes casos vieram dos EUA, acreditando-se que o Reino Unido, o Japão e a Alemanha sejam os próximos países mais afetados.
A interrupção do Cloudflare causou a queda de vários sites e serviços. Esta é apenas uma amostra do site Downdetector.
A maioria dos relatórios era sobre a Cloudflare, mas também recebemos vários relatórios de outras empresas afetadas. Estes incluem X (320.549 relatórios), League of Legends (130.260 relatórios), OpenAI (81.077 relatórios), Spotify (93.377 relatórios) e Grindr (25.031 relatórios).
Como foi a evolução da queda de energia?
A Cloudflare tomou conhecimento da interrupção pela primeira vez às 3h48, horário do Pacífico. A empresa emitiu um comunicado. Página de status do sistema Ele disse que estava ciente do problema.
“A Cloudflare está ciente e investigando um problema que afeta vários clientes. Erros 500 generalizados, os painéis e APIs da Cloudflare também estão falhando”, disse a empresa. “Estamos entendendo totalmente o impacto e trabalhando para mitigar esse problema. Mais atualizações serão disponibilizadas em breve.”
A empresa anunciou às 5h09, horário do Pacífico, que o problema havia sido identificado e uma correção estava em vigor. Nas horas seguintes, os erros começaram a diminuir e o serviço gradualmente voltou a ficar online.
A Cloudflare acrescentou às 9h14, horário do Pacífico, que a maioria dos serviços voltou ao normal. “Uma investigação completa pós-incidente e os detalhes do incidente serão revelados o mais rápido possível.”
A Internet é estável e confiável?
A interrupção do Cloudflare ocorre apenas um mês depois que uma interrupção do Amazon Web Services causou estragos na Internet. A interrupção da AWS afetou sites como Reddit, Snapchat, Roblox e Fortnite, levando muitos a questionar se é sensato ou seguro confiar em um pequeno número de serviços centralizados para uma Internet tão vasta.
“Embora a interrupção do Cloudflare não seja explicitamente causada ou relacionada às interrupções do AWS ou Azure do mês passado, ela ilustra o impacto do risco de concentração, assim como essas interrupções”, disse Brent Ellis, analista principal da Forrester Research. “Neste caso, uma interrupção de 3 horas e 20 minutos poderia resultar em aproximadamente US$ 250 milhões a US$ 300 milhões em perdas diretas e indiretas, considerando o custo do tempo de inatividade e o impacto posterior em serviços como Shopify e Etsy, que hospedam lojas para dezenas a centenas de milhares de empresas.”
A interrupção do serviço do OpenAI, fabricante do ChatGPT, destacou particularmente as preocupações sobre os crescentes investimentos em inteligência artificial e vulnerabilidades na infraestrutura em nuvem da qual a IA depende para funcionar todos os dias.
“A plataforma mais dominante falhou não por causa de consultas simultâneas ou do lançamento de um novo modelo concorrente, mas por causa de problemas com o provedor de segurança e desempenho da Web Cloudflare”, disse Sarah Kreps, diretora do Technology Policy Institute da Cornell University. “Esta questão expõe a realidade de que bilhões ou mesmo trilhões de dólares em investimentos em IA são tão confiáveis quanto a infraestrutura de terceiros menos avaliada.”


















