Interrupção dos serviços da Amazon Web Services atinge grandes sites: O que sabemos até agora enquanto a recuperação começa
A Amazon Web Services (AWS), reconhecida como a principal força no mercado global de infraestrutura em nuvem, enfrentou uma interrupção significativa na segunda-feira, 20 de outubro de 2025, que derrubou uma série de sites e serviços de alto perfil em todo o mundo. Essa falha destacou a vulnerabilidade inerente da infraestrutura digital moderna, onde milhões de empresas e usuários dependem de plataformas centralizadas como a AWS para operações diárias. Embora muitos serviços já tenham sido restaurados, o incidente gerou interrupções em cadeias de suprimentos digitais, afetando desde entretenimento e finanças até transporte e governo. A AWS, subsidiária da gigante do e-commerce Amazon, controla aproximadamente 31% do mercado de nuvem pública, superando concorrentes como Microsoft Azure (cerca de 25%) e Google Cloud (11%), conforme relatórios recentes do Synergy Research Group. Essa dominância significa que falhas como essa podem ter efeitos em cascata, impactando economias digitais inteiras.
O problema inicial foi detectado às 3h11 (horário do Leste dos EUA, ou ET), na região crítica US-East-1 da AWS, sediada no norte da Virgínia, um dos data centers mais movimentados da empresa, responsável por uma parcela substancial do tráfego da internet nos Estados Unidos e além. A página oficial de status da AWS, que monitora em tempo real a saúde de seus serviços, indicou problemas específicos com o DNS (Domain Name System) no DynamoDB, um serviço de banco de dados NoSQL escalável e gerenciado que serve como base para inúmeras aplicações da AWS, incluindo armazenamento de dados de alta performance para sites e apps. O DNS funciona como um “catálogo telefônico” da internet: ele converte nomes de domínio amigáveis, como “www.amazon.com“, em endereços IP numéricos que os dispositivos usam para se conectar a servidores. Qualquer falha nesse sistema pode impedir o carregamento de páginas web, causando erros como “página não encontrada” ou timeouts em navegadores.
Em uma atualização postada às 5h01 ET, a AWS descreveu o incidente como um “problema operacional” que impactava “múltiplos serviços” em sua rede. A empresa enfatizou que estava “trabalhando em múltiplas frentes paralelas para acelerar a recuperação”, uma estratégia comum em cenários de TI para isolar e resolver falhas sem interromper todo o sistema. No total, mais de 70 serviços da AWS foram afetados, incluindo S3 (armazenamento de objetos), EC2 (instâncias de computação em nuvem) e Lambda (computação sem servidor), que são fundamentais para o funcionamento de aplicações web modernas. Esses serviços suportam desde sites de e-commerce até plataformas de streaming e inteligência artificial, ilustrando a interconexão profunda da infraestrutura da AWS.
Pouco tempo após essa atualização, a AWS relatou “sinais significativos de recuperação” em vários fluxos de dados, sugerindo que equipes de engenharia haviam isolado partes do problema. Às 6h35 ET, veio o anúncio de que a questão de DNS no DynamoDB estava “totalmente mitigada”, e as operações dos serviços da AWS “estavam progredindo normalmente”. Isso permitiu que muitos sites e apps começassem a voltar ao ar, aliviando o pânico inicial entre usuários e empresas. No entanto, o progresso não foi linear: por volta das 10h14 ET, a AWS identificou “erros significativos em APIs e problemas de conectividade em múltiplos serviços”. As APIs (Application Programming Interfaces) atuam como “pontes” entre softwares diferentes, permitindo que, por exemplo, um app de delivery se integre a um sistema de pagamento. Erros nessas interfaces podem bloquear transações, atualizações em tempo real e integrações, prolongando o impacto mesmo após a resolução inicial.
Como líder indiscutível no setor, a AWS atende a uma vasta gama de clientes, desde startups até governos e corporações multinacionais. Seus serviços de nuvem, como servidores virtuais, armazenamento escalável e bancos de dados gerenciados, formam a espinha dorsal da economia digital, processando trilhões de transações anualmente. De acordo com o Synergy Research Group, o mercado global de nuvem atingiu quase US$ 100 bilhões no segundo trimestre de 2025, crescendo 25% em relação ao ano anterior, com a AWS impulsionando grande parte desse expansão. Essa dependência centralizada, embora eficiente, amplifica riscos, como visto nessa interrupção.
Empresas e Serviços Afetados em Detalhe
O impacto da falha se espalhou rapidamente, conforme registrado pelo site independente Downdetector, que agrega relatos de usuários em tempo real para mapear outages. Os problemas foram reportados em uma ampla variedade de plataformas, revelando a extensão da dependência da AWS. Entre os mais afetados estavam o site principal da Amazon, o serviço de streaming Disney+, o aplicativo de corridas Lyft, o app de pedidos do McDonald’s, o portal de notícias The New York Times, a rede social Reddit, as campainhas inteligentes Ring (da própria Amazon), a plataforma de investimentos Robinhood, o Snapchat, a operadora T-Mobile, a companhia aérea United Airlines, o app de pagamentos Venmo e a Verizon.
No contexto internacional, o Reino Unido sentiu o golpe de forma notável. Sites governamentais como o Gov.uk – portal central para serviços públicos britânicos – e o da HM Revenue and Customs (Receita e Alfândega de Sua Majestade), responsável por declarações fiscais e pagamentos, enfrentaram interrupções, conforme dados do Downdetector. Um porta-voz do governo do Reino Unido informou à CNBC: “Estamos cientes de um incidente afetando a Amazon Web Services, e vários serviços online que dependem de sua infraestrutura. Através de nossos protocolos estabelecidos de resposta a incidentes, estamos em contato com a empresa, que trabalha para restaurar os serviços o mais rápido possível.” Essa coordenação reflete a importância de planos de contingência em governos que migram para a nuvem.
No setor financeiro, o grupo bancário Lloyds, um dos maiores do Reino Unido, confirmou que alguns de seus serviços digitais – incluindo apps de mobile banking e portais online – foram interrompidos. A empresa pediu aos clientes que “tivessem paciência” enquanto as equipes técnicas restauravam a funcionalidade. Apenas 20 minutos após o anúncio inicial, o Lloyds atualizou que os serviços estavam “voltando ao ar progressivamente”, priorizando transações críticas como transferências e pagamentos.
Dentro da própria Amazon, o outage paralisou operações logísticas essenciais. Funcionários de armazéns e centros de distribuição, bem como motoristas do programa Amazon Flex (que permite entregas independentes), relataram no Reddit que sistemas internos, como ferramentas de rastreamento de estoque e roteirização de entregas, ficaram offline em múltiplos locais nos EUA e Europa. Em fóruns como r/AmazonFC e r/AmazonFlexDrivers, trabalhadores descreveram cenas de inatividade: alguns foram instruídos a permanecer em salas de descanso ou áreas de carregamento durante seus turnos, sem acesso ao app Anytime Pay, que oferece adiantamento salarial imediato. Essa ferramenta, lançada para melhorar a retenção de mão de obra, depende de integrações em nuvem para verificações em tempo real.
Outro componente crítico afetado foi o Seller Central, a plataforma dedicada a vendedores terceirizados da Amazon – que representam mais de 60% das vendas da empresa. Milhares de merchants usavam o portal para gerenciar inventários, preços e envios, e sua queda interrompeu atualizações em tempo real, potencialmente custando milhões em vendas perdidas durante o pico de compras online.
No mundo das redes sociais e entretenimento, o Reddit enfrentou sobrecarga, com seu tráfego caindo drasticamente. Um porta-voz da empresa disse à CNBC: “Estamos trabalhando para escalar o Reddit de volta a 100% agora mesmo”, destacando esforços para redistribuir carga em servidores redundantes. Clientes de companhias aéreas como United e Delta Air Lines compartilharam nas redes sociais frustrações ao não conseguirem localizar reservas, fazer check-in online ou despachar bagagens em aeroportos. Por exemplo, relatos no X (antigo Twitter) mencionavam filas virtuais impossíveis de processar, exacerbando atrasos em voos já pressionados por questões operacionais.
O setor de games e criptomoedas também sofreu. Jogos baseados em nuvem, como Roblox (com milhões de usuários diários) e Fortnite (da Epic Games), viram quedas em servidores, interrompendo sessões multiplayer e compras in-game. A Coinbase, uma das maiores exchanges de criptoativos, alertou que “muitos usuários não conseguiam acessar a plataforma devido à falha na AWS”, afetando negociações em um mercado volátil onde segundos contam.
Ferramentas criativas e de produtividade não escaparam: a Canva, popular para design gráfico, reportou “taxas de erro significativamente aumentadas que impactam a funcionalidade”, atribuindo diretamente ao “principal provedor de nuvem”. Usuários relataram falhas ao editar templates ou exportar arquivos, paralisando workflows remotos. Até mesmo o Perplexity, uma ferramenta de busca generativa com IA desenvolvida pela Perplexity AI, foi impactado. Seu CEO, Aravind Srinivas, postou no X: “A causa raiz é um problema na AWS. Estamos trabalhando para resolver isso”, destacando como até inovações em IA dependem de infraestruturas estáveis.
Dependência da Tecnologia Centralizada e Lições Históricas
Esse incidente não é isolado; ele reforça a fragilidade da infraestrutura tecnológica global, onde a centralização em poucos provedores cria pontos únicos de falha. Em julho de 2024, uma atualização de software defeituosa da CrowdStrike, líder em cibersegurança, causou o “apagão azul” em milhões de sistemas Windows da Microsoft, resultando em prejuízos estimados em bilhões de dólares. O evento grounded milhares de voos, interrompeu cirurgias em hospitais e travou transações em bancos, expondo como atualizações rotineiras podem escalar para crises globais.
A AWS, especificamente, tem um histórico de interrupções que ilustram padrões recorrentes. Em junho de 2023, uma falha em serviços de rede deixou sites como Slack e partes do governo dos EUA offline por várias horas, atribuída a um erro de configuração em roteadores. Mais grave foi o outage de dezembro de 2021, que afetou serviços globais por mais de 12 horas, paralisando entregas da Amazon, Netflix e até o site do governo do Reino Unido. Naquele caso, um erro em um serviço de controle de capacidade propagou falhas em cadeia, custando à economia digital estimados US$ 100 milhões por hora, segundo analistas da Gartner.
Especialistas em cibersegurança enfatizam que esses eventos geralmente não envolvem ameaças maliciosas. “Não há indícios de que essa falha na AWS tenha sido causada por um ciberataque – parece um erro técnico em um dos principais data centers da Amazon”, afirmou Rob Jardin, chief digital officer da NymVPN, uma empresa especializada em privacidade online. Ele explicou: “Esses problemas ocorrem quando sistemas ficam sobrecarregados, como durante picos de tráfego, ou quando uma parte chave da rede, como um switch ou roteador, falha. Porque tantos sites e apps dependem da AWS – de e-commerces a bancos e governos –, o impacto se espalha rapidamente, como um dominó digital.”
Um porta-voz da Amazon, quando contatado pela CNBC, direcionou para o painel de saúde de serviços da AWS, que oferece transparência em tempo real mas nem sempre detalhes profundos sobre causas raiz. Mike Chapple, professor de TI na Mendoza College of Business da Universidade de Notre Dame e ex-cientista de computação na Agência de Segurança Nacional (NSA) dos EUA, contextualizou o papel do DynamoDB: “Não é um termo que a maioria dos consumidores conhece, mas é um dos guardiões de registros da internet moderna.” Ele observou que relatórios iniciais sugerem que o problema não foi no banco de dados propriamente dito – os dados parecem intactos e seguros, sem relatos de perda ou corrupção. Em vez disso, algo falhou nos metadados ou índices que orientam outros sistemas a localizar e acessar os dados, possivelmente devido a uma sobrecarga ou bug em um subsistema de rede.
Chapple alertou para implicações mais amplas: “Essa episódio serve como um lembrete de como o mundo depende de um punhado de grandes provedores de nuvem: Amazon, Microsoft e Google. Quando um deles ‘espirra’, a internet inteira pega um resfriado.” Relatórios da Forrester Research indicam que, até 2025, mais de 90% das novas aplicações corporativas serão baseadas em nuvem, aumentando a urgência por diversificação e resiliência. Empresas afetadas, como as mencionadas, frequentemente adotam estratégias de multi-nuvem para mitigar riscos, mas a migração é complexa e cara. Incidentes como esse impulsionam discussões sobre regulamentações, como as da União Europeia sob o Digital Services Act, que exigem maior transparência de big techs em outages.
À medida que a recuperação prossegue, analistas monitoram para lições aprendidas. A AWS tipicamente publica relatórios pós-incidente detalhados, e espera-se que este inclua melhorias em redundância de DNS e monitoramento proativo. Para usuários e empresas, o evento reforça a necessidade de planos de backup robustos, como caches locais e provedores alternativos, para minimizar disrupções futuras.
A informação é coletada da CNBC e da BBC.
