Notícias

Explicação das interrupções da AWS: por que a Internet quebrou enquanto você dormia

A internet começa a semana da mesma forma que muitos de nós costumamos fazer: recusando-nos a ir trabalhar. Uma interrupção na Amazon Web Services deixou grandes áreas da Internet indisponíveis na manhã de segunda-feira, indisponibilizando brevemente sites e serviços, incluindo Snapchat, Fortnite, Venmo, PlayStation Network e, previsivelmente, Amazon.

A interrupção começou pouco depois da meia-noite (horário do Pacífico) e levou cerca de 3,5 horas para a Amazon ser totalmente resolvida. As redes sociais e os serviços de streaming foram afetados em mais de 1.000 empresas, e serviços críticos, como serviços bancários online, também caíram. Você provavelmente encontrará a maioria dos sites e serviços operando normalmente esta manhã, mas alguns efeitos indiretos provavelmente serão observados ao longo do dia.

AWS, um provedor de serviços em nuvem de propriedade da Amazon, alimenta grande parte da Internet. Portanto, quando caiu, levou consigo muitos dos serviços que conhecemos e amamos. como com rapidamente E Greve coletiva As interrupções nos últimos anos, as interrupções na AWS mostram o quanto a Internet depende da mesma infraestrutura – e com que rapidez o nosso acesso aos sites e serviços dos quais dependemos pode ser revogado se algo der errado. Depender de um pequeno número de grandes empresas para sustentar a web é como colocar todos os nossos ovos em um pequeno punhado de cestas.

Quando funciona, é ótimo, mas basta uma pequena coisa dar errado para a Internet cair de joelhos em questão de minutos.

Quão generalizada foi a interrupção da AWS?

Pouco depois da meia-noite (horário do Pacífico) de 20 de outubro, a AWS registrou pela primeira vez um problema Página Status do serviçodisse que estava “investigando o aumento das taxas de erro e latência para vários serviços AWS na região US-EAST-1”. Por volta das 2h, horário do Pacífico, disse ter identificado uma possível causa raiz do problema e, em meia hora, começou a implementar mitigações que mostram sinais significativos de recuperação.

“O problema subjacente do DNS foi totalmente mitigado e a maioria das operações de serviço da AWS agora estão funcionando normalmente”, disse a AWS às 3h35, horário do Pacífico. A empresa não respondeu a uma solicitação de comentários adicionais além de nos direcionar de volta ao painel do AWS Health.

Na época em que a AWS anunciou que começou a notar taxas de erro, o Downdetector viu os relatórios começarem a aumentar em muitos serviços online, incluindo bancos, companhias aéreas e operadoras de telefonia. À medida que a AWS resolveu o problema, alguns desses relatórios diminuíram, enquanto outros ainda não voltaram ao normal (Divulgação: o Downdetector é propriedade da mesma empresa-mãe da CNET, Jeff Davis).

Às 4h, horário do Pacífico, o Reddit ainda estava fora do ar, enquanto serviços como Ring, Verizon e YouTube ainda apresentavam um número significativo de problemas relatados. O Reddit finalmente voltou a ficar online por volta das 4h30, horário do Pacífico, de acordo com sua página de status, que foi verificada por nós.

No total, o Downdetector viu mais de 6,5 milhões de relatórios, dos quais 1,4 milhões vieram dos EUA, 800.000 do Reino Unido e o restante se espalhou principalmente pela Austrália, Japão, Holanda, Alemanha e França. Mais de 1.000 empresas foram afetadas no total, acrescentou Downdetector.

“Esses tipos de interrupções, em que um serviço fundamental de Internet derruba uma grande parte dos serviços online, acontecem apenas algumas vezes por ano”, disse Daniel Ramirez, diretor de produto da Downdetector Okler, à CNET. “Eles provavelmente estão se tornando um pouco mais frequentes à medida que as empresas são incentivadas a confiar inteiramente em serviços de nuvem e suas arquiteturas de dados são projetadas para aproveitar ao máximo uma plataforma de nuvem específica”.

O que causa interrupções na AWS?

A AWS não compartilhou todos os detalhes do que fez com que a Internet caísse do penhasco esta manhã. Provavelmente, agora que uma correção foi implementada, a próxima etapa será investigar o que deu errado.

Até agora, isso foi atribuído a uma interrupção de “problema de DNS”. DNS significa Sistema de Nomes de Domínio e refere-se ao serviço que traduz endereços de Internet legíveis por humanos (por exemplo, CNET.com) em endereços IP legíveis por máquina que conectam navegadores a sites.

Quando ocorre um erro de DNS, o processo de tradução não pode ocorrer, interrompendo a conectividade. Erros de DNS são obstáculos comuns na Internet, mas geralmente ocorrem em pequena escala, afetando sites ou serviços individuais. Mas como a AWS é tão amplamente usada, um erro de DNS pode ter consequências igualmente generalizadas.

De acordo com a Amazon, o problema está geograficamente enraizado na região US-EAST-1, que se refere a uma área na Virgínia do Norte onde estão localizados muitos dos seus data centers. É um local importante para a Amazon, bem como para muitas outras empresas de Internet, e oferece suporte a uma ampla gama de serviços nos Estados Unidos e na Europa.

“A lição aqui é resiliência”, disse Luke Kehoe, analista industrial da Okla.”Muitas organizações ainda concentram cargas de trabalho críticas em uma única região de nuvem. Distribuir aplicativos e dados críticos em múltiplas regiões e zonas de disponibilidade pode reduzir materialmente o raio de explosão de incidentes futuros.”

A interrupção da AWS foi causada por um ataque cibernético?

Os problemas de DNS podem ser causados ​​por atores mal-intencionados, mas não há evidências neste estágio de que esse seja o caso da interrupção da AWS.

Embora as falhas técnicas possam abrir caminho para que os hackers encontrem vulnerabilidades quando a empresa vira as costas e as defesas caem, de acordo com Marijas Bridis, CTO NordVPN. “Esta é uma questão de segurança cibernética tanto quanto técnica”, disse ele em comunicado. “A verdadeira segurança online não consiste apenas em manter os hackers afastados, mas em garantir que você permaneça conectado e protegido quando os sistemas falharem.”

Nas próximas horas, as pessoas devem estar atentas a golpistas que esperam tirar vantagem da conscientização pública sobre a interrupção, acrescentou Brydis. Você deve ter cuidado extra com ataques de phishing e e-mails solicitando que você altere sua senha para manter sua conta segura.



Link da fonte

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *