Масштабна аварія тисячі сервісів: Amazon розкрила причину проблеми.
Цього тижня спостерігалися відключення веб-сайтів, банківських сервісів та "розумних" гаджетів у різних куточках планети.
Компанія Amazon Web Services (AWS) оприлюднила офіційне пояснення причин масштабного збою, який цього тижня призвів до тимчасового відключення тисяч сайтів, застосунків і хмарних сервісів у всьому світі. За даними компанії, проблема виникла через дефект у програмному забезпеченні для автоматизації системи доменних імен (Domain Name System, DNS), що спричинив каскадні відмови в роботі низки ключових інструментів AWS, передає The Guardian.
Згідно з інформацією, наданою компанією в технічному звіті, проблема виникла через помилку в базі даних DynamoDB, де зберігаються DNS-записи клієнтів. Внаслідок "прихованого дефекту" система автоматизації несподівано створила порожній DNS-запис для регіону US-East-1 у Вірджинії, що ускладнило автоматичне усунення збою. Для відновлення функціонування сервісів було необхідно залучити фахівців для ручного втручання.
Після виявлення проблеми AWS тимчасово вимкнула автоматизовані процеси керування DNS для DynamoDB у всьому світі, щоб запобігти повторенню ситуації, і розпочала додавання нових механізмів безпеки та контролю. Представники компанії підкреслили, що планують переглянути внутрішні протоколи автоматизації, аби мінімізувати ризики подібних інцидентів у майбутньому.
За інформацією Downdetector, близько двох тисяч компаній і сервісів стали жертвами недавнього збою. Серед них виявилися такі популярні платформи, як Signal, Zoom, Canva, Snapchat, Roblox, Duolingo, а також численні банківські сайти і сервіс Ring doorbell. Загалом користувачі з різних куточків світу повідомили про понад 8,1 мільйона випадків несправностей. Хоча більшість сервісів змогли відновити свою роботу протягом кількох годин, наслідки цього інциденту були відчутні протягом наступної доби.
Збої також вплинули на сферу інтернет-пристроїв. Користувачі компанії Eight Sleep, що спеціалізується на виробництві "розумних ліжок", скаржилися на неможливість регулювати температуру чи положення своїх ліжок за допомогою мобільного застосунку. Генеральний директор компанії, Маттео Франческотті, вибачився публічно та оголосив про майбутнє оновлення програмного забезпечення, яке забезпечить можливість керування основними функціями ліжка через Bluetooth, навіть у разі відсутності інтернет-з’єднання.
За словами експертів, цей інцидент виявив слабкі місця в глобальній інфраструктурі Інтернету. Докторка Сьюлетт Дрейфус, викладачка комп'ютерних наук Мельбурнського університету, підкреслила, що такі ситуації ілюструють, наскільки світова цифрова економіка покладається на обмежене коло постачальників хмарних послуг.
"Спочатку Інтернет був задуманий як надійна децентралізована система. Однак, з часом ми втратили частину цієї надійності, оскільки стали залежними від кількох великих технологічних компаній, які тепер контролюють більшість обчислювальних і хмарних ресурсів у світі," – зазначила Дрейфус.
За даними експертів, AWS сьогодні контролює приблизно 30% світового сегмента хмарних сервісів, що робить її невід'ємною частиною цифрової інфраструктури. Недавній збій в роботі став яскравим нагадуванням про те, як навіть незначна перерва в функціонуванні одного з таких важливих елементів може серйозно вплинути на технологічні та бізнес-процеси по всьому світу.
Раніше правозахисна організація Amnesty International опублікувала звіт, у якому закликала уряди рішучіше протидіяти впливу та монополії технологічних гігантів, таких як Google, Meta, Microsoft, Amazon та Apple, через ризики для прав людини. На думку організації, концентрація їхньої "влади" загрожує приватності користувачів та вільному доступу до інформації.