Крупные сбои в работе облачных сервисов могут нарушить работу банковских, коммуникационных, игровых, образовательных платформ и смарт-устройств. Сбой в одном-единственном облачном регионе может привести к отключению пользователей и организаций от сети, нарушению работы сервисов и выявлению уязвимостей операционной деятельности.
20 октября сбой в регионе Amazon Web Services (AWS) в Северной Вирджинии привёл к прекращению работы многих веб-сайтов и приложений. Если информация подтвердится, причиной сбоя root стали автоматизированные внутренние процессы, управляющие записями системы доменных имён (DNS). Из-за ошибки некоторые внутренние сопоставления адресов были рассинхронизированы, что помешало системам преобразовывать доменные имена в IP-адреса, используемые компьютерами для доступа к ним. Amazon принесла извинения и заявила, что рассмотрит причины сбоя для повышения доступности.
Поставщики облачных услуг, такие как AWS, предоставляют вычислительные ресурсы, хранилища и сетевые решения тысячам компаний. Многие предприятия и приложения используют облачные регионы в одном регионе для снижения задержек или по соображениям экономии. Такая концентрация создаёт риск: в случае сбоя в регионе все зависимые сервисы могут столкнуться со снижением производительности или полным отказом.
DNS — критически важная функция интернета. Она преобразует понятные пользователю доменные имена в числовые IP-адреса. Если записи DNS становятся недоступными или несогласованными, браузеры и приложения не могут найти серверы. В данном случае, согласно отчётам, внутренние процессы DNS и сопоставления адресов не синхронизировались. Автоматизированные действия по обновлению или репликации записей могли спровоцировать нестабильную последовательность событий. При использовании автоматизации небольшие проблемы синхронизации могут быстро распространяться на многие системы.
На кого это повлияет? Потребители, использующие онлайн-банкинг, платёжные приложения, социальные сети и стриминговые сервисы, могут временно потерять доступ. Компании, использующие облачную инфраструктуру для веб-сайтов, инструментов для совместной работы, POS-систем или интеграции с Интернетом вещей, также могут остаться без обслуживания. Школы, использующие облачные платформы обучения или системы единого входа, рискуют столкнуться с перебоями в проведении уроков и доступом учащихся. Интеллектуальные устройства, предполагающие постоянное подключение к сети, могут вести себя непредсказуемо или, в редких случаях, переходить в небезопасное состояние (например, управление отоплением, которое невозможно отрегулировать удалённо).
Типичные ошибки конфигурации и пути риска включают в себя развёртывания в одном регионе, отсутствие или непроверенные маршруты аварийного переключения, чрезмерную зависимость от DNS, управляемого провайдером, без локальных резервных решений и предположение о том, что автоматизация всегда работает безупречно. Злоумышленники также могут воспользоваться перегруженной или недоступной сторонней инфраструктурой во время инцидентов, хотя признаки вредоносной активности не проявляются в каждом сбое.
Для домохозяйств сбой может привести к сбоям в работе банковских служб, входу в систему школ, видеозвонкам, управлению умным домом и развлечениям. Родители могут не успеть до школы или оплатить необходимые товары. Дети могут потерять доступ к платформам для выполнения домашних заданий или средствам связи в критические моменты. Поведение устройств также может измениться: умные кровати, термостаты или камеры видеонаблюдения, использующие облачные сервисы, могут перестать реагировать или вернуться к локальным настройкам по умолчанию.
Малый бизнес сталкивается с потерей продаж, перебоями в обслуживании клиентов и проблемами с соблюдением нормативных требований, если записи или квитанции недоступны. Сбои в обработке платежей влияют на денежный поток. Если у компании нет доступа к облачным сервисам для расчета заработной платы, кадрового менеджмента или бухгалтерского учета, ей может быть сложно выполнять свои обязательства в срок.
Конфиденциальность и уязвимость данных: сбои сами по себе не являются нарушениями. Но при сбоях в работе систем команды могут применять экстренные обходные пути. Такие импровизированные решения могут увеличить риск нарушения конфиденциальности. Например, переход на личную электронную почту для конфиденциальных данных клиентов или вход в учётные записи с неавторизованных устройств может создать новые поверхности для атак. Всегда документируйте исключения и возвращайтесь к обычным защищённым рабочим процессам после восстановления.
Напоминания о правовых аспектах и согласии: мониторинг и контроль доступа должны соответствовать местному законодательству и условиям договора. Родители должны получать согласие на мониторинг устройств общего пользования. Работодатели обязаны соблюдать правила конфиденциальности на рабочем месте и уведомлять сотрудников о мониторинге. Школы должны соблюдать правила защиты данных учащихся и информировать опекунов о любых принимаемых мерах мониторинга или обеспечения непрерывности учебного процесса.
Консолидация облачных сервисов — давняя тенденция в отрасли. Несколько провайдеров размещают значительную долю веб-сервисов по всему миру. Несмотря на то, что провайдеры активно инвестируют в обеспечение доступности, региональные сбои всё ещё случаются. Этот инцидент подчёркивает необходимость планирования устойчивости как для домохозяйств, так и для предприятий.
Автоматизация снижает количество человеческих ошибок, но позволяет быстро масштабировать ошибки. Относитесь к автоматизированным операциям как к коду: экспертная оценка, поэтапное внедрение и чёткие пути отката крайне важны. Небольшим организациям следует выявить критически важные зависимости и расставить приоритеты в избыточных путях для действительно важных функций.
SPYERA предоставляет законные инструменты мониторинга и контроля устройств на основе согласия, которые помогают семьям, школам и работодателям отслеживать состояние устройств в случае сбоев в работе сервисов. Функции, обеспечивающие отказоустойчивость, включают в себя удаленную проверку статуса, оповещения о подключении и работоспособности приложений, а также централизованную отчетность по инвентаризации устройств. Используйте SPYERA для проверки наличия устройств в сети, оценки подключения к приложениям и получения уведомлений об отключении критически важных конечных точек мониторинга.
SPYERA разработан для ответственного использования. Всегда получайте необходимое разрешение и соблюдайте местные законы о конфиденциальности перед установкой или использованием программного обеспечения для мониторинга. Для организаций SPYERA может интегрироваться в рабочие процессы реагирования на инциденты и предоставлять журналы криминалистической экспертизы для упрощения анализа после инцидента.
Сбои в работе облачных сервисов показывают, почему важны прозрачность и готовность. SPYERA помогает семьям, школам и малым и средним предприятиям осуществлять законный надзор за устройствами и сервисами во время инцидентов. Рассмотрите возможность использования SPYERA для мониторинга подключения устройств, настройки оповещений и документирования перебоев в обслуживании. Всегда получайте согласие и соблюдайте действующее законодательство при мониторинге. Если вы хотите узнать, как SPYERA вписывается в ваш план реагирования на инциденты или обеспечения безопасности семьи, ознакомьтесь с нашими руководствами или свяжитесь с нашей командой для получения решения, соответствующего требованиям.