Какие угрозы необходимо предусмотреть на этапе проектирования ЦОД, чтобы не пришлось его экстренно восстанавливать после ЧС

Фото freepik.com
Любой вопрос о надежности работы ЦОДа с точки зрения инженерной инфраструктуры закладывается и прорабатывается еще на стадии его проектирования. То есть, ЦОДа еще нет, а уже должно быть решено, как будет реализована его защита в случае той или иной угрозы. Какие угрозы надо предусмотреть прежде всего, и как можно защититься от их серьезных последствий, рассмотрим подробнее.

Автор: Леонид Юль, директор по развитию компетенций ЦОД C3 Solutions

Проблемы с электроснабжением

Система электроснабжения ЦОДа должна иметь резерв на тот случай, если электропитание на основной магистрали пропадет из-за аварии на территории ЦОДа или за его пределами. В идеале, должно быть несколько поставщиков электроэнергии, плюс их магистрали лучше географически разнести на случай форс-мажорных обстоятельств. Например, чтобы экскаватор не мог случайно повредить все кабели одновременно. Причем географическая разнесенность не зависит от уровня защиты. Если есть требование по резервированию, то необходимо предусмотреть чтобы резервы были сосредоточены не в одной точке.

В случае, если электропитание одного из вводов ЦОДа будет отключено, аккумуляторы обеспечат время автономной работы ЦОДа достаточное для переключения на другой ввод или запуска ДГУ.

Следующий вопрос, который должен быть решен заранее – как долго ЦОД сможет работать от дизель-генераторов? Например, что будет, если электропитания не будет 12 часов? Очевидно, что для работы от генераторов в течение длительного срока на территории ЦОДа должны находиться цистерны с топливом, а также должна быть обеспечена возможность получить дополнительный объем топлива, если это потребуется. Причем количество и мощность ДГУ должны обеспечить питанием 100% нагрузки ЦОД. На стадии проектирования решается, где на территории ЦОДа будут места для цистерн и парковки транспорта поставщика топлива, какими будут входные ворота, чтобы машина с большой цистерной проезжала без проблем, какой должна быть территория, чтоб было удобно производить разгрузку.

Также надо заранее позаботиться о том, чтобы заключить как минимум два договора с организациями- поставщиками дизельного топлива. В договорах должны быть прописаны SLA: топливо должно доставляться не более чем за определенное количество часов, не менее чем в оговоренном объеме. Топливо должно быть доставлено и перелито до момента исчерпания собственного запаса. Обычно это от 4 часов до половины суток. Соблюдение этих норм корпоративной стратегии безопасности – гарантия того, что ЦОД сможет работать без подачи электроэнергии достаточно длительное время.

Пожары

Для ликвидации возгораний в ЦОДах используется, прежде всего, газовое пожаротушение. Это самый распространенный  способ сохранить оборудование, поскольку любые другие способы тушения - распыление воды, подача углекислых газов или пены - не гарантируют сохранности оборудования. Еще на этапе проектирования определяются объемы помещений и рассчитываются необходимые для них запасы ГОТВ (газовые огнетушащие вещества).

В ЦОДах развертывается система газового пожаротушения. По условиям государственного регулирования любая система газового пожаротушения должна иметь двойной объем газа для всех помещений, нуждающихся в тушении газом. Первого объема должно быть достаточно для того, чтобы ликвидировать пожар в ЦОД один раз. Второй объем нужен на тот случай, если нужно будет обеспечить повторное тушение до момента пополнения запасов газа.

Необходимо помнить, что при пожаротушении всегда руководствуются государственными регламентами, которые обеспечивают в первую очередь сохранность человеческих жизней.

Атаки дронов

Это новая угроза: еще несколько лет назад о защите от атак дронов задумываться не приходилось, сейчас же это становится актуальным направлением. Здесь есть нюансы: нельзя делать все, что угодно, ради того, чтобы спасти ЦОД, потому что, спасая железо, пусть и стоимостью несколько миллионов долларов, можно случайно перенаправить риск на человека или социальный объект. Данная область пока не регламентирована и сложно комментировать какие либо варианты защиты от дронов.

Неустойчивая работа каналов связи

Любой ЦОД - это не «вещь в себе», он взаимодействует с внешним миром, получает данные извне, после обработки передает их дальше. Соответственно, каналы передачи данных должны быть надежно защищены. В ЦОД должны заходить не 2-3, а, скажем, 5-10 операторов связи, каждый из которых выполняет требования по наличию резервного канала связи, в идеале - тоже географически разнесенного. Еще на этапе проектирования необходимо предусмотреть прокладывание каналов связей с возможностью подключения нескольких провайдеров или предоставления  «темных волокон» в аренду.

Отсутствие запчастей к оборудованию

Еще одна новая угроза – в силу санкций и ухода с российского рынка ряда вендоров становится крайне сложным достать запчасти. К плановому или внеочередному ремонту оборудования уже невозможно подготовиться так легко, как прежде. В связи с этим нужно заранее определиться с действиями на случай выхода из строя такого оборудования. Пути решения проблемы два. Либо необходимо заранее находить способы по мере необходимости и все же доставать дефицитные запчасти, либо перестраивать инфраструктуру ЦОДа на основе решений тех брендов, которые в доступе на отечественном рынке.

Здесь надо учитывать, что в случае выхода из строя какой-либо детали ее необходимо заменить в течение определенного, заранее проработанного времени, и для разных элементов оно будет разным. Скажем, вентилятор надо успеть поменять за час, компрессор - за день, а замена полностью вышедшего из строя внешнего блока потребует два месяца в зависимости от наличия запчастей и сложности ремонта. К этому нужно быть готовыми, в том числе, процедурно.

На случай выхода из строя кондиционеров или любой критически важной техники в ЦОДе должен быть ЗИП – комплект запасных частей – для оперативного восстановления работы.

Выводы

Защита от чрезвычайных ситуаций - многоплановая работа, которая начинается на стадии проектирования и не заканчивается никогда. Моделирование угроз, проверка на ЧС при пусконаладочных работах в ЦОД, периодические тренировки для подтверждения актуальности уровня защиты, разбор произошедших чрезвычайных ситуаций на предмет их предотвращения или минимизации последствий - вот основные приемы, которые необходимо использовать, чтобы обеспечить минимальную устойчивость работы ЦОД.

Тематики: Интеграция

Ключевые слова: ЦОД, телекоммуникационное оборудование, ИТ инфраструктура, Инженерная инфраструктура, C3 Solutions