Для того, чтобы выбрать надежный ЦОД для дальнейшего сотрудничества, нужно в общих чертах понимать, как он работает.
Функциональность современного дата-центра охватывает несколько ключевых направлений, без которых инфраструктура их заказчиков просто не может работать в полной мере. Эти основные компоненты включают в себя:
1. Энергоснабжение
Надежная подача электричества — основа работы ЦОД. В условиях санкций российские ЦОД больше не могут рассчитывать на новые западные генераторы высокой производительности. Китайские и отечественные аналоги, несмотря на более низкий класс надежности, показали себя достаточно стабильными, но требуют дополнительных решений для достижения нужного уровня резервирования и более внимательного обслуживания.
Для обеспечения высокого уровня надежности и бесперебойности работы современная система энергоснабжения должна состоять из трех элементов: двух независимых лучей питания от города, источников бесперебойного питания (ИБП) и дизельных генераторов (ДГУ) или иных источников генерирования электроэнергии. В случае, если по одному из лучей пропало энергоснабжение, всю нагрузку кратковременно подхватывают ИБП. В параллель с этим стартуют ДГУ и плавно берут нагрузку на себя до возобладания основного энергоснабжения от города. Так обеспечивается полное резервирование системы энергоснабжения.
2. Климат-контроль
Охлаждение серверов и прочего вычислительного оборудования — сложнейшая задача, особенно в условиях возросшей энерговооруженности стойко-мест из-за более производительных процессоров, а также повсеместного использования ресурсов GPU. Привычные системы охлаждения стали малодоступными из-за ограничений, и российские компании вынуждены переходить на решения, которые можно достать без перебоев в поставках и срыва сроков: азиатские аналоги меньшей производительности или российские разработки в области климатических систем.
В некоторых случаях это требует кардинальной перестройки инженерных систем и обслуживания, закупок новых запасных частей и адаптации команд под обслуживание новых систем. Кроме того, в таких условиях важно обращать пристальное внимание на резервирование системы охлаждения. Важно, чтобы выход из строя любого из элементов системы не повлек за собой приостановку или нарушение целевых показателей работы всей климатики.
Часть операторов ЦОД, накопивших колоссальный опыт и экспертизу в этой индустрии, уходят в RnD для того, чтобы разработать строго под свои запросы «кастомные» решения, обеспечивающие должный уровень надежности и производительности. Впоследствии некоторые из них реализуют свои наработки на открытом рынке.
3. Сетевая связность и доступность каналов связи
Для большинства компаний ЦОД выступают узловыми точками для подключения к сети и передачи данных. Высокая надежность подключения критична для стабильной работы оборудования, так как даже кратковременные перебои могут привести к серьезным сбоям, а также финансовым и репутационным потерям для клиентов ЦОД.
Поэтому в ЦОДах должно быть множество операторов связи с различными сетевыми ресурсами. При этом оптоволоконные трассы должны приходить в ЦОД непересекающимися маршрутами, чтобы исключить единые точки отказа. Операторские комнаты (Meet-me-Rooms), где непосредственно размещается активное оборудование операторов связи, важно задублировать и разнести по территории ЦОД также в целях отказоустойчивости. Доступ к кабельной линии должен быть только у сотрудников ЦОД, чтобы исключить преднамеренный и непреднамеренный человеческий фактор.
4. Безопасность
Дата-центр защищает оборудование клиентов не только от физических угроз, но и от киберугроз. В условиях современных вызовов безопасность приобрела новый уровень значимости. Помимо традиционных мер, в российских ЦОДах усиливается контроль доступа, в том числе с использованием биометрических данных, досмотр въезжающего и выезжающего транспорта, устанавливается повсеместное видеонаблюдение и появляется больше шлюзовых зон (man traps). С особым вниманием относятся к готовности команды реагировать на любые риски и к противодействию физическими виртуальным угрозам.
5. Мониторинг и обслуживание
Постоянный мониторинг всех систем ЦОД — обязательное условие для поддержания их работоспособности. Это требует значительных усилий со стороны технических команд, которые должны быть готовы оперативно реагировать на любые отклонения в работе систем. Эффективная организация и оркестрация всех этих компонентов — конкурентное преимущество на любом рынке, включая российский.
Санкции ограничили доступ к западному оборудованию, и теперь значительная доля используемых в ЦОД компонентов поступает из Китая. Однако китайская продукция, несмотря на свою доступность, имеет специфические особенности.
Например, часто наблюдается изменение компонентной базы от партии к партии в рамках производства. Соответственно, для одного и того же оборудования из разных партий может требоваться разный набор запасных частей. А это приводит к увеличению капитальных и складских запасов, а также усложняет процесс поддержки. Кроме того, китайские решения нередко уступают западным по эффективности и надежности.
Например, китайские генераторы менее производительны и требуют дополнительного резервирования, а климатические системы нуждаются в усиленной адаптации под российские условия.
Несмотря на это, крупные игроки научились обходить данные ограничения и продолжают предоставлять сервисы, удовлетворяющие растущим требованиям к безопасности и производительности.