Новини

Project Storm - спецназ Facebook для ЦОД

Плановые проверки, заводские испытания – те слова, которые нам знакомы и уже давно не вызывают какой-либо полемики. Но ведь эти проверки и испытания тоже бывают разными. К примеру, компания Facebook пошла дальше всех: они полностью отключают свои ЦОДы, чтобы посмотреть на реакцию инфраструктуры и всей системы. На недавней конференции компании в Калифорнии компания представила результаты таких краш-тестов и рассказала о группе быстрого реагирования под кодовым названием Project Storm. Идея подобного спецназа для дата-центра появилась после 29 октября 2012, когда ураган Катрина обрушился на Нью-Джерси. Тогда разрушительные последствия постигли не только улицы и станции метро – ИТ-инфраструктура дата-центров Восточного побережья вышла из строя. ЦОДы Facebook пережили тот шторм – их объекты в Северной Каролине и Вирджинии были далеки от эпицентра. Однако компания задумалась: «А что случится, если наша социальная сеть потеряет целый дата-центр или какой-то регион вследствие катастрофы подобного масштаба?» Тогда и была создана группа Project Storm. Этот «спецназ» (SWAT), как его назвали в Facebook, состоит из порядка 20 лидеров руководителей различных направлений технологий компании, которые руководят группой инженеров во время проведения «штормовых» испытаний, чтобы вся сеть была готова к бесперебойной работе на случай отключения каких-то ее сегментов.
Комментарии: