Последние обсуждения Поиск
Новые форумы
Общие форумы
Форумы поддержки портала iXBT.com
Специализированные форумы
ПроцессорыРазгон и охлаждениеСистемные платыМодули памятиВидеосистемаКриптовалюты, майнинг, blockchain-технологии, NFTИскусственный интеллект: технологии, практика, развитиеTV- и FM-тюнеры, видеовход, видеовыходЦифровое видео: захват, монтаж, обработкаМониторы и другие устройства отображенияЦифровое фотоБеспилотные летательные аппаратыЦифровой звукProAudio: Профессиональное звуковое оборудованиеСтереосистемыДомашний кинотеатр: проигрыватели и источники сигналаДомашний кинотеатр: аудиосистемаДомашний кинотеатр: ТV и проекторыМагнитные и SSD накопителиОптические носители информацииСетевые носители информацииПериферияКорпуса, блоки питания, UPSСети, сетевые технологии, подключение к интернетуСистемное администрирование, безопасностьСерверыНоутбуки, нетбуки и ультрабукиПланшеты и электронные книгиМобильные телефоны, смартфоны, кпк, коммуникаторыМобильные гаджетыОператоры и технологии мобильной связиТелефония, телекоммуникации, офисные АТСБытовая техника
Программы
Игры
Авторские форумы
Прочие форумы
Архивы конференции
Архив "О Конференции"Архив "Процессоры"Архив "Разгон и охлаждение"Архив "Системные платы"Архив "Модули памяти"Архив "Видеосистема"Архив "Видеозахват"Архив "Мониторы и другие устройства отображения"Архив "Цифровое изображение"Архив "Цифровой звук"Архив "Периферия"Архив "Корпуса, блоки питания, UPS"Архив "Коммуникации: сети и сетевые технологии"Домашний интернет, модемы (архив)Архив "Системное администрирование, безопасность"Архив "Мобильная связь"Программы Microsoft: Windows, Office, Server, Windows LiveАрхив "OС и системное ПО"Архив "Программы: Интернет"Архив "Программирование"Форум прикладных программистовАрхив "Электронные устройства и компоненты"Архив "Околокомпьютерный Флейм & Общий"Архив "Полемика (Злобный Флейм)"Околоавтомобильный ФлеймФорум ремонтниковВопросы компании IntelФотокамеры SamsungФорум о магазине приложений RuStoreФорум по продукции компании Huawei
Справка и сервисы
Другие проекты iXBT.com
Petrovich: Насколько высока вероятность отказа целой СХД, нужен ли ZIP?
Petrovich
Member
Автор темы
16/27 ответов
12 лет на iXBT, с декабря 2012
Инфо Ответить
P
Petrovich MemberАвтор темы
11 лет назад / 31 октября 2013 23:24
Есть недорогой дисковый массив SAS с двумя контроллерами и двумя блоками питания, подключается через on-line ИБП. Слышал страшные истории про отказ целой СХД, например, отказ пассивного бэкплейна и прочее. Насколько в реальности подобные опасения обоснованы? Может ли возникнуть ситуация, когда СХД может стать неработоспособной, например, перестанет загружаться? С производителем заключен сервисный контракт, но в силу нашего географического положения доставка по словам техподдержки будет занимать не менее трёх дней. Т.е. в случае отказа СХД, имея на руках бэкапы их просто напросто будет некуда восстанавливать. Практикуется ли в подобной ситуации организация своего микросклада с закупкой необходимых запчастей? Собственно под Zip есь идея взять пустую полку без дисков и с одним контроллером.
Zlobniy Shurik
Member
35/146 ответов, #11 в рейтинге
16 лет на iXBT, с сентября 2008
Чаще пишет в "Администрирование" (33%)
Россия, Новосибирск
Инфо Ответить
Z
Zlobniy Shurik Member
11 лет назад / 01 ноября 2013 03:54
Не забывайте о возможности значительного физического повреждения/или полного уничтожения СХД. Самый ходовой сценарий - прорыв трубы в помещении серверной или этажом выше (либо просто текущая крыша и хороший ливень). Менее вероятный сценарий, но вполне возможный - визит правоохрЕнительных органов с выносом техники.

Так что, если есть возможность, то крайне рекомендуется делать территориально разнесенную СХД (ну или хотя бы бэкапы хранить в другом помещении).

P.S. Специально обученный админ с руками, растущими значительно ниже плеч, может вывести из строя даже территориально разнесенную СХД
mav753
Member
570/688 ответов
17 лет на iXBT, с декабря 2007
Чаще пишет в "Серверы" (75%)
Россия, Барнаул
Инфо Ответить
m
mav753 Member
11 лет назад / 01 ноября 2013 05:18
Petrovich
Более разумно вместо ЗИП на полку приобрести СХД в более слабой конфигурации, пусть даже с одним контроллером. В случае большого АХТУНГА, не важно по какой причине, можно сохранить работоспособность. Пусть даже с меньшей производительностью.
brutto
Member
275/427 ответов
13 лет на iXBT, с сентября 2011
Чаще пишет в "Серверы" (56%)
Инфо Ответить
b
brutto Member
11 лет назад / 01 ноября 2013 07:07
Как жоско у вас в Сибири-то, не просто так, а аж "более разумно" :)
mav753
Member
571/689 ответов
17 лет на iXBT, с декабря 2007
Чаще пишет в "Серверы" (75%)
Россия, Барнаул
Инфо Ответить
m
mav753 Member
11 лет назад / 01 ноября 2013 09:23
Считаете что, целесообразнее "заморозить" энное количество денег? А вдруг пригодиться?

P.S. Лежат у меня диски разных номиналов и интерфейсов, ни разу более чем за 5 лет не пришлось со склада брать - всегда получали от вендора на 3..4й день.
Petrovich
Member
Автор темы
17/28 ответов
12 лет на iXBT, с декабря 2012
Инфо Ответить
P
Petrovich MemberАвтор темы
11 лет назад / 01 ноября 2013 09:43
Создание второго ЦОД решение прекрасное, но в нашей ситуации не оправдано, слишком дорого, нужно найти более простое решение, пусть и не такое безопасное. Кроме физического уничтожения, изъятия и админа с кривыми руками какие ещё вероятные сценарии отказов? Если я правильно понимаю, отказ аппаратуры упирается в единичные недублированные элементы, навроде экспендеров, бэкплейна и т.п. Насколько вероятно возникновение проблем с этой стороны?
Поликарп
Member
83/141 ответов
14 лет на iXBT, с ноября 2010
Чаще пишет в "Серверы" (63%)
Беларусь, Брест
Инфо Ответить
П
Поликарп Member
11 лет назад / 01 ноября 2013 10:19
Petrovich
Создание второго ЦОД решение прекрасное, но в нашей ситуации не оправдано, слишком дорого
Так не надо второй цод создавать. определится лишь с местом установки второго нода СХД.
Предприятие не маленькое, раз стоит вопрос о отказа целой СХД.
Хотя не откажет нормальная СХД у вас, более вероятны ситуации описанные у Zlobniy Shurik, особенно, про админа.
Demolisher
Member
557/565 ответов
17 лет на iXBT, с марта 2007
Чаще пишет в "Серверы" (43%)
Инфо Ответить
Demolisher Member
11 лет назад / 01 ноября 2013 10:47
Petrovich
Насколько вероятно возникновение проблем с этой стороны?

Вероятность где-то 50 на 50.

Либо сломается, либо нет.
divig
Member
603/1212 ответов
17 лет на iXBT, с мая 2007
Чаще пишет в "Серверы" (67%)
Инфо Ответить
d
divig Member
11 лет назад / 01 ноября 2013 11:09
энтерпрайз можно делать по многим признакам, зип защишает от одних факторов, от других не защитит. После потопа в америке, стали популярны разнесенные территориально активные ноды. )
Если в одном здании сделать - пожар может уничтожить и т.д.
nda
Member
505/546 ответов
13 лет на iXBT, с марта 2011
Чаще пишет в "Серверы" (93%)
Россия, Москва
Web-страница
Инфо Ответить
n
nda Member
11 лет назад / 01 ноября 2013 11:13
Petrovich:
Слышал страшные истории про отказ целой СХД, например, отказ пассивного бэкплейна и прочее. Насколько в реальности подобные опасения обоснованы? Может ли возникнуть ситуация, когда СХД может стать неработоспособной, например, перестанет загружаться?
Запросто. Блоков питания два, но есть такая штука, как распределитель питания. На моей памяти две HP P2000 внезапно померли полностью у разных заказчиков через 2-3 месяца. Еще бывают всякие баги в fw, которые в редких ситуациях могут привести к потере данных, а самое главное - человеческий фактор. Не выспался - и снес том (или кто-нибудь еще потерял данные не на стороне СХД, а дальше), был невнимателен - убил СХД при прошивке (хотя с 2-контроллерной это почти нереально).
Можно тут начать жонглировать кучей умных расчетов с AFR и доступностью и получить, например, цифру в 99,99%. Вам нужно определиться с требованиями к RTO и RPO, т.е. отталкиваться от ситуации, когда СХД уже вышла из строя и нужно решать вопрос с возобновлением работы бизнеса (не будете же вы просто повторять мантру "я не верю, что это случилось, тут же 99,99%!"): как быстро вы сможете восстановиться (и каков будет ущерб от простоя) и какой кусок данных вы готовы потерять (за последний час/день/неделю) и, опять-таки ущерб от этой потери. После чего можно определять бюджет на улучшение ситуации с надежностью инфраструктуры (ничего не делать и рассчитывать на 3-дневный сервис, резервная СХД и бэкапы на нее, репликация, репликация в соседнее здание/район/город/континент и т.д.).
Petrovich:
имея на руках бэкапы их просто напросто будет некуда восстанавливать.
Складывать бэкапы на то же устройство - это моветон. Помните про человеческий фактор.
Petrovich:
Практикуется ли в подобной ситуации организация своего микросклада с закупкой необходимых запчастей? Собственно под Zip есь идея взять пустую полку без дисков и с одним контроллером.
Если рассматривать только диски, то в условиях, когда можно рассчитывать на 3-дневный сервис, достаточно иметь нужное кол-во hot-spare в самой СХД. "Полка с одним контроллером и без дисков" - тут опять забываете про человеческий фактор или вероятность сбоя в fw. Пришли утром - LUN'ы отвалились, томов на СХД нет, даже восстановиться нельзя - бэкапы там же лежали.
Поликарп
Member
84/142 ответов
14 лет на iXBT, с ноября 2010
Чаще пишет в "Серверы" (63%)
Беларусь, Брест
Инфо Ответить
П
Поликарп Member
11 лет назад / 01 ноября 2013 12:11
nda
На моей памяти две HP P2000 внезапно померли полностью у разных заказчиков через 2-3 месяца.
Страшные вещи рассказываете, так что там с ними случилось?
Petrovich
я думаю после постаnda вы поняли. что пора увеличивать бюджет в три раза и ставить вопрос о создании нового ЦОДа.
nda
Member
506/547 ответов
13 лет на iXBT, с марта 2011
Чаще пишет в "Серверы" (93%)
Россия, Москва
Web-страница
Инфо Ответить
n
nda Member
11 лет назад / 01 ноября 2013 12:20
Поликарп:
Страшные вещи рассказываете, так что там с ними случилось?
Просто перестали стартовать по питанию.
Поликарп:
я думаю после постаnda вы поняли. что пора увеличивать бюджет в три раза и ставить вопрос о создании нового ЦОДа.
Где Вы смогли это прочитать? Почему не в 100500 раз и созданием ЦОД'а на буровой платформе или на Луне? Бизнес у организации Petrovich'а вполне может быть устроен так, что переживет без всяких потерь недельный простой с потерей данных за полгода.
volkovvl
Member
6/17 ответов
14 лет на iXBT, с июля 2010
Россия, Петрозаводск
Инфо Ответить
v
volkovvl Member
11 лет назад / 01 ноября 2013 13:08
Про P2000 первой генерации подтвержу слова nda - у меня полка в максимальной конфигурации, через месяц после запуска, потеряла данные с дисков полностью, после не понятной перезагрузки, благо еще не в продакшине. HP покурив логи поменял enclosure + пару дисков. После этого все тип-топ более 5 лет.


Вам нужно определиться с требованиями к RTO и RPO, т.е. отталкиваться от ситуации, когда СХД уже вышла из строя и нужно решать вопрос с возобновлением работы бизнеса
- это самые правильные слова, план что делать и как работать когда все плохо с СХД первое что надо сделать. В моем случае было проще дисков в сервера докупить и с потерей производительности пожить до окончания ремонта.
divig
Member
604/1213 ответов
17 лет на iXBT, с мая 2007
Чаще пишет в "Серверы" (67%)
Инфо Ответить
d
divig Member
11 лет назад / 01 ноября 2013 13:40
volkovvl тут на форуме очень любят HCL )) ваш случай очень показателен в этом плане.
gss
Mylex Expert
11197/22466 ответов
21 год на iXBT, с августа 2003
Чаще пишет в "Накопители" (51%)
Web-страница
Инфо Ответить
gss Mylex Expert
11 лет назад / 01 ноября 2013 14:06
Petrovich
Если у Вас все так жестко, то спасение утопающих... вопрос только почем.
Либо вторая СХД, как сказал mav753, либо просто сервак с быстрыми винтами, на который лить реплики виртуалок - русский кластер, в случае чего со скрипом пару дней проживете.
ЗИП - это хорошо, но от логических сбоев и разного рода "непонятно почему не работает" не помогает.
ishtar
unregistered
Ответить
i
ishtar unregistered
11 лет назад / 01 ноября 2013 14:29
Zlobniy Shurik прав, в идеале разнести реплику хотя бы по разным стойкам. а так.. попросите директора ответить на вопрос - "сколько стоит день простоя нашей организации" ну или несколько часов - сколько вам надо времени чтобы восстановиться с бэкапа? и от этого плясать. банку простой грозит сильнее, чем магазину. если вам простой некритичен - так возьмите хоть нетгир на 4-6 дисков хоть ленточку и складывайте туда ночью бэкап критичных данных
Petrovich
Member
Автор темы
18/29 ответов
12 лет на iXBT, с декабря 2012
Инфо Ответить
P
Petrovich MemberАвтор темы
11 лет назад / 01 ноября 2013 17:30
Ребята, ну вы прямо обижаете. Бэкапы у нас льются на сторадж standalone-сервера + дублируются на ленточную библиотеку. Допустимое время простоя - сутки, потерянные данные - тоже сутки. Периодически выполняю учения, в указанного окно вполне укладываемся. Но это при условии наличия оборудования, куда мы выполняем восстановление данных. Соотвественно вопрос в том, что делать, если произошла не просто потеря данных на СХД, а если она не включается и не работает, ну произошёл отказ недублированного элемента какого-нибудь, например, пассивного бэкплейна, куда восстанавливать бэкап? У меня пока что рабочий вариант - в серверах ESXi установлены большие корзины, можно будет накупить SATA-дисков, пару недель в таком режиме вполне протянем. Но если СХД будет расти, естественно это решение на коленке уже не прокатит, поэтому и задумываюсь об организации ZIP. А чтобы для СХД ZIP организовать, нужно по сути покупать пустые полки, точно такие же, какие используются в продакшене, а это на 20%-30% удорожает решение.
Musik
Member
927/5946 ответов
17 лет на iXBT, с декабря 2007
Чаще пишет в "Администрирование" (58%)
Инфо Ответить
M
Musik Member
11 лет назад / 02 ноября 2013 04:58
Petrovich
Насколько высока вероятность отказа целой СХД, нужен ли ZIP?
К сожалению, однозначного ответа на Ваш вопрос нет, как на любой риторический вопрос. Несмотря на чудовищную надежность СХД, вероятность отказа всегда составляет 50:50, как уже сказано (только не примерно, а точно), а ZIP является гирей и мертвым грузом, который стареет гораздо быстрее, чем то устройство, для которого он вроде бы предназначен. Как говорится, кто будет охранять охраняющих? © Понятно, что СХД можно залить водой или дать ей на вход 380 V, но того, кто такое допустит, никакой ZIP не спасет, поэтому можно ограничиться дотошным мониторингом.

Допустимое время простоя - сутки, потерянные данные - тоже сутки
Это ведь не двое суток, а все те же одни? Те, кто эти требования утвердил, должен понимать, что в условиях, когда доставка, по словам техподдержки, будет занимать не менее трёх дней, он утвердил пустоту, сотрясение воздуха. Тут либо увеличивать время простоя, либо раскошеливаться, и очень серьезно, на DR сайт, либо делать и то, и другое. Вам особо болеть за СХД не нужно, но подать докладную с некоторыми соображениями не помешает, т.к. за все и всегда отвечают стрелочники.
Ваш ответ:

Нет значка Нет значка Вот тут! Лампочка Восклицание Вопрос Класс! Улыбка Злость Огорчение Поговорим? Краснею Подмигивание Ругаю ОдобряюBIUdelSxsupxsuboffsp spoilerqurlimgvideo• list1. list1 codeprecenter-hr-rusQWE→ЙЦУ
файлыочистить
Ваше имя: Авторизуйтесь Предпросмотр В полную форму
вставить выделенную цитату в окно ответа
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Последние обсуждения в Конференции
19:50Выбор бюджетного китайского DAC (ЦАП) Стерео
19:50Будет ли война России с Украиной? Политика
19:48Фан клуб Ольги, которая Olga Kinda High Флуд
19:48Архаичные выражения, подзабытые слова, названия, а также уходящие в прошлое культурные традиции XX века. Культура
19:48Нейронка для клонирования голоса ИИ
19:45Тема для всех: Вопрос - Ответ [по мелочам] MacLife
19:45Diablo IV (4). Релиз 06.06.2023! Игры
19:43Обсуждение SSD Samsung Накопители
19:42Модерация на ixbt.com (не конференция) iXBT.com
19:42Выкидывай среднеформатную технику, айда на мобильники снимать! Фото
19:41Электромобили - грядет революция? Авто
19:40Выбор BD-R/RE болванок Оптич. носители
19:37Дизайн этого сайта + игра THE SWiNE 2020 Общий
19:35NAS своими руками НАС
19:32Вклады с максимальными процентными ставками Банки
19:30Всё о кофе - выбор, тонкости кофеварения, покупка в интернет-магазинах и т.д. Кулинария
19:30ИБП Powerware ( Eaton ): опыт использования, достоинства, недостатки, вопросы. Корпуса, БП
19:26Я плакаль... (картинка прикол) Юмор
19:26Выбор фильтра для воды Бытовая техника
19:26Как и чем смазывать компьютерный вентилятор, проблемы смазки (Обязательно читать правила темы, прежде чем отвечать!) Разгон
19:31AMD сделала сильный ход, но что насчёт народных видеокарт? Компания рассказала, когда ждать карты Radeon RX 9060
18:47Это ультратонкий смартфон (5,75 мм), у которого аккумулятор больше, чем у Galaxy S25 Ultra. Tecno представила уникальный Spark Slim
18:40Тонкие, мощные и похожие на MacBook. Xiaomi представила ноутбуки Redmi Book Pro
18:26Никто из гигантов пока не создал такой смартфон, а вот Infinix уже показала. Концепт Mini Tri-Fold ZERO — это складывающаяся втрое раскладушка
18:14Это первый в мире подобный ноутбук. Razer Blade 18 получил не только RTX 5090 Laptop, но и двухрежимный дисплей с частотой до 440 Гц
18:09Россияне активно пересаживаются на «Танки». За счет Tank 300 и Tank 500 бренд Tank впервые вышел в лидеры премиум-сегмента
16:53Самый доступный представитель культовой линейки Land Cruiser: в Россию привезли Toyota Land Cruiser 79 LX — 10 млн рублей
16:40Представлены Radeon RX 9070 и RX 9070 XT за 550 и 600 долларов. RX 9070 XT на 23% превосходит RTX 5070 Ti по соотношению цены и производительности
16:29В России стартовали продажи Geely Okavango 2025 — большой кроссовер подешевел
16:18Масштабное исследование «Хаббла» выявило различия между спутниками Андромеды и Млечного Пути