Последние обсуждения Поиск
Новые форумы
Общие форумы
Форумы поддержки портала iXBT.com
Специализированные форумы
ПроцессорыРазгон и охлаждениеСистемные платыМодули памятиВидеосистемаКриптовалюты, майнинг, blockchain-технологии, NFTИскусственный интеллект: технологии, практика, развитиеTV- и FM-тюнеры, видеовход, видеовыходЦифровое видео: захват, монтаж, обработкаМониторы и другие устройства отображенияЦифровое фотоБеспилотные летательные аппаратыЦифровой звукProAudio: Профессиональное звуковое оборудованиеСтереосистемыДомашний кинотеатр: проигрыватели и источники сигналаДомашний кинотеатр: аудиосистемаДомашний кинотеатр: ТV и проекторыМагнитные и SSD накопителиОптические носители информацииСетевые носители информацииПериферияКорпуса, блоки питания, UPSСети, сетевые технологии, подключение к интернетуСистемное администрирование, безопасностьСерверыНоутбуки, нетбуки и ультрабукиПланшеты и электронные книгиМобильные телефоны, смартфоны, кпк, коммуникаторыМобильные гаджетыОператоры и технологии мобильной связиТелефония, телекоммуникации, офисные АТСБытовая техника
Программы
Игры
Авторские форумы
Прочие форумы
Архивы конференции
Архив "О Конференции"Архив "Процессоры"Архив "Разгон и охлаждение"Архив "Системные платы"Архив "Модули памяти"Архив "Видеосистема"Архив "Видеозахват"Архив "Мониторы и другие устройства отображения"Архив "Цифровое изображение"Архив "Цифровой звук"Архив "Периферия"Архив "Корпуса, блоки питания, UPS"Архив "Коммуникации: сети и сетевые технологии"Домашний интернет, модемы (архив)Архив "Системное администрирование, безопасность"Архив "Мобильная связь"Программы Microsoft: Windows, Office, Server, Windows LiveАрхив "OС и системное ПО"Архив "Программы: Интернет"Архив "Программирование"Форум прикладных программистовАрхив "Электронные устройства и компоненты"Архив "Околокомпьютерный Флейм & Общий"Архив "Полемика (Злобный Флейм)"Околоавтомобильный ФлеймФорум ремонтниковВопросы компании IntelФотокамеры SamsungФорум о магазине приложений RuStoreФорум по продукции компании Huawei
Справка и сервисы
Другие проекты iXBT.com
Petrovich: Насколько высока вероятность отказа целой СХД, нужен ли ZIP?
Petrovich
Member
Автор темы
16/27 ответов
12 лет на iXBT, с декабря 2012
Инфо Ответить
P
Petrovich MemberАвтор темы
11 лет назад / 31 октября 2013 23:24
Есть недорогой дисковый массив SAS с двумя контроллерами и двумя блоками питания, подключается через on-line ИБП. Слышал страшные истории про отказ целой СХД, например, отказ пассивного бэкплейна и прочее. Насколько в реальности подобные опасения обоснованы? Может ли возникнуть ситуация, когда СХД может стать неработоспособной, например, перестанет загружаться? С производителем заключен сервисный контракт, но в силу нашего географического положения доставка по словам техподдержки будет занимать не менее трёх дней. Т.е. в случае отказа СХД, имея на руках бэкапы их просто напросто будет некуда восстанавливать. Практикуется ли в подобной ситуации организация своего микросклада с закупкой необходимых запчастей? Собственно под Zip есь идея взять пустую полку без дисков и с одним контроллером.
Zlobniy Shurik
Member
35/146 ответов, #11 в рейтинге
16 лет на iXBT, с сентября 2008
Чаще пишет Р Р† "Администрирование" (33%)
Россия, Новосибирск
Инфо Ответить
Z
Zlobniy Shurik Member
11 лет назад / 01 ноября 2013 03:54
Не забывайте о возможности значительного физического повреждения/или полного уничтожения СХД. Самый ходовой сценарий - прорыв трубы в помещении серверной или этажом выше (либо просто текущая крыша и хороший ливень). Менее вероятный сценарий, но вполне возможный - визит правоохрЕнительных органов с выносом техники.

Так что, если есть возможность, то крайне рекомендуется делать территориально разнесенную СХД (ну или хотя бы бэкапы хранить в другом помещении).

P.S. Специально обученный админ с руками, растущими значительно ниже плеч, может вывести из строя даже территориально разнесенную СХД
mav753
Member
570/688 ответов
17 лет на iXBT, с декабря 2007
Чаще пишет Р Р† "Серверы" (75%)
Россия, Барнаул
Инфо Ответить
m
mav753 Member
11 лет назад / 01 ноября 2013 05:18
Petrovich
Более разумно вместо ЗИП на полку приобрести СХД в более слабой конфигурации, пусть даже с одним контроллером. В случае большого АХТУНГА, не важно по какой причине, можно сохранить работоспособность. Пусть даже с меньшей производительностью.
brutto
Member
275/427 ответов
13 лет на iXBT, с сентября 2011
Чаще пишет Р Р† "Серверы" (56%)
Инфо Ответить
b
brutto Member
11 лет назад / 01 ноября 2013 07:07
Как жоско у вас в Сибири-то, не просто так, а аж "более разумно" :)
mav753
Member
571/689 ответов
17 лет на iXBT, с декабря 2007
Чаще пишет Р Р† "Серверы" (75%)
Россия, Барнаул
Инфо Ответить
m
mav753 Member
11 лет назад / 01 ноября 2013 09:23
Считаете что, целесообразнее "заморозить" энное количество денег? А вдруг пригодиться?

P.S. Лежат у меня диски разных номиналов и интерфейсов, ни разу более чем за 5 лет не пришлось со склада брать - всегда получали от вендора на 3..4й день.
Petrovich
Member
Автор темы
17/28 ответов
12 лет на iXBT, с декабря 2012
Инфо Ответить
P
Petrovich MemberАвтор темы
11 лет назад / 01 ноября 2013 09:43
Создание второго ЦОД решение прекрасное, но в нашей ситуации не оправдано, слишком дорого, нужно найти более простое решение, пусть и не такое безопасное. Кроме физического уничтожения, изъятия и админа с кривыми руками какие ещё вероятные сценарии отказов? Если я правильно понимаю, отказ аппаратуры упирается в единичные недублированные элементы, навроде экспендеров, бэкплейна и т.п. Насколько вероятно возникновение проблем с этой стороны?
Поликарп
Member
83/141 ответов
14 лет на iXBT, с ноября 2010
Чаще пишет Р Р† "Серверы" (63%)
Беларусь, Брест
Инфо Ответить
П
Поликарп Member
11 лет назад / 01 ноября 2013 10:19
Petrovich
Создание второго ЦОД решение прекрасное, но в нашей ситуации не оправдано, слишком дорого
Так не надо второй цод создавать. определится лишь с местом установки второго нода СХД.
Предприятие не маленькое, раз стоит вопрос о отказа целой СХД.
Хотя не откажет нормальная СХД у вас, более вероятны ситуации описанные у Zlobniy Shurik, особенно, про админа.
Demolisher
Member
557/565 ответов
17 лет на iXBT, с марта 2007
Чаще пишет Р Р† "Серверы" (43%)
Инфо Ответить
Demolisher Member
11 лет назад / 01 ноября 2013 10:47
Petrovich
Насколько вероятно возникновение проблем с этой стороны?

Вероятность где-то 50 на 50.

Либо сломается, либо нет.
divig
Member
603/1212 ответов
17 лет на iXBT, с мая 2007
Чаще пишет Р Р† "Серверы" (67%)
Инфо Ответить
d
divig Member
11 лет назад / 01 ноября 2013 11:09
энтерпрайз можно делать по многим признакам, зип защишает от одних факторов, от других не защитит. После потопа в америке, стали популярны разнесенные территориально активные ноды. )
Если в одном здании сделать - пожар может уничтожить и т.д.
nda
Member
505/546 ответов
13 лет на iXBT, с марта 2011
Чаще пишет Р Р† "Серверы" (93%)
Россия, Москва
Web-страница
Инфо Ответить
n
nda Member
11 лет назад / 01 ноября 2013 11:13
Petrovich:
Слышал страшные истории про отказ целой СХД, например, отказ пассивного бэкплейна и прочее. Насколько в реальности подобные опасения обоснованы? Может ли возникнуть ситуация, когда СХД может стать неработоспособной, например, перестанет загружаться?
Запросто. Блоков питания два, но есть такая штука, как распределитель питания. На моей памяти две HP P2000 внезапно померли полностью у разных заказчиков через 2-3 месяца. Еще бывают всякие баги в fw, которые в редких ситуациях могут привести к потере данных, а самое главное - человеческий фактор. Не выспался - и снес том (или кто-нибудь еще потерял данные не на стороне СХД, а дальше), был невнимателен - убил СХД при прошивке (хотя с 2-контроллерной это почти нереально).
Можно тут начать жонглировать кучей умных расчетов с AFR и доступностью и получить, например, цифру в 99,99%. Вам нужно определиться с требованиями к RTO и RPO, т.е. отталкиваться от ситуации, когда СХД уже вышла из строя и нужно решать вопрос с возобновлением работы бизнеса (не будете же вы просто повторять мантру "я не верю, что это случилось, тут же 99,99%!"): как быстро вы сможете восстановиться (и каков будет ущерб от простоя) и какой кусок данных вы готовы потерять (за последний час/день/неделю) и, опять-таки ущерб от этой потери. После чего можно определять бюджет на улучшение ситуации с надежностью инфраструктуры (ничего не делать и рассчитывать на 3-дневный сервис, резервная СХД и бэкапы на нее, репликация, репликация в соседнее здание/район/город/континент и т.д.).
Petrovich:
имея на руках бэкапы их просто напросто будет некуда восстанавливать.
Складывать бэкапы на то же устройство - это моветон. Помните про человеческий фактор.
Petrovich:
Практикуется ли в подобной ситуации организация своего микросклада с закупкой необходимых запчастей? Собственно под Zip есь идея взять пустую полку без дисков и с одним контроллером.
Если рассматривать только диски, то в условиях, когда можно рассчитывать на 3-дневный сервис, достаточно иметь нужное кол-во hot-spare в самой СХД. "Полка с одним контроллером и без дисков" - тут опять забываете про человеческий фактор или вероятность сбоя в fw. Пришли утром - LUN'ы отвалились, томов на СХД нет, даже восстановиться нельзя - бэкапы там же лежали.
Поликарп
Member
84/142 ответов
14 лет на iXBT, с ноября 2010
Чаще пишет Р Р† "Серверы" (63%)
Беларусь, Брест
Инфо Ответить
П
Поликарп Member
11 лет назад / 01 ноября 2013 12:11
nda
На моей памяти две HP P2000 внезапно померли полностью у разных заказчиков через 2-3 месяца.
Страшные вещи рассказываете, так что там с ними случилось?
Petrovich
я думаю после постаnda вы поняли. что пора увеличивать бюджет в три раза и ставить вопрос о создании нового ЦОДа.
nda
Member
506/547 ответов
13 лет на iXBT, с марта 2011
Чаще пишет Р Р† "Серверы" (93%)
Россия, Москва
Web-страница
Инфо Ответить
n
nda Member
11 лет назад / 01 ноября 2013 12:20
Поликарп:
Страшные вещи рассказываете, так что там с ними случилось?
Просто перестали стартовать по питанию.
Поликарп:
я думаю после постаnda вы поняли. что пора увеличивать бюджет в три раза и ставить вопрос о создании нового ЦОДа.
Где Вы смогли это прочитать? Почему не в 100500 раз и созданием ЦОД'а на буровой платформе или на Луне? Бизнес у организации Petrovich'а вполне может быть устроен так, что переживет без всяких потерь недельный простой с потерей данных за полгода.
volkovvl
Member
6/17 ответов
14 лет на iXBT, с июля 2010
Россия, Петрозаводск
Инфо Ответить
v
volkovvl Member
11 лет назад / 01 ноября 2013 13:08
Про P2000 первой генерации подтвержу слова nda - у меня полка в максимальной конфигурации, через месяц после запуска, потеряла данные с дисков полностью, после не понятной перезагрузки, благо еще не в продакшине. HP покурив логи поменял enclosure + пару дисков. После этого все тип-топ более 5 лет.


Вам нужно определиться с требованиями к RTO и RPO, т.е. отталкиваться от ситуации, когда СХД уже вышла из строя и нужно решать вопрос с возобновлением работы бизнеса
- это самые правильные слова, план что делать и как работать когда все плохо с СХД первое что надо сделать. В моем случае было проще дисков в сервера докупить и с потерей производительности пожить до окончания ремонта.
divig
Member
604/1213 ответов
17 лет на iXBT, с мая 2007
Чаще пишет Р Р† "Серверы" (67%)
Инфо Ответить
d
divig Member
11 лет назад / 01 ноября 2013 13:40
volkovvl тут на форуме очень любят HCL )) ваш случай очень показателен в этом плане.
gss
Mylex Expert
11197/22466 ответов
21 год на iXBT, с августа 2003
Чаще пишет Р Р† "Накопители" (51%)
Web-страница
Инфо Ответить
gss Mylex Expert
11 лет назад / 01 ноября 2013 14:06
Petrovich
Если у Вас все так жестко, то спасение утопающих... вопрос только почем.
Либо вторая СХД, как сказал mav753, либо просто сервак с быстрыми винтами, на который лить реплики виртуалок - русский кластер, в случае чего со скрипом пару дней проживете.
ЗИП - это хорошо, но от логических сбоев и разного рода "непонятно почему не работает" не помогает.
ishtar
unregistered
Ответить
i
ishtar unregistered
11 лет назад / 01 ноября 2013 14:29
Zlobniy Shurik прав, в идеале разнести реплику хотя бы по разным стойкам. а так.. попросите директора ответить на вопрос - "сколько стоит день простоя нашей организации" ну или несколько часов - сколько вам надо времени чтобы восстановиться с бэкапа? и от этого плясать. банку простой грозит сильнее, чем магазину. если вам простой некритичен - так возьмите хоть нетгир на 4-6 дисков хоть ленточку и складывайте туда ночью бэкап критичных данных
Petrovich
Member
Автор темы
18/29 ответов
12 лет на iXBT, с декабря 2012
Инфо Ответить
P
Petrovich MemberАвтор темы
11 лет назад / 01 ноября 2013 17:30
Ребята, ну вы прямо обижаете. Бэкапы у нас льются на сторадж standalone-сервера + дублируются на ленточную библиотеку. Допустимое время простоя - сутки, потерянные данные - тоже сутки. Периодически выполняю учения, в указанного окно вполне укладываемся. Но это при условии наличия оборудования, куда мы выполняем восстановление данных. Соотвественно вопрос в том, что делать, если произошла не просто потеря данных на СХД, а если она не включается и не работает, ну произошёл отказ недублированного элемента какого-нибудь, например, пассивного бэкплейна, куда восстанавливать бэкап? У меня пока что рабочий вариант - в серверах ESXi установлены большие корзины, можно будет накупить SATA-дисков, пару недель в таком режиме вполне протянем. Но если СХД будет расти, естественно это решение на коленке уже не прокатит, поэтому и задумываюсь об организации ZIP. А чтобы для СХД ZIP организовать, нужно по сути покупать пустые полки, точно такие же, какие используются в продакшене, а это на 20%-30% удорожает решение.
Musik
Member
927/5946 ответов
17 лет на iXBT, с декабря 2007
Чаще пишет Р Р† "Администрирование" (58%)
Инфо Ответить
M
Musik Member
11 лет назад / 02 ноября 2013 04:58
Petrovich
Насколько высока вероятность отказа целой СХД, нужен ли ZIP?
К сожалению, однозначного ответа на Ваш вопрос нет, как на любой риторический вопрос. Несмотря на чудовищную надежность СХД, вероятность отказа всегда составляет 50:50, как уже сказано (только не примерно, а точно), а ZIP является гирей и мертвым грузом, который стареет гораздо быстрее, чем то устройство, для которого он вроде бы предназначен. Как говорится, кто будет охранять охраняющих? © Понятно, что СХД можно залить водой или дать ей на вход 380 V, но того, кто такое допустит, никакой ZIP не спасет, поэтому можно ограничиться дотошным мониторингом.

Допустимое время простоя - сутки, потерянные данные - тоже сутки
Это ведь не двое суток, а все те же одни? Те, кто эти требования утвердил, должен понимать, что в условиях, когда доставка, по словам техподдержки, будет занимать не менее трёх дней, он утвердил пустоту, сотрясение воздуха. Тут либо увеличивать время простоя, либо раскошеливаться, и очень серьезно, на DR сайт, либо делать и то, и другое. Вам особо болеть за СХД не нужно, но подать докладную с некоторыми соображениями не помешает, т.к. за все и всегда отвечают стрелочники.
Ваш ответ:

Список кодов форума
Список всех смайликов закрепить окно ответа
Нет значка Нет значка Р’РѕС‚ тут! Лампочка Восклицание Р’РѕРїСЂРѕСЃ Класс! Улыбка Злость Огорчение РџРѕРіРѕРІРѕСЂРёРј? Краснею Подмигивание Ругаю РћРґРѕР±СЂСЏСЋBIUdelSxsupxsuboffsp spoilerqurlimgvideo• list1. list1 codeprecenter-hr-rusQWE→ЙЦУ
файлыочистить
Ваше имя: Авторизуйтесь Предпросмотр В полную форму
вставить выделенную цитату в окно ответа
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Последние обсуждения в Конференции
01:00Микроархитектура Lion Cove. Мобильные процессоры Intel Lunar Lake / десктопные LGA 1851 Arrow Lake Процессоры
01:00Ресиверы и усилители Denon ДК аудио
01:00Выбор SSD Накопители
00:58Украина после Евромайдана. Взгляд из России. Вход для лиц с русофобскими взглядами закрыт Политика
00:58Черный экран по 1-2 сек. без четкой зависимости от чего бы то ни было. Видеосистема
00:57 Ведьмак 3 - The Witcher 3: Wild Hunt (PS4,XONE) Консоли
00:56Зачем вам доллары $? Флуд
00:56Иммиграция. Как выжить за рубежом? Общий
00:46Женщины не способны любить? Семья
00:43На микроволновке отстают часы - возможно исправить? Р В­Р В». устройства
00:40S.T.A.L.K.E.R. 2 - теперь официально Игры
00:30Выбор BD-R/RE болванок Оптич. носители
00:28Электромобили - грядет революция? Авто
00:25Всё о кофе - выбор, тонкости кофеварения, покупка в интернет-магазинах и т.д. Кулинария
00:21Выбор матраса Ремонт
00:21Intel Atom и "все все все" Тех. поддержка
00:18О степени вреда сотовой связи. Влияние сотовых телефонов на здоровье. Излучение. SAR. РњРѕР±. операторы
00:18Футбол РЎРїРѕСЂС‚
00:18Выбор смартфона РњРѕР±. телефоны
00:13Выбор камеры, снимающей видео 2016 - 2024 Видеозахват
Последние темы без ответов
вчераМемориз. Лучшее из опубликованного на конференции IXBT. Юмор
вчераМутный и разноцветный шрифт на иконках и в меню. Видеосистема
вчераРазная плавность при одинаковом FPS в сюжетках Тех. поддержка
2 дняPhotoshop 2025 Фото
2 дняЗадачи с параметрами. Порекомендуйте книги Наука
3 дняКак 5G справляется с помехами? Цифр. Дом
00:55Замена Volkswagen Passat и Toyota Camry по цене Lada Aura. В продаже появились большие седаны Peugeot 508L
00:54«Легендарная» Lada Niva впервые получит фронтальную подушку безопасности: глава АвтоВАЗа рассказал, когда это случится
00:24В России начнут выпускать аналог Toyota Alphard с 8-ступенчатым «автоматом» и всего за 5,5 млн рублей. Минивэн Sollers SP7 показали на живых фото
00:08Galaxy S25, Galaxy S25 и Galaxy S25 Ultra стали суперхитом в Южной Корее — они побили рекорд продаж, установленный Galaxy Note 10
23:53вчераЗамена легендарному ГАЗ-66: стартовало производство обновленного «Урала-80», он получил 238-сильный мотор и полный привод
23:03вчераRocket Lab подтверждает запуск ракеты Neutron в 2025 году вопреки прогнозам аналитиков
21:51вчераЯпонская компания Astroscale успешно провела первое в мире сближение с неконтролируемым объектом на орбите
21:12вчераАвтоВАЗ готовит совершенно новую версию Lada Granta с топовым оснащением. Машину сняли на фото
20:41вчераКосмические аппараты Lunar Trailblazer и Odin столкнулись с техническими проблемами после запуска миссии IM-2
20:40вчераПродажи пикапов в России побили рекорд. Самая массовая модель — Toyota Hilux, а самая популярная — Great Wall Poer
20+ лет назад в этот день обсуждали
2000Как можно заработать в инете? Общий (архив)
2001Карту коллектора у кого взять можно? Сети
2002Пара вопросов по делфям Программирование
2002Какой CD-RW взять?(ваши предложения приветствуются) Оптич. носители
2002Модернизированный nForce!!!!! РЎРёСЃС‚. платы
2003HITACHI CML 174... где же? Рынок
2004Nikon Coolpix 4300 made in Japan vs made in Korea Фото
2004чтение данных из реестра, не заносится второе чтение в переменную Программирование (архив)
2005microsoft 1394 PC, где достать драйвер для этого устройства под 2К Р СћР ВµРЎвЂ¦. поддержка
2005Как прибить старый корень DFS Администрирование
Отключите эту колонку в личном кабинете.