tw_cli и подключение spare диска для AMCC/3ware RAID на рабочем сервере без остановки.

Так вот, господа, есть у меня debian и на нём крутится хостинг (СЮРПРИЗЗЗ!!!!!). Когда эта система устанавливалась, а устанавливалась она на самосборной тачке, поэтому на горячую диски устанавливать и извлекать никак нельзя. Все четыре диска прикручены винтами и подключены sata шлейфами. Дисков было четыре. Рейд ставился пятый. И вот в момент установки (а я по первости раз несколько систему ставил-переставлял. Смотрел что получится). Так вот, в момент установки не сконфигурировался у меня raid-5. То есть из bios собрался raid, а сделать четвёртый диск под spare не получилось. Ну я тогда этот момент просмотрел, а тут очередная попытка установить увенчалась таким ошеломительным успехом, что стала боевой, а потом залился сайт, а сейчас вообще перегрузить систему никакой возможности нет. И вот стоит этот одинокий четвёртый диск и плачет, что нет никому до него дела. И никому он помогать не собирается, если вдруг чего приключиться. Это была преамбула, а сам рассказ будет про галимый интерфейс, эксцентричную систему команд и счастливую установку четвёртого диска в spare.
Ой, как лень писать о контроллере в 18 часов в пятницу. Но я напишу, потому что тема важная и документация по ней очень вялая. Даже man tw_cli не рассказывает о тех командах, которые реально были использованы. Или я man набирать не умею.
То, что мне не надо разобраться с диском, мне напомнила статья. К сожалению в ней не было правильно ответа на вопрос о том как добавить к тому диск spare, но я вспомнил и начал искать. Причём, я не могу не только войти в красивую виндовую программку, которой умеет управляться мой коллега, но и даже войти в bios, потому что всё делается на лету. Экспорт MySQL баз и домашних каталогов сайтов у меня есть, но я не уверен, что смогу быстро всё восстановить. Как бы не хотелось бы. Внятной документации на русском на эту тему нет. Была даже мысль man перевести и выложить тут, но потом оказалось, что его там слишком много.
Я остановился на том, что вот в этом месте описывается как правильно менять один диск со spare на другой. Выглядит команда так:

# tw_cli maint createunit c2 p7 rspare
Creating new unit on controller /c2 … Done. The new unit is /c2/u1.

# tw_cli /c2 show

Unit UnitType Status %Cmpl Stripe Size(GB) Cache AVerify IgnECC
——————————————————————————
u0 RAID-5 OK — 64K 1117.52 ON OFF OFF
u1 SPARE OK — — 189.914 — OFF —

Port Status Unit Size Blocks Serial
—————————————————————

p7 OK u1 189.92 GB 398297088 B4066CYH

Собственно, со второй попытки как-то так оно и получилось. Правда, сначала я долго пытался разбираться и понимать. Оказалось, что spare он не в том же юните, что и raid, а в другом, отдельном. И может быть использован разными raid, если будет подходить по параметрам. У меня сначала после первого включения этого диска в SPARE у него статус был какой-то сломаный, но после второго включения он установился в нормальный ок. Кстати, когда я начал разбираться, то диск был включен во второй юнит из одного диска (не spare), поэтому я ещё обливаясь потом выполнил команду tw_cli maint remove c0 p0, почёрпнутую из другого источника.

Надо бы ещё выяснить какой командой можно доподлинно определять что с raid всё в порядке, что бы сервер начал писать мне письма, если будет из-за этого самого raid переживать.
Немного грустно, что у меня диски не для hot swap, поэтому тупо выдернуть диск и посмотреть что происходит я не могу.

Добавить комментарий

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.