Нотатки сісадміна Linux Centos и аппаратный рейд HP

Centos и аппаратный рейд HP

hpacucli

Часто натыкаюсь в своей практике на аппаратные рейды HP и постоянно потом сижу и втыкаю в документацию какпроверить винты, как првоерить рейд…

Сначала качаем и устанавливаем hpacucli – утилиту для управления аппаратным рейдом на серверах HP:

Для Centos 64 bit выложил у себя что бы качать сразу со своего сервера, а то странная политика у HP не дают качать по прямым ссылкам со своих серверов, приходится извращаться.

Сквчать можно отсюда – hpacucli

или вот так:

Далее устранавливаем:

После установки можно начинать проверять и химичить:

Проверить статус контроллера:

 

Увидев что с контроллером все ОК и что он находится в Slot 1 можно проверить статус логических дисков:

 

Видим что с логическими исками все в норем, можно проверить и статус физичемких дисков:

 

С ними то же все в норме, по хорошему я сразу пускаю проверку дисков через Smart:

for i in $(seq 0 7); do smartctl -a /dev/sg0 -d cciss,$i -t long; done

и иду гулять на несколько часов пока идет проверка дисков, после проверки проверяю все ли в норме с исками, в зависимости от производителя дисков, версии smart проверяю или параметры 5 и 196 что бы были по нулям, или просто статус проверки, пример нормальной проверки на картинке ниже:

smartctl

 

Если датацентр или хостеркак всегда накосячили с настройками рейда, создаю и запускаю в работу сам:

Переподключеие диска который в статусе с ошибкой, иногда помогает если какие то глюки в системе:

Ну и так по мелочи химичим:

Мониторить статус рейда можно самым простым способом, пускать через cron простой скриптик проверки статуса контроллера, логических дисков и физических дисков через hpacucli и слать вывод себе на почту.

 

Click to rate this post!
[Total: 0 Average: 0]

2 коментарі до “Centos и аппаратный рейд HP”

  1. Во всех доступных доках по hpacucli говорится, что команда reenable деструктивна для данных и сама команда выдает предупреждение. Но если она действительно удаляет данные, зачем она тогда нужна? Если уж данные не важны, развалившийся (выпавший в FAILED) логический диск можно просто уничтожить и создать заново. Столкнулся со случаем падения RAID-5 из-за плохих контактов в разъемах дисков. Контакты почистили, диски надежно вставили, но контроллер упорно блокирует доступ — FAILED, а бекап староват.

    1. У меня на практике reenable не уничтожала данные. Но практики с HW рейдами у меня не много, в тех нескольких разах что делал все было в норме.

Залиште відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Related Post