admin@demi4.com

Centos и аппаратный рейд HP

hpacucli

Часто натыкаюсь в своей практике на аппаратные рейды HP и постоянно потом сижу и втыкаю в документацию какпроверить винты, как првоерить рейд…

Сначала качаем и устанавливаем hpacucli – утилиту для управления аппаратным рейдом на серверах HP:

Для Centos 64 bit выложил у себя что бы качать сразу со своего сервера, а то странная политика у HP не дают качать по прямым ссылкам со своих серверов, приходится извращаться.

Сквчать можно отсюда – hpacucli

или вот так:

Далее устранавливаем:

После установки можно начинать проверять и химичить:

Проверить статус контроллера:

 

Увидев что с контроллером все ОК и что он находится в Slot 1 можно проверить статус логических дисков:

 

Видим что с логическими исками все в норем, можно проверить и статус физичемких дисков:

 

С ними то же все в норме, по хорошему я сразу пускаю проверку дисков через Smart:

for i in $(seq 0 7); do smartctl -a /dev/sg0 -d cciss,$i -t long; done

и иду гулять на несколько часов пока идет проверка дисков, после проверки проверяю все ли в норме с исками, в зависимости от производителя дисков, версии smart проверяю или параметры 5 и 196 что бы были по нулям, или просто статус проверки, пример нормальной проверки на картинке ниже:

smartctl

 

Если датацентр или хостеркак всегда накосячили с настройками рейда, создаю и запускаю в работу сам:

Переподключеие диска который в статусе с ошибкой, иногда помогает если какие то глюки в системе:

Ну и так по мелочи химичим:

Мониторить статус рейда можно самым простым способом, пускать через cron простой скриптик проверки статуса контроллера, логических дисков и физических дисков через hpacucli и слать вывод себе на почту.

 

0 голосов
Позначки:, , ,

2 коментарі до “Centos и аппаратный рейд HP”

  1. Alex сказав:

    Во всех доступных доках по hpacucli говорится, что команда reenable деструктивна для данных и сама команда выдает предупреждение. Но если она действительно удаляет данные, зачем она тогда нужна? Если уж данные не важны, развалившийся (выпавший в FAILED) логический диск можно просто уничтожить и создать заново. Столкнулся со случаем падения RAID-5 из-за плохих контактов в разъемах дисков. Контакты почистили, диски надежно вставили, но контроллер упорно блокирует доступ — FAILED, а бекап староват.

    1. graff сказав:

      У меня на практике reenable не уничтожала данные. Но практики с HW рейдами у меня не много, в тех нескольких разах что делал все было в норме.

Leave a Reply

Увійти через: 

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Related Post

How to check the ssl expiration date for the domain list

How to check the ssl expiration date for the domain listHow to check the ssl expiration date for the domain list

Дуже проста таска – перевіряти термін дії ssl сертифікату, для списку доменів. 1 голос Схожі записи: configure: error: Cannot find OpenSSL’s libraries postfix + smtps (ssl) PHP configure: error: xml2-config

apache

Bad file descriptor: apr_socket_accept: (client socket)Bad file descriptor: apr_socket_accept: (client socket)

Вот такую ошибку словил на одном ВПС 0 голосов Схожі записи: MULTI: bad source address from client, packet dropped client intended to send too large body Query (7f0ae0004ba0): is an

key for razorsql

Razorsql 7.2.2 serial keyRazorsql 7.2.2 serial key

Отдельное спасибо хорошему человеку, который поделился этими ключиками.  Serial for Razorsql 7 7 голосов Схожі записи: Razorsql 6.3 serial key Установка Redis на Debian 8 zabbix+мониторинг нагрузки на диски sutra