Архив рубрики: Администрирование

Восстановление работоспособности logical drive Raid5 после замены дисков.

На одном сервере был собран рейд из 16 дисков (один из них Spare)
Было создано 3 логических диска — два уровня 50 под данные и один уровня 5 для бэкапов.

Случилось так, что получается что одновременно вылетело 2 диска, в результате чего ld 3 (бэкап) естественно перешел в Fail. 
После того как два вылетевших диска заменили, естественно, ld3 был потерян,но он нужен нам, для того чтобы размещать на нем файлы. Как вернуть его к жизни?

Читать далее

Ошибка Cannot open exchanger control device

По работе имею дело с следующей связкой HP DL сервера в кластере + ленточка подклченная по SAS к однмоу из серверов. На сервере с подключенной библиотекой стоит HP Data Protector, на котором настроены политики бэкапа файловых систем и СУБД Oracle. В один прекрасный момент бэкапы перестали работать.

По работе встретил такую ошибку при бэкапе:

 bash |  copy code |? 
01
Normal] From: BSM@khbr.ctn "oracle_archivelog"  Time: 23.09.15 16:39:24
02
      Backup session 2015/09/23-16 started.
03
 
04
[Normal] From: BMA@khbr.ctn "HP:Ultrium 5-SCSI_1_khbr"  Time: 23.09.15 16:39:25
05
      STARTING Media Agent "HP:Ultrium 5-SCSI_1_khbr" 
06
 
07
[Critical] From: UMA@khbr.ctn "HP:MSL G3 Series_khbr"  Time: 23.09.15 16:49:15
08
[90:59]     khbr.ctn : /dev/sg9
09
      Cannot open exchanger control device ([2] No such file or directory)
10
 
11
[Normal] From: BMA@khbr.ctn "HP:Ultrium 5-SCSI_1_khbr"  Time: 23.09.15 16:49:15
12
      ABORTED Media Agent "HP:Ultrium 5-SCSI_1_khbr" 
13
 
14
[Critical] From: BSM@khbr.ctn "oracle_archivelog"  Time: 23.09.15 16:49:15
15
      None of the Disk Agents completed successfully.
16
      Session has failed.
17
 
18
[Normal] From: BSM@khbr.ctn ""  Time: 23.09.15 16:49:15

Все бэкапы на ленточку перестали отрабатывать!!! Ахтунг.

Читать далее

Умер системный диск в одном из серверов PROXMOX-кластера.

Умер системный диск в одном из серверов PROXMOX-кластера.

Беда… потому что на этом узле у меня был MFSMASTER и MFSCHUNK и куча виртуальных машин. Да здравствует БЭКАП. Слава Богу, что у меня были бэкапы всех важных машин (одну машину я все же потерял, т.к. она была большая и у меня небыло места для ее бэкапа. Читать далее

DBMS_REDEFINISHEN

Доброе оракловоды.

По службе мне нужно было переопределить вживую несколько столбцов таблицы и, конечно же, для этого я воспользовался фичей оралка dbms_redifinition, но случилось то, что начало редифинишена после недолгого задумывания вываливалось с ошибокй ORA-600 с оргументами 17182  и 17183.

Как удалось это победить обходным путем — далее под катом.

Читать далее

Использование moosefs. обновление 1

Доброе.

За время использования вот еще что «нарисовалось».

С большой долей вероятности при подходу заполннености кластера к 100% — возможно падение демонов moosefs. У меня было так несколько раз, пока не добавил еще дисковых ресурсов в кластер.

Однако это надо еще проверять, но нет желания.

Кстати, чанксервера разных версий вродедаже не плоху живут вместе .

 bash |  copy code |? 
1
192.168.0.7:9421   23T   23T  165G 100% /mnt/mfs

вот страница дисков:

moosedisksОбновление 1:

Встерился с такой ситуацией, что 2 из 3х сереверов заполнились на 100%, а на третем сервере осталось еще 500ГБ, однако кластер не перераспределяет с 2х заполненных сервов данные на 3ий и поэтому записывая в кластер данные с goal=2 кластер не может обеспечить необходимое дублирование чанков. 🙁

 

Обнаружил появление интересного контроллера

HyperDuo_0_small

Сегодня, бродя по магазин у NIX обнаружил, к большому для себя удивлению, новый тип контроллеров — контроллеры с поддержкой Marvell HYPER duo/

Читать далее

Немного о ASMM и AMM

Здравствуйте, дорогой  читатель.

Сегодня я немножечко затрону тему динамического управления памятью в СУБД Oracle

Существует два метода динамического управления памятью — ASMM (появилась в 10g) и AMM (появилась в 11g) Читать далее