Привет, заметил странное поведение. Иногда моя ленточная библиотека (Quantum Superloader 3 / LTO9) просто зависает. При серии резервных копий она меняет ленты как надо, иногда без сбоев несколько дней подряд, а потом вдруг ленточный накопитель перестаёт получать команду на переход к следующей ленте. Следующая задача резервного копирования так и стоит в статусе:
Код:
2024-03-11T00:00:10+01:00: ожидание захвата привода...
2024-03-11T00:00:50+01:00: запуск задачи резервного копирования 'px11:px11-maerz:lto9:px11'
2024-03-11T00:00:50+01:00: задача запущена по расписанию 'daily'
2024-03-11T00:00:50+01:00: обновление статуса носителей
2024-03-11T00:00:52+01:00: media set uuid: 220727db-edf2-4c9c-9ec8-3428d14a819c
2024-03-11T00:01:44+01:00: найдено 130 групп
2024-03-11T00:01:44+01:00: latest-only: true (учитываются только последние снимки)
2024-03-11T00:01:44+01:00: пропуск снимка vm/9000/2023-11-05T22:00:01Z
2024-03-11T00:01:44+01:00: резервное копирование снимка "vm/10100/2024-03-10T21:30:00Z"
2024-03-11T00:01:44+01:00: выделена новая записываемая лента 'NSK145L9'
2024-03-11T00:01:44+01:00: попытка загрузить ленту 'NSK145L9' в привод 'lto9'
2024-03-11T00:12:16+01:00: не удалось загрузить ленту в привод — ошибка чтения статуса элемента: read element status (B8h) не выполнена: ошибка scsi-команды: ошибка транспорта
2024-03-11T00:12:16+01:00: вставьте носитель 'NSK145L9' в чейнджер 'sl3'
Только после выполнения "Autoloader Reset" через веб-интерфейс Superloader происходит следующее:
Код:
2024-03-11T12:59:46+01:00: не удалось загрузить ленту в привод — ошибка чтения статуса элемента: read element status (B8h) не выполнена: Команда была прервана, Дополнительный код: I_T nexus loss occurred
2024-03-11T12:59:46+01:00: вставьте носитель 'NSK145L9' в чейнджер 'sl3'
2024-03-11T13:07:06+01:00: найден ярлык носителя NSK145L9 (cea82754-19f3-4248-ba6d-bf065021e81c)
2024-03-11T13:07:15+01:00: перемещение к концу носителя...
И после этого резервное копирование продолжается.
С чего лучше начать исследование? В библиотеке установлен выделенный SAS-контроллер: 01:00.0 Serial Attached SCSI controller: Adaptec Smart Storage PQI SAS (rev 01)
Код:
2024-03-11T00:00:10+01:00: ожидание захвата привода...
2024-03-11T00:00:50+01:00: запуск задачи резервного копирования 'px11:px11-maerz:lto9:px11'
2024-03-11T00:00:50+01:00: задача запущена по расписанию 'daily'
2024-03-11T00:00:50+01:00: обновление статуса носителей
2024-03-11T00:00:52+01:00: media set uuid: 220727db-edf2-4c9c-9ec8-3428d14a819c
2024-03-11T00:01:44+01:00: найдено 130 групп
2024-03-11T00:01:44+01:00: latest-only: true (учитываются только последние снимки)
2024-03-11T00:01:44+01:00: пропуск снимка vm/9000/2023-11-05T22:00:01Z
2024-03-11T00:01:44+01:00: резервное копирование снимка "vm/10100/2024-03-10T21:30:00Z"
2024-03-11T00:01:44+01:00: выделена новая записываемая лента 'NSK145L9'
2024-03-11T00:01:44+01:00: попытка загрузить ленту 'NSK145L9' в привод 'lto9'
2024-03-11T00:12:16+01:00: не удалось загрузить ленту в привод — ошибка чтения статуса элемента: read element status (B8h) не выполнена: ошибка scsi-команды: ошибка транспорта
2024-03-11T00:12:16+01:00: вставьте носитель 'NSK145L9' в чейнджер 'sl3'
Только после выполнения "Autoloader Reset" через веб-интерфейс Superloader происходит следующее:
Код:
2024-03-11T12:59:46+01:00: не удалось загрузить ленту в привод — ошибка чтения статуса элемента: read element status (B8h) не выполнена: Команда была прервана, Дополнительный код: I_T nexus loss occurred
2024-03-11T12:59:46+01:00: вставьте носитель 'NSK145L9' в чейнджер 'sl3'
2024-03-11T13:07:06+01:00: найден ярлык носителя NSK145L9 (cea82754-19f3-4248-ba6d-bf065021e81c)
2024-03-11T13:07:15+01:00: перемещение к концу носителя...
И после этого резервное копирование продолжается.
С чего лучше начать исследование? В библиотеке установлен выделенный SAS-контроллер: 01:00.0 Serial Attached SCSI controller: Adaptec Smart Storage PQI SAS (rev 01)
