Всем привет! В последнее время замечаю странную проблему с Proxmox (6.4-13) в связке с Proxmox Backup Server (2.0-9). Резервное копирование ВМ по ночам в большинстве случаев проходит отлично и надежно, а так как это чаще всего инкрементные бэкапы, процесс достаточно быстрый. Производительность резервного копирования в среднем около 80 МБ/с тоже довольно хорошая, учитывая, что данные передаются по сети в совершенно другой дата-центр.
Однако если возникают проблемы с записью/чтением бэкапа или процесс записи на сервер бэкапов идет медленно (из-за плохой пропускной способности сети или медленного жесткого диска на сервере бэкапов), то ВМ зависает (сервисы на ней становятся недоступными), и с графическим интерфейсом (консоль не открывается — таймаут, выключение — таймаут, помогает только жесткая остановка). В основном бэкап останавливается где-то в процессе (например, на 50% или 60%) и выдает ошибку: "ERROR: VM ... qmp command 'query-backup' failed - got timeout". Симптомы, описанные в этой теме форума (), выглядят очень похожими на мои.
Теперь вопрос: нормально ли, что из-за проблем с бэкапом ВМ на короткое время становится недоступной? В идеале бэкап не должен мешать работе сервисов или самой ВМ. Это стандартное поведение или у меня что-то с сервером не так? Спасибо за помощь!
Полный лог бэкапа:
Spoiler
INFO: пытаюсь получить глобальную блокировку — жду...
INFO: получил глобальную блокировку
INFO: запускаю новую задачу бэкапа: vzdump 101 --mailnotification failure --mode snapshot --mailto ...@... --storage backup_pbs --quiet 1
INFO: начинаю бэкап ВМ 101 (qemu)
INFO: Бэкап стартовал 2021-09-15 02:52:46
INFO: статус = running
INFO: Имя ВМ: VM01
INFO: включаю диск 'sata1' 'storage2:101/vm-101-disk-0.qcow2' 500G
INFO: режим бэкапа: snapshot
INFO: приоритет ionice: 7
INFO: создаю архив Proxmox Backup Server 'vm/101/2021-09-15T00:52:46Z'
INFO: включаю шифрование
INFO: задача бэкапа запущена с ID '0c8136ea-9282-44b1-a505-1a1ae417eb88'
INFO: возобновляю работу ВМ
INFO: sata1: статус dirty-bitmap: OK (21.7 GiB из 500.0 GiB "грязных" данных)
INFO: использую быстрый инкрементальный режим (dirty-bitmap), 21.7 GiB грязных из 500.0 GiB всего
(Далее идет отчет о процентах и скорости чтения/записи с разными значениями в MiB/s и временах)
INFO: 1% (308.0 MiB из 21.7 GiB) за 3 сек, чтение: 102.7 MiB/s, запись: 101.3 MiB/s
INFO: 2% (656.0 MiB из 21.7 GiB) за 6 сек, чтение: 116.0 MiB/s, запись: 116.0 MiB/s
...
INFO: 54% (11.7 GiB из 21.7 GiB) за 17 м 18 с, чтение: 40.8 MiB/s, запись: 24.8 MiB/s
ERROR: VM 101 qmp command 'query-backup' failed - got timeout
INFO: прерываю задачу бэкапа
INFO: возобновляю работу ВМ
ERROR: Бэкап ВМ 101 не удался — VM 101 qmp command 'query-backup' failed - got timeout
INFO: ошибка зафиксирована 2021-09-15 03:22:30
INFO: задача бэкапа завершена с ошибками
TASK ERROR: job errors
Однако если возникают проблемы с записью/чтением бэкапа или процесс записи на сервер бэкапов идет медленно (из-за плохой пропускной способности сети или медленного жесткого диска на сервере бэкапов), то ВМ зависает (сервисы на ней становятся недоступными), и с графическим интерфейсом (консоль не открывается — таймаут, выключение — таймаут, помогает только жесткая остановка). В основном бэкап останавливается где-то в процессе (например, на 50% или 60%) и выдает ошибку: "ERROR: VM ... qmp command 'query-backup' failed - got timeout". Симптомы, описанные в этой теме форума (), выглядят очень похожими на мои.
Теперь вопрос: нормально ли, что из-за проблем с бэкапом ВМ на короткое время становится недоступной? В идеале бэкап не должен мешать работе сервисов или самой ВМ. Это стандартное поведение или у меня что-то с сервером не так? Спасибо за помощь!
Полный лог бэкапа:
Spoiler
INFO: пытаюсь получить глобальную блокировку — жду...
INFO: получил глобальную блокировку
INFO: запускаю новую задачу бэкапа: vzdump 101 --mailnotification failure --mode snapshot --mailto ...@... --storage backup_pbs --quiet 1
INFO: начинаю бэкап ВМ 101 (qemu)
INFO: Бэкап стартовал 2021-09-15 02:52:46
INFO: статус = running
INFO: Имя ВМ: VM01
INFO: включаю диск 'sata1' 'storage2:101/vm-101-disk-0.qcow2' 500G
INFO: режим бэкапа: snapshot
INFO: приоритет ionice: 7
INFO: создаю архив Proxmox Backup Server 'vm/101/2021-09-15T00:52:46Z'
INFO: включаю шифрование
INFO: задача бэкапа запущена с ID '0c8136ea-9282-44b1-a505-1a1ae417eb88'
INFO: возобновляю работу ВМ
INFO: sata1: статус dirty-bitmap: OK (21.7 GiB из 500.0 GiB "грязных" данных)
INFO: использую быстрый инкрементальный режим (dirty-bitmap), 21.7 GiB грязных из 500.0 GiB всего
(Далее идет отчет о процентах и скорости чтения/записи с разными значениями в MiB/s и временах)
INFO: 1% (308.0 MiB из 21.7 GiB) за 3 сек, чтение: 102.7 MiB/s, запись: 101.3 MiB/s
INFO: 2% (656.0 MiB из 21.7 GiB) за 6 сек, чтение: 116.0 MiB/s, запись: 116.0 MiB/s
...
INFO: 54% (11.7 GiB из 21.7 GiB) за 17 м 18 с, чтение: 40.8 MiB/s, запись: 24.8 MiB/s
ERROR: VM 101 qmp command 'query-backup' failed - got timeout
INFO: прерываю задачу бэкапа
INFO: возобновляю работу ВМ
ERROR: Бэкап ВМ 101 не удался — VM 101 qmp command 'query-backup' failed - got timeout
INFO: ошибка зафиксирована 2021-09-15 03:22:30
INFO: задача бэкапа завершена с ошибками
TASK ERROR: job errors
