Мы сталкиваемся с этой проблемой на текущих версиях pve 6.3 и pbs 1.0.5 из enterprise-репозитория. Виртуальная машина зависла в состоянии "заморожена", отвечая только на жёсткую команду "стоп" (нет пинга, нет консоли). Хранение Ceph Octopus, 10Gbe, только nvme, в системном логе хоста ничего очевидного не нашлось. Предыдущие бэкапы проходили нормально.
Лог задачи PBS:
2020-12-19T09:00:04+01:00: старт нового бэкапа на хранилище 'data': "vm/103/2020-12-19T08:00:02Z"
2020-12-19T09:00:04+01:00: скачивание 'index.json.blob' из предыдущего бэкапа.
2020-12-19T09:00:04+01:00: регистрация чанков в 'drive-scsi0.img.fidx' из предыдущего бэкапа.
2020-12-19T09:00:05+01:00: скачивание 'drive-scsi0.img.fidx' из предыдущего бэкапа.
2020-12-19T09:00:05+01:00: создан новый фиксированный индекс 1 ("vm/103/2020-12-19T08:00:02Z/drive-scsi0.img.fidx")
2020-12-19T09:00:06+01:00: регистрация чанков в 'drive-scsi1.img.fidx' из предыдущего бэкапа.
2020-12-19T09:00:07+01:00: скачивание 'drive-scsi1.img.fidx' из предыдущего бэкапа.
2020-12-19T09:00:14+01:00: создан новый фиксированный индекс 2 ("vm/103/2020-12-19T08:00:02Z/drive-scsi1.img.fidx")
2020-12-19T09:01:13+01:00: регистрация чанков в 'drive-scsi2.img.fidx' из предыдущего бэкапа.
2020-12-19T09:01:14+01:00: скачивание 'drive-scsi2.img.fidx' из предыдущего бэкапа.
2020-12-19T09:01:14+01:00: создан новый фиксированный индекс 3 ("vm/103/2020-12-19T08:00:02Z/drive-scsi2.img.fidx")
2020-12-19T09:01:44+01:00: регистрация чанков в 'drive-scsi3.img.fidx' из предыдущего бэкапа.
2020-12-19T09:01:48+01:00: скачивание 'drive-scsi3.img.fidx' из предыдущего бэкапа.
2020-12-19T09:01:48+01:00: создан новый фиксированный индекс 4 ("vm/103/2020-12-19T08:00:02Z/drive-scsi3.img.fidx")
2020-12-19T09:02:12+01:00: добавлен blob "/mnt/datastore/data/vm/103/2020-12-19T08:00:02Z/qemu-server.conf.blob" (806 байт, сжатие: 806)
2020-12-19T09:02:12+01:00: добавлен blob "/mnt/datastore/data/vm/103/2020-12-19T08:00:02Z/fw.conf.blob" (209 байт, сжатие: 209)
2020-12-19T13:12:38+01:00: бэкап закончился с ошибкой: бэкап завершился, но флаг finished не выставлен.
2020-12-19T13:12:38+01:00: удаление незавершённого бэкапа
2020-12-19T13:12:38+01:00: ОШИБКА ЗАДАЧИ: бэкап закончился, но флаг finished не выставлен.
Лог бэкапов:
Код: 107:
2020-12-19 09:00:02 INFO: старт бэкапа ВМ 107 (qemu)
107: 2020-12-19 09:00:02 INFO: статус = running
107: 2020-12-19 09:00:02 INFO: имя ВМ: xxxx.xxx.xxxx
107: 2020-12-19 09:00:02 INFO: включён диск 'scsi0' 'FastSSDPool:vm-107-disk-1' 100G
107: 2020-12-19 09:00:02 INFO: режим бэкапа: snapshot
107: 2020-12-19 09:00:02 INFO: ionice приоритет: 7
107: 2020-12-19 09:00:02 INFO: найдены снимки (не включены в бэкап)
107: 2020-12-19 09:00:02 INFO: создаётся архив Proxmox Backup Server 'vm/107/2020-12-19T08:00:02Z'
107: 2020-12-19 09:00:05 INFO: пропуск команды гостевого агента 'fs-freeze', агент настроен, но не запущен?
107: 2020-12-19 09:01:05 ERROR: команда VM 107 qmp 'backup' не выполнена — таймаут
107: 2020-12-19 09:01:05 INFO: прерывание задачи бэкапа
107: 2020-12-19 09:01:10 ERROR: бэкап ВМ 107 провален — команда VM 107 qmp 'backup' не выполнена — таймаут
Код: 103:
2020-12-19 09:00:02 INFO: старт бэкапа ВМ 103 (qemu)
103: 2020-12-19 09:00:02 INFO: статус = running
103: 2020-12-19 09:00:02 INFO: имя ВМ: yyyyyyy.yyyyyyy.yyyyyyy
103: 2020-12-19 09:00:02 INFO: включён диск 'scsi0' 'FastSSDPool:vm-103-disk-0' 514252M
103: 2020-12-19 09:00:02 INFO: включён диск 'scsi1' 'FastSSDPool:vm-103-disk-1' 1000G
103: 2020-12-19 09:00:02 INFO: включён диск 'scsi2' 'FastSSDPool:vm-103-disk-2' 300G
103: 2020-12-19 09:00:02 INFO: включён диск 'scsi3' 'FastSSDPool:vm-103-disk-3' 500G
103: 2020-12-19 09:00:02 INFO: режим бэкапа: snapshot
103: 2020-12-19 09:00:02 INFO: ionice приоритет: 7
103: 2020-12-19 09:00:02 INFO: найдены снимки (не включены в бэкап)
103: 2020-12-19 09:00:02 INFO: создаётся архив Proxmox Backup Server 'vm/103/2020-12-19T08:00:02Z'
103: 2020-12-19 09:00:02 INFO: отправка команды гостевого агента 'fs-freeze'
103: 2020-12-19 09:01:03 INFO: отправка команды гостевого агента 'fs-thaw'
103: 2020-12-19 09:01:13 ERROR: команда VM 103 qmp 'guest-fsfreeze-thaw' не выполнена — таймаут
103: 2020-12-19 09:01:13 ERROR: команда VM 103 qmp 'backup' не выполнена — таймаут
103: 2020-12-19 09:01:13 INFO: прерывание задачи бэкапа
103: 2020-12-19 09:12:12 ERROR: команда VM 103 qmp 'backup-cancel' не выполнена — таймаут
103: 2020-12-19 09:12:12 ERROR: бэкап ВМ 103 провален — команда VM 103 qmp 'backup' не выполнена — таймаут