Про что курс Углублённый трёхдневный курс для инженеров, которые будут профессионально сопровождать кластер Proxmox VE в production-инфраструктуре. Участники освоят построение многоузловых кластеров, кворум и QDevice, высокую доступность (HA Manager), live-migration, продвинутые сетевые конфигурации (bonding/LACP, VLAN, SDN), интеграцию с внешними хранилищами и системы резервного копирования, ролевую модель пользователей и прав, REST API, скриптовую автоматизацию через qm/pct/pvesh. Особое внимание уделяется операциям обслуживания без простоя: ротация узлов, обновление кластера, замена дисков, восстановление после сбоев. Все темы отрабатываются на реальных многоузловых кластерах в учебной лаборатории DAScorp.
Что будет уметь успешно окончивший его участник?
Проектировать и развёртывать многоузловые кластеры Proxmox VE с правильным quorum.
Настраивать и обслуживать HA Manager: ресурсные группы, политики fencing.
Выполнять live-migration ВМ и контейнеров с shared и replicated storage.
Конфигурировать продвинутую сеть: bonding/LACP, VLAN-aware bridge, OVS, SDN (zones/vnets).
Резервное копирование (vzdump) для кластера, ротация и retention-policies.
Практическая часть
Развёртывание 3-узлового кластера с нуля.
Подключение QDevice на отдельной ноде для tie-breaker’а.
Настройка HA Manager: создание группы ресурсов, тестирование failover.
Live-migration работающей ВМ между всеми узлами кластера.
Подключение NFS-share как Proxmox-storage с content=images,iso,backup.
Подключение iSCSI-target с multipath (через два маршрута).
Создание OVS bridge с LACP и VLAN-фильтрацией.
Развёртывание Proxmox SDN: zone Simple + Vlan + EVPN.
Создание пользователя «backup-operator» с правом только на vzdump.
Создание API-токена и автоматизация задачи через pvesh/Python-клиент.
Rolling upgrade кластера с PVE 7 на PVE 8 (на учебных нодах).
Восстановление кластера после симуляции отказа двух узлов из трёх.
Программа обучения (онлайн / оффлайн) После прохождения курса участники смогут профессионально проектировать, разворачивать и сопровождать production-кластеры Proxmox VE, обеспечивать их отказоустойчивость и автоматизировать рутинные задачи.
Длительность обучения: 3 полных дня (с 10:00 до 16:00)
День 1 (10:00 — 16:00) Кластер и кворум
09:30 — 10:00 — Регистрация участников 10:00 — 11:30 — Архитектура кластера Proxmox: corosync, pmxcfs, knet. Quorum и QDevice 11:30 — 11:45 — Перерыв на кофе 11:45 — 13:15 — HA Manager: концепция, ресурсные группы, политики, fencing 13:15 — 14:15 — Перерыв на обед 14:15 — 15:45 — Лабораторные работы:
Лабораторная 1: Знакомство с учебным стендом, проверка состояния трёх узлов
Лабораторная 2: Создание кластера pvecm create, присоединение второго и третьего узлов
Лабораторная 3: Развёртывание QDevice на отдельной ноде (corosync-qnetd)
Лабораторная 4: Стресс-тесты quorum: отключение узлов, восстановление
15:45 — 16:00 — Подведение итогов первого дня
День 2 (10:00 — 16:00) Сеть и хранилища
09:30 — 10:00 — Регистрация участников 10:00 — 11:30 — Сетевая модель Proxmox: Linux Bridge, OVS, bonding, VLAN-tagging 11:30 — 11:45 — Перерыв на кофе 11:45 — 13:15 — Proxmox SDN: zones, vnets, distributed firewall. Внешние хранилища: NFS, iSCSI, FC 13:15 — 14:15 — Перерыв на обед 14:15 — 15:45 — Лабораторные работы:
Лабораторная 5: Настройка OVS bridge с LACP-bonding и VLAN-фильтрацией
Лабораторная 6: Развёртывание Proxmox SDN: zone Simple + Vlan
Лабораторная 7: Подключение NFS-share как shared-storage кластера
Лабораторная 8: Подключение iSCSI-target с multipath
Лабораторная 9: Настройка HA Manager и live-migration ВМ между узлами
15:45 — 16:00 — Подведение итогов второго дня
День 3 (10:00 — 16:00). Безопасность, автоматизация, эксплуатация
09:30 — 10:00 —Регистрация участников 10:00 — 11:30 —RBAC, realms, ACL paths. REST API и автоматизация 11:30 — 11:45 — Перерыв на кофе 11:45 — 13:15 — Резервное копирование, rolling upgrade кластера, диагностика 13:15 — 14:15 — Перерыв на обед 14:15 — 15:45 — Лабораторные работы:
Лабораторная 10: Создание custom role + пользователя только с backup-привилегиями
Лабораторная 11: API-токен + автоматизация задачи на Python (через pvesh/REST)
Лабораторная 12: Симуляция отказа двух узлов из трёх — восстановление кластера
Лабораторная 13: Rolling upgrade кластера без простоя VM
Лабораторная 14: Чтение и интерпретация corosync/pmxcfs логов
15:45 — 16:00 — Подведение итогов курса и заключительные моменты обучения
Определение (что такое кластер Proxmox VE?) Кластер Proxmox VE — это группа из 2 и более физических серверов (узлов), объединённых средствами corosync (членство и обмен голосами кворума) и pmxcfs (распределённой файловой системой кластерной конфигурации). Все узлы кластера видят общий пул объектов: ВМ, контейнеры, хранилища, пользователей, и могут управлять всем кластером через любой из узлов одним веб-интерфейсом. Дополнительно над кластером работают:
HA Manager — автоматический failover ВМ/CT при потере узла.
Live-migration — перенос работающей ВМ между узлами без перерыва сервиса.
Shared/replicated storage — необходимое условие для live-migration и HA.
QDevice — внешний голосующий сервис для 2-узловых кластеров (split-brain protection).
Основные характеристики
До 32 узлов в одном кластере (на практике рекомендуется до 16).
Quorum + Fencing — split-brain protection через corosync + QDevice/STONITH.
HA Manager — автоматический перезапуск ВМ на живом узле в течение 1–2 минут.
Live-migration — downtime в десятки миллисекунд.
Proxmox SDN — программно определяемая сеть с VLAN/VXLAN/EVPN-zones.
REST API + CLI + GUI — три равнозначных интерфейса управления.
Rolling upgrade — обновление узлов по одному без простоя сервисов.
Применение
Production-виртуализация в малых и средних ЦОД (3–16 узлов).
Гиперконвергентная инфраструктура (HCI) на базе Ceph (см. курс PVE-03).
Edge-инфраструктура с автоматическим failover при отказе узла.
Multi-tenant-среды с разделением прав через RBAC и API-токены.