Теория управления: как заставить систему делать то, что нужно
За каждым автопилотом самолёта, промышленным роботом, системой климат-контроля стоит теория управления — математическая дисциплина, отвечающая на вопрос: как управлять динамической системой для достижения желаемого поведения? Она органично связана с кибернетикой Винера, хотя развивалась параллельно.
Теория управления (control theory) — раздел математики и инженерии, изучающий управление динамическими системами: как воздействовать на систему, чтобы она достигла заданного состояния или следовала заданной траектории.
Классический ПИД-регулятор
ПИД-регулятор (Пропорционально-Интегрально-Дифференциальный) — наиболее распространённый промышленный регулятор. Управляющее воздействие u(t) = Kp·e(t) + Ki·∫e(τ)dτ + Kd·de/dt, где e(t) — ошибка (разница между уставкой и текущим значением).
Три составляющие: П (пропорциональная) — реагирует на текущую ошибку; быстрый отклик, но может оставлять статическую ошибку. И (интегральная) — реагирует на накопленную ошибку; устраняет статическую ошибку, но может вызывать перерегулирование. Д (дифференциальная) — реагирует на скорость изменения ошибки; «предугадывает» тренд, ускоряет реакцию и снижает перерегулирование, но чувствителен к шуму.
Настройка (tuning) коэффициентов Kp, Ki, Kd — практическое искусство. Методы: Зиглера–Никольса (классический), настройка по АЧХ, оптимизационные алгоритмы.
Линейные и нелинейные системы
Линейная система: выходные сигналы пропорциональны входным, принцип суперпозиции выполняется. Большинство реальных систем нелинейны, но в небольшой окрестности рабочей точки линеаризуются — это позволяет применять мощный аппарат линейной теории управления (передаточные функции, место корней, частотный анализ, преобразование Лапласа).
Нелинейные системы требуют других методов: метод Ляпунова (устойчивость через функцию Ляпунова), скользящий режим, нейросетевое управление.
Оптимальное управление и целевые функции
Классическая задача: управлять системой так, чтобы минимизировать некоторую целевую функцию (функцию стоимости). Например: перевести ракету из точки А в точку Б за минимальное время (задача быстродействия), или с минимальным расходом топлива, или с минимальным отклонением от траектории.
Принцип максимума Понтрягина (1956) — советский математик Лев Понтрягин — общий метод решения задач оптимального управления. Регулятор LQR (Linear Quadratic Regulator) — решает задачу оптимального управления для линейных систем с квадратичной целевой функцией; широко применяется в аэрокосмической отрасли.
Теория автоматического регулирования и современность
Современное управление выходит за рамки ПИД. Адаптивное управление — регулятор сам подстраивает свои параметры в зависимости от изменений в объекте или среде. Предсказывающее управление (Model Predictive Control, MPC) — использует модель объекта для прогнозирования будущего поведения и решает задачу оптимизации на каждом шаге; применяется в нефтепереработке, автономных автомобилях. Нейросетевое и обучение с подкреплением (reinforcement learning) — системы управления, обучающиеся на опыте без явного программирования модели.
