Нейроуправление

Нейроуправление (англ. Neurocontrol) — частный случай интеллектуального управления, использующий искусственные нейронные сети для решения задач управления динамическими объектами. Нейроуправление находится на стыке таких дисциплин, как искусственный интеллект, нейрофизиология, теория автоматического управления, робототехника. Нейронные сети обладают рядом уникальных свойств, которые делают их мощным инструментом для создания систем управления: способностью к обучению на примерах и обобщению данных, способностью адаптироваться к изменению свойств объекта управления и внешней среды, пригодностью для синтеза нелинейных регуляторов, высокой устойчивость к повреждениям своих элементов в силу изначально заложенного в нейросетевую архитектуру параллелизма. Термин «нейроуправление», впервые был использован одним из авторов метода обратного распространения ошибки Полом Дж. Вербосом в 1976 году^[1]^[2]. Известны многочисленные примеры практического применения нейронных сетей для решения задач управление самолетом^[3]^[4], вертолетом^[5], автомобилем-роботом^[6], скоростью вращения вала двигателя^[7], гибридным двигателем автомобиля^[8], электропечью^[9], турбогенератором^[10], сварочным аппаратом^[11], пневмоцилиндром^[12], системы управления вооружением легкобронированных машин^[13], моделью перевернутого маятника^[14].

Методы нейроуправления

Схема прямого нейроуправления с обратной связью. На такте k нейроконтроллер получает на вход уставочное значение r(k+1) и оценку текущего состояния объекта S(k) и генерирует управляющее воздействие u(k), переводя объект управления в новое положение y(k+1).

По способу использования нейронных сетей методы нейроуправления делятся на прямые методы и непрямые методы. В прямых методах нейронная сеть обучается непосредственно генерировать управляющие воздействия на объект, в непрямых методах нейронная сеть обучается выполнять вспомогательные функции: идентификация объекта управления, подавление шума, оперативная настройка коэффициентов ПИД-контроллера. В зависимости от числа нейросетей, составляющих нейроконтроллер, системы нейроуправления делятся на одномодульные и многомодульные. Системы нейроуправления, которые применяются совместно с традиционными регуляторами, называются гибридными.

В задачах нейроуправления для представления объекта управления используют модель черного ящика, в котором наблюдаемыми являются текущие значения входа и выхода. Состояние объекта считается недоступным для внешнего наблюдения, хотя размерность вектора состояний обычно считается фиксированной. Динамику поведения объекта управления можно представить в дискретном виде:

$\begin{matrix}S(k+1)=\Phi(S(k), u(k))) \\ y(k+1)=\Psi(S(k)) \end{matrix}$

где: $S(k)\in\mathbb{R}^N$ — состояние объекта управления порядка $N$ на такте $k$ ; $u(k)\in\mathbb{R}^P$ — значение $P$ -мерного вектора управления на такте $k$ , $y(k+1)\in\mathbb{R}^V$ — значение $V$ -мерного выхода объекта управления на такте $k+1$ .

Для оценки текущего состояния объекта управления $S(k)$ может быть использована модель NARX, состоящая из прошлых положений объекта $y$ и задержанных сигналов управления $u$ :

$S(k) = [y(k)~y(k-1)~y(k-2)~\ldots~y(k-N)~u(k-1)~u(k-2)~\ldots~u(k-Q)]^T$

Вектор оценки состояния $S$ может быть также представлен без использования задержанных сигналов:

$S(k) = [y(k)~y(k-1)~y(k-2)~\ldots~y(k-N)]^T$

Также возможно представить состояние объекта как мгновенный снимок его фазовой траектории:

$S(k) = [y(k)~y(k)'~\ldots~y(k)^{(N)}]^T$

Подражающее нейроуправление

Схема подражающего нейроуправления: слева — режим обучения нейронной сети; справа — режим управления

Подражающее нейроуправление^[15]^[16]^[17] (Neurocontrol learning based on mimic, Controller Modeling, Supervised Learning Using an Existing Controller) охватывает системы нейроуправления, в которых нейроконтроллер обучается на примерах динамики обычного контроллера по обратной связи, построенного, например, на основе обычной ПИД-схемы управления. После обучения нейронная сеть в точности воспроизводит функции исходного контроллера. В качестве примеров динамики контроллера может быть использована запись поведения человека-оператора. Обычный контроллер по обратной связи (или человек-оператор) управляет объектом управления в штатном режиме. Значения величин на входе и выходе контролера протоколируются, и на основе протокола формируется обучающая выборка $U = \{P_i, T_i\}_{i=1}^M$ для нейронной сети, содержащая $M$ пар значений входа $P_i$ и ожидаемых реакций $T_i$ нейросети:

$\begin{matrix}P_i = [r(i+1)~S(i)]^T \\ T_i = u(i) \end{matrix}$

После обучения с помощью, например, метода обратного распространения ошибки, нейронная сеть подключается вместо исходного контроллера. Полученный нейроконтроллер может заменить человека в управлении устройством, а также быть более выгодным экономически, чем исходный контроллер.

Обобщенное инверсное нейроуправление

Схема обобщенного инверсного нейроуправления: слева — режим обучения инверсного нейроэмулятора; справа — режим управления объектом

В схеме обобщенного инверсного нейроуправления (Generalized Inverse Neurocontrol, Direct Inverse Neurocontrol, Adaptive Inverse Control)^[18]^[19] в качестве контроллера используется нейронная модель инверсной динамики объекта управления, называемая инверсный нейроэмулятор. Инверсный нейроэмулятор представляет собой нейронную сеть, обученную в режиме офф-лайн имитировать обратную динамику объекта управления на основе записанных траекторий поведения динамического объекта. Для получения таких траекторий, на объект управления в качестве управляющего сигнала подают некоторый случайный процесс. Значения управляющих сигналов и ответных реакций объекта протоколируют и на этой основе формируют обучающую выборку $U = \{P_i, T_i\}_{i=1}^M$ :

$\begin{matrix}P_i = [y(i)~S(i-1)]^T \\ T_i = u(i) \end{matrix}$

В ходе обучения, нейронная сеть должна уловить и запомнить зависимость значений управляющего сигнала $u(k-1)$ от последуюшего значения реакции объекта управления $y(k)$ , находящегося перед этим в состоянии $S(k-1)$ . При управлении объектом, инверсный нейроэмулятор подключается как контроллер, получая при этом на вход $x(k)$ значения уставки $r(k+1)$ и состояния объекта управления $S(k)$ , поступающего по каналу обратной связи:

$x(k)=[r(k+1)~S(k)]^T$

Предполагается, что сформированная при обучении инверсная модель объекта управления является адекватной, следовательно сигнал управления, выдаваемый нейронной сетью, обеспечит переход объекта в положение, заданное уставкой.

Специализированное инверсное нейроуправление

Специализированное инверсное нейроуправление (Specialised Inverse Neurocontrol)^[19]^[18] использует методику обучения нейроконтроллера в режиме он-лайн, используя текущую ошибку отклонения положения объекта от уставки $e(k)=r(k)-y(k)$ . Схема подключения нейроконтроллера такая же, как в методе обобщенного инверсного нейроуправления. На вход сети подается вектор $x(k)$ :

$x(k)=[r(k+1)~S(k)]^T$

Нейронная сеть генерирует управляющий вектор $u(k)$ , который переводит объект управления в положение $y(k+1)$ . Далее вычисляется текущая ошибка работы нейроконтроллера

$e(k)=r(k+1)-y(k+1)$

Вычисляется градиент изменения весов

$\Delta w = e(k) \frac{\partial y(k+1)}{\partial u(k)} \frac{\partial u(k))}{\partial w(k)}$

Затем производится коррекция весов нейроконтроллера по методу наискорейшего спуска или каким-либо другим градиентным методом.

Производная $\frac{\partial y(k+1)}{\partial u(k)}$ представляет собой якобиан объекта управления, значение которого задается аналитически по заданной математической модели объекта управления. Однако, на практике, для получения приемлемого качества управления часто бывает достаточно вычислить лишь знак якобиана. Итерации коррекции значений коэффициентов продолжаются до достижения приемлемого качества управления.

Метод обратного пропуска ошибки через прямой нейроэмулятор

Метод обратного пропуска ошибки через прямой нейроэмулятор: слева — схема обучения прямого нейроэмулятора; cправа — схема обучения нейроконтроллера

Метод обратного пропуска ошибки через прямой нейроэмулятор (Backpropagation Through Time, Model Reference Adaptive Control, Internal Model Control)^[20]^[21]^[22]^[8] основан на идее применения тандема из двух нейронных сетей, одна из которых выполняет функцию контроллера, а вторая — модели объекта управления, которая носит название прямой нейроэмулятор. Прямой нейроэмулятор служит для вычисления градиента ошибки нейроконтроллера в процессе его обучения и далее не используется. Можно сказать, что нейроконтроллер и нейроэмулятор представляют собой единую нейросеть, при этом, при обучении нейроконтроллера веса прямого нейроэмулятора «замораживаются». Прямой нейроэмулятор обучается первым. Для этого, на вход объекта управления подается случайный управляющий сигнал $u$ , изменяющий положение объекта управления $y$ , и формируется обучающая выборка $U = \{P_i, T_i\}_{i=1}^M$ :

$\begin{matrix} P_i = [u(i)~S(i-1)]^T \\ T_i = y(i) \end{matrix}$

Обучение прямого нейроэмулятора выполняется в режиме офф-лайн. Прямой нейроэмулятор считается обученным, если при одинаковых значениях на входах нейроэмулятора и реального объекта, отличие между значениями их выходов становится незначительным. После завершения обучения прямого нейроэмулятора, проводится обучение нейроконтроллера. Обучение выполняется в режиме он-лайн по такой же схеме, как и в случае специализированного инверсного нейроуправления. Сначала (на такте $k$ ) на вход нейроконтроллера поступает желаемое положение объекта управления для следующего такта $r(k+1)$ . Нейроконтроллер генерирует сигнал управления $u(k)$ , который поступает на входы объекта управления и нейроэмулятора. В результате, управляемый объект переходит в положение $y(k+1)$ , а нейроэмулятор генерирует реакцию $\hat{y}(k+1)$ . Далее вычисляется ошибка управления $e(k)=r(k+1)-y(k+1)$ и пропускается в обратном направлении по правилу обратного распространения. Весовые коэффициенты связей нейроэмулятора при этом не корректируются. Механизм обратного прохождения ошибки через прямой нейроэмулятор реализует локальную инверсную модель в текущей точке пространства состояний объекта управления. Пройдя через нейроэмулятор, ошибка далее распространяется через нейроконтроллер, но теперь ее прохождение сопровождается коррекцией весовых коэффициентов нейроконтроллера. Прямой нейроэмулятор при этом выполняет функции дополнительных слоев нейроной сети нейроконтроллера, в которых веса связей не корректируются.

Метод нейроуправления с эталонной моделью

Нейроуправление с эталонной моделью

Метод нейроуправления с эталонной моделью (Model Reference Adaptive Control, Neural Adaptive Control)^[22]^[23] — вариант нейроуправления по методу обратного пропуска ошибки через прямой нейроэмулятор, с дополнительно внедренной в схему эталонной моделью (Reference Model) динамической системы, имитировать поведение которой обучается нейроконтроллер. Это делается в целях повышения качества переходного процесса: в случае, когда переход объекта в целевое положение за один такт невозможен, траектория движения и время осуществления переходного процесса становятся плохо прогнозируемыми величинами и могут привести к неустойчивости переходного процесса. Для уменьшения этой неопределенности, вводится эталонная модель, представляющая собой, как правило, устойчивую линейную динамическую систему первого или второго порядка. В ходе обучения, эталонная модель на такте $k$ получает на вход уставку $r(k+1)$ и генерирует опорную траекторию $y'(k+1)$ , которая сравнивается с положением объекта управления $y(k+1)$ с целью получить ошибку управления $e(k+1)$ , минимизировать которую обучается нейроконтроллер.

Метод нейросетевой фильтрации внешних возмущений

Схема метода нейросетевой фильтрации внешних возмущений

Метод нейросетевой фильтрации внешних возмущений (Adaptive Inverse Control based on Linear and Nonlinear Adaptive Filtering, Internal Model Control)^[24] служит для улучшения качества работы контроллера в цепи управления. Изначально, эта схема была предложена Б. Уидроу для использования совместно с нейроконтроллерами, обученными по методу обобщенного инверсного нейроуправления^[25]. В более поздней работе^[26] им были применены нейроконтроллеры, обученные по методу обратного распространения ошибки через прямой нейроэмулятор. В принципе, нейросетевую фильтрацию ошибок можно использовать для повышения качества работы контроллера любого типа, не обязательно нейросетевого. В этой схеме используется две предварительно обученных нейронных сети: инверсный нейроэмулятор, обученный так же, как это делается в методе обобщенного инверсного нейроуправления и прямой нейроэмулятор, обученный так же, как это делается в методе обратного распространения ошибки через прямой нейроэмулятор. Пусть на объект управления поступает управляющий сигнал $\hat{u}_F(k)$ , явившийся результатом суммирования сигнала контроллера $\hat{u}(k)$ и корректирующего сигнала системы фильтрации внешних возмущений $\hat{u}_C(k)$ , вычисленного на предыдущем такте. Сигнал направляется на прямой нейроэмулятор объекта управления, а реакция прямого нейроэмулятора сравнивается с реальным положением системы $y(k)$ . Разница этих величин $e(k)$ трактуется как нежелательное отклонение системы, вызванное внешним возмущением. Для подавления нежелательного эффекта, сигнал поступает на инверсный нейроэмулятор, который рассчитывает корректирующий сигнал $\hat{u}_C(k+1)$ для корректировки управляющего сигнала нейроконтроллера $\hat{u}(k+1)$ на следующем такте. Для использования этого метода, объект управления должен обладать обращаемой динамикой, а также необходимо иметь адекватную математическую или имитационную модель объекта управления для обучения прямого и инверсного нейроэмуляторов.

Прогнозирующее модельное нейроуправление

Схема прогнозирующего модельного нейроуправления

Прогнозирующее модельное нейроуправление (NN Predictive Control, Model Predictive Control, Neural Generalized Predictive Control)^[27]^[28] минимизирует функционал стоимости интегральной ошибки $Q(k)$ , прогнозируемой на $L=max(L_2, L_3)$ , $0\le L_1\le L_2$ тактов вперед:

$Q(k) = \sum_{i=L_1}^{L_2}e(k+i)^2+\rho \sum_{i=0}^{L_3}(u(k+i)-u(k+i-1))^2.$

Здесь $e(k)$ — ошибка выхода системы, $\rho$ — вклад изменения управляющего сигнала в общий функционал стоимости $Q(k)$ . Для прогнозирования будущего поведения системы и вычисления ошибок используется прямой нейроэмулятор, обученный так же, как в методе обратного распространения ошибки через прямой нейроэмулятор. Примечательность рассматриваемого метода состоит в том, что в нем отсутствует обучаемый нейроконтроллер. Его место занимает оптимизационный модуль, работающий в режиме реального времени, в котором может быть использован, например, cимплекс-метод^[29] или квази-Ньютоновский алгоритм^[30].

Оптимизационный модуль получает на такте целевую траекторию на $L$ тактов вперед, а если ее нет, то $L$ раз дублирует значение текущей уставки $r(k+1)$ и использует это в качестве целевой траектории. Далее, для выбора оптимального управляющего воздействия, вычисления происходят во внутреннем цикле системы нейроуправления (его итерации обозначаются как $j$ ). За время одного такта управления оптимизационный модуль подает на вход нейроэмулятора серию различных воздействий $\hat{u}(k+t,j)$ , где $t$ — глубина прогнозирования, $0\le t \le L-1$ , получает различные варианты поведения системы, вычисляет для них функцию стоимости $Q(k)$ и определяет наилучшую стратегию управления $ST=\{\hat{u}(k, j_1)~\hat{u}(k, j_2)~\ldots~~\hat{u}(k, j_L)\}$ . В итоге, на объект подается управляющий сигнал $\hat{u}(k, j_1)$ . На следующем такте стратегия $ST$ пересчитывается заново.

Адаптивные критики

Схема адаптивной критики: слева — этап управления; справа — этап обучения

Методы нейроуправления на основе адаптивной критики (Adaptive Critics), которые также известны как приближенное динамическое программирование (Approximated Dynamic Programming, ADP), в последние годы весьма популярны^[31]^[32]^[33]^[34]. Системы адаптивной критики выбирают управляющий сигнал на основе минимизации функционала оценок ошибок будущего с бесконечным горизонтом:

$J(k) = \sum_{i=0}^{\infty}\gamma^ie(k+i)^2.$

Здесь $\gamma$ — коэффициент забывания, $0<\gamma\le1$ , $e(k)=r(k+1)-y(k+1)$ — отклонение траектории объекта управления от уставки, вычисляемое на каждом такте работы системы. Система включает два нейронных модуля: нейроконтроллер и модуль критики (критик). Модуль критики выполняет аппроксимацию значений функционала стоимости $J(k)$ , нейроконтроллер обучают минимизировать функционал стоимости $J(k)$ .

В режиме управления объектом, на вход нейроконтроллера поступает вектор $x(k) = [r(k+1)~S(k)]^T$ , вызывающий появление на его выходе сигнала управления $u(k)$ , в результате чего объект управления переходит в положение $y(k+1)$ . Далее производится вычисление значения текущей ошибки управления $e(k)$ . Модуль критики, получая на входе вектор $z(k)=[r(k+1)~u(k)~S(k)]^T$ , производит оценку функции стоимости $J(k)$ . На следующем такте процесс повторяется: вычисляются новые значения $e(k+1)$ и $J(k+1)$ . Обучение системы нейроуправления происходит в режиме он-лайн и состоит из двух этапов: обучения модуля критики и обучения нейроконтроллера. Сначала, рассчитывается ошибка временной разности $\delta w(k) = e(k) + \gamma J(k+1) - J(k)$ . Затем по методу наискорейшего спуска выполняется коррекция веса связей для модуля критики $w_{critic}$ :

$\Delta w_{critic}(k) = -{\alpha}_1 \delta (k) \frac{\partial J(k)}{\partial w_{critic}(k)}$

Значение градиента $\frac{\partial J(k)}{\partial w_{critic}(k)}$ рассчитывается по методу обратного распространения ошибки. Коррекция веса связей нейроконтроллера $\Delta w_{control}$ производится аналогично:

$\Delta w_{control}(k) = -{\alpha}_2 \frac{\partial J(k)}{\partial u(k)} \frac{\partial u(k)}{ \partial w_{control}(k)}$

Значение производной $\frac{\partial J(k)}{\partial u(k)}$ находят путем обратного распространения величины через модуль критики, а значение градиента $\frac{\partial u(k)}{ \partial w_{control}(k)}$ — путем обратного распространения ошибки через модуль контроллера. Коррекция весов продолжается, пока система не достигнет требуемого уровня качества управления. Таким образом, на каждом шаге улучшается закон управления, путем обучения нейроконтроллера (итерация по стратегиям, Policy Iteration), а также повышается способность системы оценивать ситуацию, путем обучения критика (итерация по значениям, Value Iteration). Конкретная схема построения системы адаптивной критики может отличаться от вышеописанной, носящей название эвристическое динамическое программирование (Heuristic Dynamic Programming, HDP). В методе дуального эвристического программирования (Dual Heuristic Programming, DHP) модуль критики вычисляет производную функционала глобальной стоимости $\frac{\partial J}{\partial t}$ , а в методе глобального дуального эвритического программирования (Global Dual Heuristic Programming, GHDP) критиком вычисляются как сам функционал функции стоимости $J$ , так и его производная $\frac{\partial J}{\partial t}$ . Известны модификации метода, в которых модуль критики принимает решения исключительно на основе управляющего сигнала. Их англоязычные аббревиатуры имеют приставку AD (Action Dependent): ADHDP, ADDHP, ADGDHP. В некоторых версиях адаптивной критики модуль критики состоит из двух частей: собственно, модуля критики и прямого нейроэмулятора. Последний выдает предсказания поведение объекта управления, на основе которых критик формирует оценку функции стоимости $J$ . Такие версии носят название основанные на модели (model based).

Гибридное нейро-ПИД управление

Схема гибридного нейро-ПИД управления

Гибридное нейро-ПИД управление (NNPID Auto-tuning, Neuromorphic PID Self-tuning)^[35]^[36] позволяет осуществлять самонастройку ПИД-регулятора в режиме он-лайн путем использованием нейронных сетей. Настройка ПИД-регулятора выполняется в режиме он-лайн, по текущей ошибке управления $e(k)=r(k+1)-y(k+1)$ . На такте $k$ нейронная сеть получает уставку $r(k+1)$ и генерирует коэффициенты управления ПИД-контроллера $K_1$ (пропорциональный), $K_2$ (интегральный), $K_3$ (дифференциальный), которые поступают на ПИД-контроллер вместе со значением текущей ошибки обратной связи $e(k)$ . В ходе работы, ПИД-контроллер рассчитывает текущий управляющий сигнал $u(k)$ по формуле:

$u(k) = u(k-1) + K_1(k)(e(k)-e(k-1)) + K_2(k)e(k) + K_3(k)(e(k) - 2e(k-1) + e(k-2))$

применяемой для дискретных ПИД-контроллеров и подает его на объект управления.

Обучение нейросети происходит в режиме реального времени по ошибке обратной связи, методом наискорейшего спуска.

$\Delta w(k) = -\alpha e(k) \frac{\partial y(k+1)}{\partial u(k)} \frac{\partial u(k)}{\partial K(k)} \frac{\partial K(k)}{\partial w(k)}$

Здесь $K(k)=[K_1(k)~K_2(k)~K_3(k)]^T$ — вектор выходов нейронной сети, поступающий на ПИД-контроллер.

$\frac{\partial u(k)}{\partial K_i(k)} = \Bigg \{ \begin{matrix} e(k) - e(k-1) & for~i = 1; \\ e(k) & for~i = 2; \\ e(k) - 2e(k-1) + e(k-2) & for~i = 3. \end{matrix}$

Градиенты $\frac{\partial K_i(k)}{\partial w(k)}$ вычисляют методом обратного распространения ошибки. Якобиан объекта управления $\frac{\partial y(k+1)}{\partial u(k)}$ ли его знак находится аналитически, на основе математической модели объекта управления.

Гибридное параллельное нейроуправление

Схема гибридного параллельного нейроуправления

Методы гибридного параллельного нейроуправления (Parallel Neurocontrol, Stable Direct Adaptive Control, Additive Feedforward Control)^[24]^[27] предусматривают параллельное использование нейроконтроллеров и обычных контроллеров для управления динамическими объектами. При этом нейроконтроллер и обычный контроллер, в роли которого выступает, например, ПИД-контроллер, получают одинаковые значения уставки. Возможны следующие варианты совместного подключения обычного контроллера и нейроконтроллера:

к объекту управления подключается обычный контроллер, после чего нейроконтроллер обучается управлять уже замкнутой обычным контроллером системой. После обучения нейроконтроллера, он подключается к системе, а управляющие сигналы обоих контроллеров суммируются;
нейроконтроллер учится управлять объектом управления, после обучения начинает функционировать в штатном режиме. Далее, для управления замкнутой нейроконтроллером системой настраивается обычный контроллер. После настройки обычного контроллера, он подключается к системе, управляющий сигнал обоих контроллеров суммируется;
области действия обычного контроллера и нейроконтроллера разграничиваются. Например, в пространстве состояний объекта управления для нейроконтроллера выделяется отдельная область $LS$ :

$LS=[(y_1-d_1;y_1+d_1)~\ldots~(y_N-d_N;y_N+d_N)]^T$

При этом, обычный контроллер рассчитывается на управление объектом вне этой области пространства состояния. При параллельной работе обоих контроллеров, управляющий сигнал поступает на объект либо от нейроконтроллера, если текущее состояние системы находится в пределах области $LS$ , либо, в противном случае, от обычного контроллера. Гибридное параллельное нейроуправление представляет компромиссное решение для внедрения нейроуправления в промышленность и перехода от обычных контроллеров к нейросетевым.

Примечания

↑ Вороновский Г. К., Генетические алгоритмы, искусственные нейронные сети, 1997
↑ Werbos, P.J. Backpropagation and neurocontrol: a review and prospectus // International Joint Conference on Neural Networks, Vol. 1. — P. 209—216. — Washington, DC , USA, 18-22 Jun 1989
↑ Gundy-Burlet K., Krishnakumar K., Limes G., Bryant D. Augmentation of an Intelligent Flight Control System for a Simulated C-17 Aircraft // J. of Aerospace Computing, Information, and Communication. — 2004. — Vol. 1, N 12. — P. 526—542
↑ Кондратьев А. И., Тюменцев Ю. В. Нейросетевое адаптивное отказоустойчивое управление движением маневренного самолета // XII Всероссийская научно-техническая конференция «Нейроинформатика — 2010»: Часть 2. — М.: НИЯУ МИФИ, 2010. — С. 262—273.
↑ Никифорова Л. Н., Петросян Э. А., Якеменко Г. В. Нейрокомпьютеры в управлении вертолетами // Искусственный интеллект. — 2000. — № 3. — С. 290—298
↑ D. Gu and H. Hu. Neural Predictive Control for a Car-like Mobile Robot // International Journal of Robotics and Autonomous Systems, Vol. 39, No. 2-3, May, 2002
↑ [Терехов В. А., Ефимов Д. В., Тюкин И. Ю. Нейросетевые системы управления: Учеб. пособие для вузов. — М.: Высш. школа 2002. — 183 с.]
↑ ¹ ² Danil V. Prokhorov. Toyota Prius HEV Neurocontrol and Diagnostics // Neural Networks. — 2008. — No. 21. — P. 458—465
↑ Dias F.M., Mota A.M. Comparison between Different Control Strategies using Neural Networks // 9th Mediterranean Conference on Control and Automation. — Dubrovnik, Croatia, 2001
↑ Venayagamoorthy G.K., Harley R.G., Wunsch D.C. Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System, IEEE Transactions on Neural Networks. — 2003. — Vol. 14, Issue 5. — P. 1047—1064.
↑ D’Emilia G., Marrab A., Natalea E. Use of neural networks for quick and accurate auto-tuning of PID controller // Robotics and Computer-Integrated Manufacturing. — 2007. — Vol. 23. — P. 170—179.
↑ Змеу К. В., Марков Н. А., Шипитько И. А., Ноткин Б. С. Безмодельное прогнозирующее инверсное нейроуправление с регенерируемым эталонным переходным процессом // Интеллектуальные системы. — 2009. — № 3. — С. 109—117.
↑ Кузнецов Б. И., Василец Т. Е., Варфоломеев А. А. Синтез нейроконтроллера с предсказанием для двухмассовой электромеханической системы //Электротехника и электромеханика. — 2008. — Т. 3. — С. 27 — 32.
↑ Д. А. Дзюба, А. Н. Чернодуб. Применение метода контролируемого возмущения для модификации нейроконтроллеров в реальном времени // Математические Машины и Системы. — 2010. — № 4. — С. 20 — 28.
↑ [Widrow B., Smith F.W. Pattern-recognizing control systems // Proceedings of Computer and Information Sciences. — Washington, USA — 1964. — Vol. 12. — P. 288—317.]
↑ Omidvar O., Elliott D.L. eds. Neural Systems for Control // Academic Press, New York, 1997. — 358 с.
↑ Ronco E. Incremental Polynomial Controller Networks: Two Self-Organising Non-Linear Controllers // Ph.D. Disseration Thesis, Glasgow, 1997. — 207 p.
↑ ¹ ² [Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения: пер. с англ. — М.: ИПРЖР, 2000. — 272 с.]
↑ ¹ ² Psaltis D., Sideris A., Yamamura A.A. A Multilayered Neural Network Controller // IEEE Control Systems Magazine — 1988. — Vol. 8, Issue 2. — P. 17 — 21.
↑ Werbos P. Backpropagation through time: what it does and how to do it // Proceedings of the IEEE. — October 1990. — Vol. 78, N. 10. — P. 1550—1560
↑ [Jordan M.I. and Rumelhart D.E. Forwardmodels: Supervised learning with a distal teacher // Cognitive Science — 1990. — Vol. 16. — P. 313—355.]
↑ ¹ ² [Narendra K.S., Parthasarathy K.K. Identification and control of dynamical systems using neural networks // IEEE Transactions on Neural Networks. — 1990. — N 1. — P. 4 — 27.]
↑ Venelinov Topalov, A. Kaynak. Online learning in adaptive neurocontrol schemes with a sliding mode algorithm // IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. — 2001. — V. 31. — I. 3. — P. 445—450
↑ ¹ ² Dias F.M., Mota A.M. Comparison between Different Control Strategies using Neural Networks // 9th Mediterranean Conference on Control and Automation. — Dubrovnik, Croatia, 2001.
↑ Widrow B., Adaptive Inverse Control // Proceedings of the 2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing — Lund, Sweden, July 1986. — P. 1 — 5.
↑ Widrow B., Plett G.L. Adaptive Inverse Control based on Linear and Nonlinear Adaptive Filtering // Proceedings of International Workshop on Neural Networks for Identification, Control, Robotics, and Signal/Image Processing — 21 23 Aug 1996, Venice, Italy. — P. 30 — 38.
↑ ¹ ² Hagan M.T., Demuth H.B. Neural networks for control // Proceedings of the American Control Conference. — San Diego, USA, 1999. — Vol. 3. — P. 1642—1656.
↑ [Rossiter J.A. Model-based Predictive Control: a Practical Approach // CRC Press, 2003. — 318 c.]
↑ [Takahashi Y. Adaptive Predictive Control of Nonlinear Time-Varying System using Neural Network // Proceedings of the IEEE International Conference on Neural Networks — Nagoya, Japan, 25 — 29 October, 1993. — Vol. 3. — P. 1464—1468.]
↑ Soloway D., Haley P.J. Neural Generalized Predictive Control // Proceedings of the IEEE International Symposium on Intelligent Control. — 15 — 18 September 1996. — P. 277—281.
↑ Prokhorov D. and Wunsch D. Adaptive Critic Designs // IEEE Transactions on Neural Networks. — 1997. — Vol. 8, N 5. — P. 997—1007.
↑ Venayagamoorthy G.K., Harley R.G., Wunsch D.C. Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System", IEEE Transactions on Neural Networks. — 2003. — Vol. 14, Issue 5. — P. 1047—1064.
↑ Ferrari S., Stengel R.F. Model-Based Adaptive Critic Designs // Learning and Approximated Dynamic Programming, J. Si, A. Barto, W. Powell, and D. Wunsch, Eds. New York: Wiley, 2004, Chapter. 3
↑ Редько В. Г., Прохоров Д. В. Нейросетевые адаптивные критики // VI Всероссийская научно-техническая конференция «Нейроинформатика-2004». Сборник научных трудов. Часть 2. М.: МИФИ, 2004. — C. 77 — 84.
↑ [D’Emilia G., Marrab A., Natalea E. Use of neural networks for quick and accurate auto-tuning of PID controller // Robotics and Computer-Integrated Manufacturing. — 2007. — Vol. 23. — P. 170—179.]
↑ [Saiful A., Omatu S. Neuromorphic self-tuning PID controller // Proceedings of IEEE International Conference on Neural Networks, San Francisco, USA, 1993. — P. 552—557.]

Ссылки

Литература

Сигеру Омату, Марзуки Халид, Рубия Юсоф Нейроуправление и его приложения = Neuro-Control and its Applications. — 2-е. — М.: ИПРЖР, 2000. — С. 272. — ISBN ISBN 5-93108-006-6
В. А. Терехов, Д. В. Ефимов, И. Ю. Тюкин Нейросетевые системы управления. — 1-е. — Высшая школа, 2002. — С. 184. — ISBN 5-06-004094-1
Хайкин С. Нейронные сети: полный курс = Neural Networks: A Comprehensive Foundation. — 2-е. — М.: «Вильямс», 2006. — С. 1104. — ISBN 0-13-273350-1
Omidvar O., Elliott D.L. eds. Neural Systems for Control. — New York: Academic Press, 1997. — С. 358. — ISBN 0-12-526430-5

Категории:

Интеллектуальная робототехника
Теория управления
Искусственные нейронные сети

Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное

Смотреть что такое "Нейроуправление" в других словарях:

Искусственная нейронная сеть — У этого термина существуют и другие значения, см. Нейронная сеть (значения). Схема простой нейросети. Зелёным цветом обозначены входные нейроны, голубым скрытые нейроны, жёлтым выходной нейрон … Википедия
Нейрокомпьютер — Фрэнк Розенблатт и «Марк 1» слева Нейрокомпьютер устройство переработки информации на основе принципов работы естественных нейронных систем … Википедия
Интеллектуальное управление — методы управления, которые используют различные подходы искусственного интеллекта, такие как искусственные нейронные сети, нечеткая логика, машинное обучение, эволюционные вычисления и генетические алгоритмы. Уровни интеллектуального управления… … Википедия

Словари и энциклопедии на Академике

Нейроуправление

Содержание