Управляемый случайный процесс

Управляемый случайный процесс
        случайный процесс, вероятностные характеристики которого можно изменять с помощью управляющих воздействий. Основная цель теории У. с. п. – отыскание оптимальных (или близких к ним) управлений, доставляющих экстремум заданному критерию качества. В простейшем случае управляемых марковских цепей одна из математических постановок задачи нахождения оптимального управления формулируется следующим образом. Пусть Xd = (xn,Pxd), n = 0, 1,..., – семейство однородных марковских цепей с конечным числом состояний Е = {0, 1, ..., N} и матрицами переходных вероятностей Pxy (d) = Pxd {x1 = у}, зависящих от параметра d, принадлежащего некоторому множеству управляющих воздействий D. Набор функций a = {а0 (x0), a1 (x0, x1),...} со значениями в D называют стратегией, а каждую из функций an = ап (х0,..., хп) – управлением в момент времени n. Каждой стратегии a отвечает управляемая марковская цепь Xa = (хп,Pxɑ), n = 0, 1,..., где
         Pxɑ (x0, x1..., хп) = δ(х0, х) Рх0х1 (a0 (x0))... Pxn-1xn (an-1(x0, x1,..., xn-1))
         Пусть:
         где функция f (d, х)0 и f (d,0) = 0 (если точка {0} является поглощающим состоянием и f (d, x) = I, d D, x = 1,..., N, то Va (x) есть матем. ожидание времени попадания из точки х в точку 0). Функцию
        
         называется ценой, а стратегию а* – оптимальной, если V (x) для всех х Е.
         При довольно общих предположениях о множестве D устанавливается, что цена V (x) удовлетворяет следующему уравнению оптимальности (уравнению Беллмана):
        
        ,
         где
        .
        .
         В классе всех стратегий наибольший интерес представляют т. н. однородные марковские стратегии, характеризуемые одной функцией а (х) такой, что an (x0,..., xn) = a (xn) при всех n = 0, 1,...
         Следовательно, критерий оптимальности (или достаточное условие оптимальности) может быть использован для проверки того, что данная однородная марковская стратегия является оптимальной: пусть существуют функции a* = а*(х) и V* = V*(x) такие, что для любого d D
         0 = f (x, a*(x)) + La*V*f (x, d) + LdV*(x)
         (Ld = Td – I, I – единичный оператор), тогда V* является ценой (V* = V) и стратегия α* = α*(х) является оптимальной.
         Лит.: Ховард Р.-А., Динамическое программирование и марковские процессы, пер. с англ., М. 1964.
         А. Н. Ширяев.

Большая советская энциклопедия. — М.: Советская энциклопедия. 1969—1978.

Игры ⚽ Нужен реферат?

Полезное


Смотреть что такое "Управляемый случайный процесс" в других словарях:

  • УПРАВЛЯЕМЫЙ СЛУЧАЙНЫЙ ПРОЦЕСС — случайный процесс, вероятностные характеристики к рого могут изменяться по ходу наблюдений в зависимости от поставленной цели, заключающейся в минимизации (максимизации) того или иного функционала, определяющего качество управления. Различают… …   Математическая энциклопедия

  • ПРОЦЕСС — (1) в материальном мире последовательная смена каких либо явлений, состояний и стадий развития материального мира (систем), в которых выражаются определённые объективные закономерности; изучают и используют на практике П.: (см.), (см.), (см.),… …   Большая политехническая энциклопедия

  • Математическая статистика —         раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой либо… …   Большая советская энциклопедия

  • Нейроуправление — (англ. Neurocontrol)  частный случай интеллектуального управления, использующий искусственные нейронные сети для решения задач управления динамическими объектами. Нейроуправление находится на стыке таких дисциплин, как искусственный… …   Википедия

  • Физика —         I. Предмет и структура физики          Ф. – наука, изучающая простейшие и вместе с тем наиболее общие закономерности явлений природы, свойства и строение материи и законы её движения. Поэтому понятия Ф. и сё законы лежат в основе всего… …   Большая советская энциклопедия

  • ГОСТ Р 50304-92: Системы для сопряжения радиоэлектронных средств интерфейсные. Термины и определения — Терминология ГОСТ Р 50304 92: Системы для сопряжения радиоэлектронных средств интерфейсные. Термины и определения оригинал документа: 75 абонент интерфейса: Радиоэлектронное средство, подключенное к интерфейсу для выдачи или приема информации… …   Словарь-справочник терминов нормативно-технической документации

  • Call of Duty: Black Ops II — Call of Duty: Black Ops 2 Разработчик …   Википедия

  • Ядерный взрыв — …   Википедия

  • ГОСТ 15895-77: Статистические методы управления качеством продукции. Термины и определения — Терминология ГОСТ 15895 77: Статистические методы управления качеством продукции. Термины и определения оригинал документа: 2.30. k я порядковая статистика x(k) Определения термина из разных документов: k я порядковая статистика 2.44.… …   Словарь-справочник терминов нормативно-технической документации

  • BitTorrent — Эта статья о протоколе. Статья о клиенте: BitTorrent (программа). BitTórrent (букв. англ.  «битовый поток»)  пиринговый (P2P) сетевой протокол для кооперативного обмена файлами через Интернет. Файлы передаются частями, каждый torrent… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»