Быстрый поиск

Военные игры. Игры преследования - (курсовая)

Дата добавления: март 2006г.

    Министерство образования, здравоохранения и культуры
    Республики Казахстан
    ВУЗ АВИЭК
    Кафедра ЭВМ
    Курсовая работа
    По дисциплине: “Теория принятия решений”
    Тема: “Военные игры. Игры преследования. ”
    Выполнил:
    Ст-т гр ЗПОС-96-1
    Гринев М. В.
    Принял:
    Доцент, к. ф. -м. н.
    Пшенин Е. С.
    Алматы 2000г.
    Введение.

Когда собака гонится за кроликом, то даже если она все время видит его, она не знает его дальнейшего поведения и может руководствоваться только знанием физических возможностей кролика и своих собственных. Таково своеобразие задачи преследования одного управляемого объекта другим управляемым объектом, математическому описанию которой посвящена данная работа. Конечно, здесь речь пойдет не о животных, а о технических объектах, но у этих объектов предполагается некоторая свобода действий, аналогичная свободе воли животных. Заранее нужно сказать, что рассматриваемые в работе технические объекты чрезвычайно элементарны, и весь вопрос ввиду его новизны находится на очень низком уровне развития. В работе рассматриваются игры, в которых участвуют два игрока: убегающий и преследующий. Такие игры преследования называются дифференциальными потому, что в них поведение обоих игроков описывается дифференциальными уравнениями.

Фазовые координаты и управления.

Типичными примерами дифференциальных игр являются сражения, воздушные бои, преследование судна торпедой, перехват самолета зенитной ракетой, охрана объектов. Если один из игроков выключается из игры, мы получаем обычную задачу максимизации. Она уже относится к вариационному исчислению и составляет основную часть теории управления.

Решения игроков всегда заключаются в выборе некоторых величин, называемых управлениями. Они в свою очередь определяют собой значения других величин – фазовых координат. Последние обладают тем свойством, сто знание их значений в любой момент времени полностью определяет течение игры.

Военные игры.

Фазовые координаты должны быть такими величинами, которые характеризуют положение дел в той мере, в какой по необходимости упрощенная модель задачи соответствует реальному процессу. Фазовыми координатами могут, в частности, быть число людей, самолетов, танков, судов; может оказаться целесообразным разделить их на группы по расположению в различных районах или по какому-либо другому признаку, например по удаленности от линии фронта и т. д. Пусть армия1 – “минимизирующая” - имеет в своем распоряжении управления……; соответственно армия2 – “максимизирующая”- имеет управления ………. Выбор управлений часто обусловлен обстоятельствами. Предположим, например, что платой является разница в живой силе (или снаряжении и т. п. ) в конце игры или в фиксированный момент времени Т. Пусть x1 – соответствующая координата I-той армии, тогда плата равна x2 – x1. Механизм развития подобной игры лучше всего продемонстрировать на конкретных примерах.

Пусть x1 –количество живой силы армии1 в некотором секторе; это количество может уменьшаться за счет воздушных налетов противника. Пусть x3 –число самолетов армии2 (противника), которые можно использовать для этой цели через. Черезy1 обозначим (

Представим, что армия1 получает пополнение с фиксированной скоростью r. Тогда имеем уравнение

X`1=r-cy1x3 +… (1)

Многоточие в правой части уравнения означает различные другие члены, как, например, изменения в результате других действий армии2 или маневрирования живой силой армии1. если игра полностью симметрична, то имеем такое же уравнение, только армии меняются ролями.

Пусть x4 –запас военного снаряжения армии1, который служит для ее снабжения. Пусть b максимальная скорость такого снабжения. Пустьj1 (0

При определении пространства состояний E мы будем требовать, чтобы выполнялось условие x4і0. тогда (2) представляет собой ограничение на использование этого запаса и дает игроку возможность распоряжаться этим запасом с учетом его ограниченности.

В левых частях уравнений (1) и (2) стоят обычные производные от координат по времени. Уравнения такого типа служат основным средством описания развития дифференциальной игры. Они называются уравнениями движения и имеют вид: X`м = fi(x1, …xn, ji, …, jn, yn…yn), I=1, …n (3)

Итак, скорость изменения фазовых координат является заданной функцией от фазовых координат и управлений обоих игроков.

Игры с движущимся объектом.

Возьмем в качестве примера движущегося объекта автомобиль и рассмотрим при этом уравнение движения, фазовые координаты, управления и различия между последними. Автомобиль выбран потому, что его свойства общеизвестны. Рассуждения можно применить, лишь с малыми изменениями, к любому движущемуся объекту. Летательные аппараты движутся в трехмерном пространстве, но принцип остается тот же. Геометрическое положение объекта, например автомобиля, описывается тремя фазовыми координатами: x1, x2 – декартовы координаты некоторой фиксированной точки автомобиля и x3 –угол, образуемый осью автомобиля с фиксированным направлением, например направлением x1. Предполагается, что движение происходит во всей плоскости x1, x2. Если автомобиль фигурирует в дифференциальной игре, то нужно знать о нем больше. Предположим, сто автомобиль управляется с помощью мотора и руля. Мотор управляет тангенциальным ускорением. Эта величина, находящаяся под контролем игрока, является управлением и будет обозначаться черезj1. Чтобы иметь простой и единообразный вид границ уравнений, мы примем ускорение равным Aj1. Здесь A – максимальное возможное ускорение, и управление j1 подчиняется теперь ограничению вида 0Јj1Ј1. Таким образом, оно является долей полного ускорения и находится под контролем водителя. Скорость x4не находится под непосредственным контролем водителя, но ее величину, как и величины x1, x2, x3, оба игрока должны принимать в расчет. Следовательно, она должна рассматриваться как фазовая координата.

Положение руля определяет кривизну траектории автомобиля. Но нереально считать, сто водитель может менять ее произвольно. Имеет смысл принять кривизну траектории автомобиля за еще одну фазовую координату x5(очевидно, физически это есть угол поворота передних колес), а долю скорости ее изменения - за управлениеj2 . Итак , если W – максимальная скорость изменения величины x5 , то скорость, выбираемая водителем, равна W j2, где -1 Ј j2 Ј1. В этих предположениях движение автомобиля будет определяться следующими уравнениями движения.

    x`1 = x4 cos x3 (1)
    x`2 = x4 sin x3, (2)
    x`3 = x4x5, (3)
    x`4 = A j1, 0Јj1Ј1 (4)
    x5 = W j2 , -1 Ј j2 Ј1 (5).

Здесь (1), (2) есть просто разложение скорости автомобиля по осям координат; (3) устанавливает, что скорость изменения направления равна скорости, умноженной на кривизну. Что касается (4), то скорость изменения скорости есть ускорение.

Резюмируя, можем сказать, что величины x1…x5описывают те свойства автомобиля, которые существенны при его участии, скажем, в игре преследования. Они называются фазовыми координатами. Водитель управляет с помощью величинj1 (положение педали газа) и j1(доля скорости вращения руля). Эти величины являются управлениями, и только они одни в каждый момент времени находятся под контролем игрока. Они, в отличие от фазовых координат, не могут быть изменены измерены противником. Данная модель имеет недостаток - неограниченная скорость. Это можно исправить, налагая ограничения на x4, но более естественно изменить само управление (4). Во-первых, утверждение, что сила, развиваемая мотором, пропорциональна величине, на которую отжата педаль газа, следует считать сверхупрощением динамики автомобиля. Во-вторых, самое важное, эта сила пропорциональна ускорению автомобиля, только если пренебрегать трением. Если предположить, что трение пропорционально скорости и направлено в противоположном направлении, то получим улучшенный вариант уравнения (4):

x`4 = F(A j1) – Kx4 .

Здесь A j1 (0 Ј j1 Ј1) – величина, на которую отжата педаль газа, F – результирующая сила (на единицу массы автомобиля), развиваемая мотором, а K – коэффициент трения. Тогда скорость будет ограничена величиной F(A)/K. Другая существенная поправка состоит в ограничении кривизны x5. Итак, уравнения движения можно усложнить для получения более точного соответствия с действительностью или упростить для облегчения математических выкладок.

Игры преследования.

Много примеров игр преследования можно привести из области военного дела: торпеда и корабль, корабль и подлодка, танк и джип и т. д.

Чтобы получить общую картину, будем обозначать преследователя через Р, а преследуемого через Е. Соответствующие движущиеся объекты могут управляться человеком или автоматически. В более сложных случаях участников игры может быть больше двух, например группа боевых самолетов противостоит эскадре вражеских бомбардировщиков или– уже из другой области –в футболе несколько нападающих играют с удерживающим мяч противником. В общем случае Р и Е - разумные противники с противоположными интересами. Но если каждый из них управляет лишь одним движущимся объектом, то символами Р и Е будут обозначаться сами эти объекты. Так, Р может быть некоторой фиксированной точкой преследующего объекта, например его геометрическим центром. Игра преследования обычно считается оконченной, когда произошел захват. Это означает, что расстояние РЕ стало меньше некоторой наперед заданной величины l.

Страницы: 1, 2