Реферат: Применение алгоритмов теории игр в экономических системах
Название: Применение алгоритмов теории игр в экономических системах Раздел: Рефераты по математике Тип: реферат | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН Северо-Казахстанский государственный университет им. М. Козыбаева Факультет Информационных Технологий Кафедра Информационные Системы ПОЯСНИТЕЛЬНАЯ ЗАПИСКА к курсовому проекту «Применение алгоритмов теории игр в экономических системах» 050703.DO.ИС-06-2 автор: Дьяченко О.Г. ______________ (фамилия, инициалы) (подпись, дата) РУКОВОДИТЕЛЬ: к. т. н., доцент __________ (степень, звание) (подпись, дата) Лаптева Е.В. (фамилия, инициалы) СОДЕРЖАНИЕ1.1Теория игр: определение, предмет, цели и задачи, применение. 7 1.2Основные понятия, используемые в теории игр. 11 1.5Матричные игры. Игры с нулевой суммой. Решение матричных игр в чистых стратегиях17 1.6Игры в смешанных стратегиях. 21 1.6.1Уменьшение порядка платёжной матрицы.. 21 1.6.2Понятие о матричных играх со смешанным расширением. 22 1.6.3Геометрический метод решения игр. 26 1.7Понятие о статистических играх. 27 1.7.1Критерий максимального математического ожидания выигрыша. 28 1.7.2Критерий недостаточного основания Лапласа. 29 1.7.3Максиминный критерий Вальда. 30 1.7.4Критерий минимаксного риска Сэвиджа. 31 1.7.5Критерий пессимизма-оптимизма Гурвица. 31 1.7.6Критерий Ходжа-Лемана. 32 2.1Пример 1. Решение матричной игры в чистых стратегиях. 34 2.2Пример 2. Решение матричной игры со смешанным расширением. 39 2.3Пример 3. Решение статистической игры.. 44 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.. 50
|
B1 | B2 | B3 | B4 | B5 | B6 | |
A1 | 1 | 2 | 3 | 4 | 4 | 7 |
A2 | 7 | 6 | 5 | 4 | 4 | 8 |
A3 | 1 | 8 | 2 | 3 | 3 | 6 |
A4 | 8 | 1 | 3 | 2 | 2 | 5 |
Стратегия A1 является доминируемой по отношению к стратегии A2, стратегия B6 является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.
Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной матрицы, называется ещё множеством Парето [17].
1.6.2 Понятие о матричных играх со смешанным расширением
Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.
Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.
Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.
При этом условии величина g называется ценой игры.
Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры v, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.
Игры, в которых выполняется строгое неравенство, называются не полностью определенными играми без седловой точки .
Пример такой игры, для которой α = -2 < 4 =βприведен на рисунке 1.4.
Рисунок 1.4 - Игра двух участников с нулевой суммой, не имеющая седловую точку
Расширим понятие стратегии за счет смешанных (или случайных) стратегий . Смешанная стратегия представляет собой вероятностную комбинацию чистых стратегий, т.е. ряд чистых стратегий, взятых в случайном порядке с некоторыми вероятностями.
Смешанные стратегии игроков 1 и 2 можно указать с помощью вектора вероятностей:
В теории игр доказано, что любая парная конечная игра с нулевой суммой имеет, по крайней мере, одно решение в смешанных стратегиях. Таким образом, каждая конечная игра имеет цену - g - средний выигрыш, приходящийся на одну партию, удовлетворяющий условию:
Решить игру – найти цену игры и оптимальные стратегии.
Игра mn, (где m³3, n³3) заданную платежной матрицей А:
Пусть платежная матрица не содержит седловой точки, т.е. игра решается в смешанных стратегиях: .
Применение игроком 1 оптимальной смешанной стратегии S1 * гарантирует ему средний выигрыш не меньше цены игры g независимо от поведения игрока 2(gj ≥ g).
Игрок 2, применяя оптимальную смешанную стратегию S2
*
, гарантирует для себя минимальный проигрыш (gI
g).
Учитывая данное условие, задачу линейного программирования можно записать следующим образом:
1) для игрока 1:
(4)
2) для игрока 2:
(5)
Смысл этих систем уравнений заключается в следующем: игрок 1 стремится увеличить цену игры (g→max), т.е. он действует так, чтобы его средний выигрыш при использовании его стратегии с вероятностями рi для любой j-й стратегии игрока 2 был не меньше величины g, которую он стремится увеличить. Игрок 2 стремится уменьшить свой проигрыш (g→min), т.е. он действует так, чтобы его средний проигрыш при использовании его стратегий с вероятностями qj при любой i-й стратегии игрока 1 не превышал величину g, которую он стремиться уменьшить.
Разделив левую и правую часть неравенств (4) и (5) на цену игры g > 0 и обозначив
(6)
получим уравнения (7) и (8) в следующем виде:
(7)
. (8)
Из равенств и выражений (6) следует, что переменные (xi
) и (yj
) удовлетворяют условиям:
. Таким образом, цена игры определяется как:
.
Оптимальные стратегии определяются как:
.
Теорема: Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры γ, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных (оптимальных смешанных) стратегий [15].
1.6.3 Геометрический метод решения игр
Графический метод решения игр выполняется по шагам:
1) В системе координат XOY по оси абсцисс (ОХ) откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка Х=0) соответствует стратегии А1 , правый (точка Х=1) – стратегии А2 . Промежуточные точки Х соответствуют некоторым смешанным стратегиям S1 =(p1 , p2 ).
2) По оси ординат (OY) откладываются выигрыши при стратегии А1 . На линии, параллельной оси ординат, в точке 1 откладываются выигрыши при стратегии А2 .
Пусть имеется игра с платежной матрицей: .
Если игрок 2 применяет стратегию В1 , то выигрыш игрока 1 при использовании чистых стратегий А1 и А2 составляет соответственно 0,4 и 0,6. Соединим эти точки прямой В1 В1 .
Ордината любой точки отрезка В1 В1 равна величине выигрыша игрока 1 при принятии им стратегии А1 и А2 с соответствующими вероятностями р1 и р2 .
Аналогично прямая В2 В2 соответствует стратегии игрока 2. Точка пересечения В1 В1 и В2 В2 определяет цену игры γ. Ординаты точек В2 В2 равны среднему стратегий А1 и А2 с вероятностями р1 и р2 .
Ломаная В1 NB2 – нижняя граница выигрыша, получаемая игроком 1. В точке N он максимален.
Таким образом, оптимальная стратегия первого игрока: S1 * =(0,375; 0,625); цена игры (максимальный выигрыш) γ =55% [18].
Рисунок 1.5 – Графическая интерпретация решения игры
1.7 Понятие о статистических играх
Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.
Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой». Игрок в этой игре называется лицом, принимающим решение (ЛПР).
В общем виде платёжная матрица статистической игры приведена в таблице 2.
Таблица 2
Общий вид платёжной матрицы статистической игры
S1 | S2 | … | Sn | |
A1 | A11 | A12 | … | A1n |
A2 | A21 | A22 | … | A2n.. |
… | … | … | … | … |
An | Am1 | Am2 | … | Amn |
В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj ) – состояния окружающей среды.
ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи. Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Ai ) приписывается некоторый результат Wi , характеризующий все последствия этого решения. Из массива результатов принятия решений ЛПРвыбирает элемент W, который наилучшим образом отражает мотивацию его поведения [17].
1.7.1 Критерий максимального математического ожидания выигрыша
Критерий максимального математического ожидания выигрыша применяется в тех случаях, когда ЛПР известны вероятности состояний окружающей среды. Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:
(9)
где pj –вероятность j-го состояния окружающей среды.
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально: W = maxWi
Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая:
1. ЛПР известны вероятности всех состояний окружающей среды;
2. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.
Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия.
1.7.2 Критерий недостаточного основания Лапласа
Данный критерий используется при наличии неполной информации о вероятностях состояний окружающей среды в задаче принятия решения. Вероятности состояний окружающей среды принимаются равными и по каждой стратегии ЛПР в платёжной матрице определяется, таким образом, среднее значение выигрыша:
. (10)
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально: W = maxWi .
Использование данного критерия оправдано в следующей ситуации:
1. ЛПР не имеет информации, либо имеет неполную информацию о вероятностях состояний окружающей среды;
2. Вероятности состояний окружающей среды близки по своим значениям;
3. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.
1.7.3 Максиминный критерий Вальда
Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:
Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР:
Wi = minj a ij . (11)
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально: W = maxWi .
Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется.
Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:
1. О возможности появления состояний окружающей среды ничего не известно;
2. Решение реализуется только один раз;
3. Необходимо исключить какой бы то ни было риск.
1.7.4 Критерий минимаксного риска Сэвиджа
Величина (a max j – a ij ), где a max j - максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии. Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией.
На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска.
Для определения оптимальной стратегии по данному критерию на основе платёжной матрицы рассчитывается матрица рисков, каждый коэффициент которой (rij ) определяется по формуле: rij = a max j – a ij . Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий ЛПР: Ri = maxj rij .
Оптимальной по данному критерию считается та стратегия, в которой значение Ri минимально: W = minRi .
Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ-критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша.
1.7.5 Критерий пессимизма-оптимизма Гурвица
В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска. Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале [0, 1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма. Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях.
Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:
Wi = C×minj a ij + (1-C) ×maxj a ij , (12)
где C – коэффициент пессимизма.
Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально: W = maxWi .
При С =1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”, делающего ставку на то, что «выпадет» наилучший случай.
Критерий Гурвица применяется в ситуации, когда :
1. Информация о состояниях окружающей среды отсутствует или недостоверна;
2. Необходимо считаться с появлением каждого состояния окружающей среды;
3. Реализуется только малое количество решений;
4. Допускается некоторый риск.
Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале [0, 1]. Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае – ММ-критерий
Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле:
, (13)
где u – параметр достоверности информации о вероятностях состояний окружающей среды.
Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально: W = maxWi .
Данный критерий применим в следующем случае:
1. Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;
2. Принятое решение теоретически допускает бесконечно много реализаций;
3. При малом числе реализации допускается некоторый риск [17].
2 ПРОЕКТНАЯ ЧАСТЬ
Решать задачи теории игр можно в таких программных средах, как Tora, Per, Excel, LINDO61, LINGO8. Следующие рассматриваемые примеры будут частично решаться в средах MicrosoftExcel, Tora.
MSExcel удобен тем, что он установлен на любом компьютере, всем знаком и прост в применении. А программная система оптимизации Tora является самодостаточной системой в том смысле, что все инструкции и пояснения, необходимые для работы с этой программой, заключены в названиях пунктов меню, командных кнопок, опций и других элементов управления. Tora может работать только с разрешением экрана 800×600 или 1024×768 пикселей.
2.1 Пример 1. Решение матричной игры в чистых стратегиях
Пример решения матричной игры в чистых стратегиях, в условиях реальной экономики, в ситуации борьбы двух предприятий за рынок продукции региона
Задание:
Два предприятия производят продукцию и поставляют её на рынок региона. Они являются единственными поставщиками продукции в регион, поэтому полностью определяют рынок данной продукции в регионе.
Каждое из предприятий имеет возможность производить продукцию с применением одной из трёх различных технологий.
В зависимости от качества продукции, произведённой по каждой технологии, предприятия могут установить цену единицы продукции на уровне 10, 6 и 2 денежных единиц соответственно.
При этом предприятия имеют различные затраты на производство единицы продукции (см. таблицу 3).
Таблица 3
Затраты на единицу продукции, произведенной на предприятиях региона (д.е.).
Технология | Цена реализации единицы продукции, д.е. | Полная себестоимость единицы продукции, д.е. | |
Предприятие 1 | Предприятие 2 | ||
I | 10 | 5 | 8 |
II | 6 | 3 | 4 |
III | 2 | 1.5 | 1 |
В результате маркетингового исследования рынка продукции региона была определена функция спроса на продукцию: Y = 6 – 0.5.
Данные о спросе на продукцию в зависимости от цен реализации приведены в таблице 4.
Таблица 4
Спрос на продукцию в регионе, тыс. ед.
Цена реализации 1 ед. продукции, д.е. | Средняя цена реализации 1 ед. продукции, д.е. | Спрос на продукцию, тыс. ед. | |
Предприятие 1 | Предприятие 2 | ||
10 | 10 | 10 | 1 |
10 | 6 | 8 | 2 |
10 | 2 | 6 | 3 |
6 | 10 | 8 | 2 |
6 | 6 | 6 | 3 |
6 | 2 | 4 | 4 |
2 | 10 | 6 | 3 |
2 | 6 | 4 | 4 |
2 | 2 | 2 | 5 |
Значения Долей продукции предприятия 1, приобретенной населением, зависят от соотношения цен на продукцию предприятия 1 и предприятия 2. В результате маркетингового исследования эта зависимость установлена и значения вычислены (см. таблицу 5).
Таблица 5
Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е. | Доля продукции предприятия 1, купленной населением | |
Предприятие 1 | Предприятие 2 | |
10 | 10 | 0,31 |
10 | 6 | 0,33 |
10 | 2 | 0,18 |
6 | 10 | 0,7 |
6 | 6 | 0,3 |
6 | 2 | 0,2 |
2 | 10 | 0,92 |
2 | 6 | 0,85 |
2 | 2 | 0,72 |
По условию задачи на рынке региона действует только 2 предприятия. Поэтому долю продукции второго предприятия, приобретённой населением, в зависимости от соотношения цен на продукцию можно определить как единица минус доля первого предприятия.
Стратегиями предприятий в данной задаче являются их решения относительно технологий производства продукции. Эти решения определяют себестоимость и цену реализации единицы продукции. В задаче необходимо определить:
1. Существует ли в данной задаче ситуация равновесия при выборе технологий производства продукции обоими предприятиями?
2. Существуют ли технологии, которые предприятия заведомо не будут выбирать вследствие невыгодности?
3. Сколько продукции будет реализовано в ситуации равновесия? Какое предприятие окажется в выигрышном положении?
Решение задачи
1. Определим экономический смысл коэффициентов выигрышей в платёжной матрице задачи. Каждое предприятие стремится к максимизации прибыли от производства продукции. Но кроме того, в данном случае предприятия ведут борьбу за рынок продукции в регионе. При этом выигрыш одного предприятия означает проигрыш другого. Такая задача может быть сведена к матричной игре с нулевой суммой. При этом коэффициентами выигрышей будут значения разницы прибыли предприятия 1 и предприятия 2 от производства продукции. В случае, если эта разница положительна, выигрывает предприятие 1, а в случае, если она отрицательна – предприятие 2.
2. Рассчитаем коэффициенты выигрышей платёжной матрицы. Для этого необходимо определить значения прибыли предприятия 1 и предприятия 2 от производства продукции. Прибыль предприятия в данной задаче зависит:
· от цены и себестоимости продукции;
· от количества продукции, приобретаемой населением региона;
· от доли продукции, приобретённой населением у предприятия.
Таким образом, значения разницы прибыли предприятий, соответствующие коэффициентам платёжной матрицы, необходимо определить по формуле (16):
D = p×(S×R1-S×C1) – (1-p) ×(S×R2-S×C2), (14),
где в – значение разницы прибыли от производства продукции предприятия 1 и предприятия 2;
p - доля продукции предприятия 1, приобретаемой населением региона;
S – количество продукции, приобретаемой населением региона;
R1 и R2 - цены реализации единицы продукции предприятиями 1 и 2;
C1 и C2 – полная себестоимость единицы продукции, произведённой на предприятиях 1 и 2.
Количество продукции, которое население региона приобретёт при средней цене 4 д.е., равно 4 тыс. ед. (см. таблицу 4). Доля продукции, которую население приобретёт у предприятия 1, составит 0,85, а у предприятия 2 – 0,15 (см. таблицу 5). Вычислим коэффициент платёжной матрицы a 32 по формуле (16):
a 32 = 0,85×(4×2-4×1,5) – 0,15×(4×6-4×4) = 0,5 тыс. ед.,
где i=3 – номер технологии первого предприятия, а j=2 – номер технологии второго предприятия.
Аналогично вычислим все коэффициенты платёжной матрицы. В платёжной матрице стратегии A1 – A3 – представляют собой решения о технологиях производства продукции предприятием 1, стратегии B1 – B3 – решения о технологиях производства продукции предприятием 2, коэффициенты выигрышей – разницу прибыли предприятия 1 и предприятия 2.
Таблица 6
Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».
B1 | B2 | B3 | Minj | |
A1 | 0,17 | 0,62 | 0,24 | 0,17 |
A2 | 3 | - 1,5 | - 0,8 | - 1,5 |
A3 | 0,9 | 0,5 | 0,4 | 0,4 |
Maxi | 3 | 0,62 | 0,4 |
В данной матрице нет ни доминируемых, ни дублирующих стратегий. Это значит, что для обоих предприятий нет заведомо невыгодных технологий производства продукции. Определим минимальные элементы строк матрицы. Для предприятия 1 каждый из этих элементов имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Минимальные элементы матрицы по строкам имеют значения: 0,17, -1,5, 0,4.
Определим максимальные элементы столбцов матрицы. Для предприятия 2 каждый из этих элементов также имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Максимальные элементы матрицы по столбцам имеют значения: 3, 0,62, 0,4.
Нижняя цена игры в матрице равна 0,4. Верхняя цена игры также равна 0,4. Таким образом, нижняя и верхняя цена игры в матрице совпадают. Это значит, что имеется технология производства продукции, которая является оптимальной для обоих предприятий в условиях данной задачи. Эта технология III, которая соответствует стратегиям A3 предприятия 1 и B3 предприятия 2. Стратегии A3 и B3 – чистые оптимальные стратегии в данной задаче.
Значение разницы прибыли предприятия 1 и предприятия 2 при выборе чистой оптимальной стратегии положительно. Это означает, что предприятие 1 выиграет в данной игре. Выигрыш предприятия 1 составит 0,4 тыс. д.е. При этом на рынке будет реализовано 5 тыс. ед. продукции (реализация равна спросу на продукцию, таблица 4). Оба предприятия установят цену за единицу продукции в 2 д.е. При этом для первого предприятия полная себестоимость единицы продукции составит 1,5 д.е., а для второго – 1 д.е (см. таблицу 3). Предприятие 1 окажется в выигрыше лишь за счёт высокой доли продукции, которую приобретёт у него население.
2.2 Пример 2. Решение матричной игры со смешанным расширением
Пример решения матричной игры со смешанным расширением. Платёжную матрицу игры составим на основе исходных данных задачи, решённой при выполнении занятия 3, заменив лишь значения долей продукции предприятия 1, приобретаемой населением в зависимости от соотношений цен (см. таблицу 7).
Таблица 7
Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е. | Доля продукции предприятия 1, купленной населением | |
Предп. 1 | Предп. 2 | |
10 | 10 | 0,31 |
10 | 6 | 0,33 |
10 | 2 | 0,18 |
6 | 10 | 0,7 |
6 | 6 | 0,3 |
6 | 2 | 0,2 |
2 | 10 | 0,9 |
2 | 6 | 0,85 |
2 | 2 | 0,69 |
Применив к исходным данным задачи формулу (16) определения разницы прибыли от производства продукции, получим следующую платёжную матрицу
Таблица 8
Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».
B1 | B2 | B3 | minj | |
A1 | 0,17 | 0,62 | 0,24 | 0.17 |
A2 | 3 | -1,5 | -0,8 | -1.5 |
A3 | 0,75 | 0,5 | 0,175 | 0,175 |
maxi | 3 | 0.62 | 0.24 |
В данной матрице (см. таблицу 8) нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию.
Решение задачи
1. В данной матрице имеются отрицательные коэффициенты. Для соблюдения условия неотрицательности в задачах линейного программирования прибавим к каждому коэффициенту матрицы модуль минимального отрицательного коэффициента. В данной задаче к каждому коэффициенту матрицы необходимо прибавить число 1,5 – значение модуля наименьшего отрицательного элемента матрицы. Получим платёжную матрицу (см. таблицу 9).
Таблица 9
Платёжная матрица, преобразованная для выполнения условия неотрицательности
B1 | B2 | B3 | |
A1 | 1,67 | 2,12 | 1,74 |
A2 | 4,5 | 0 | 0,7 |
A3 | 2,25 | 2 | 1,675 |
2. Опишем задачу линейного программирования для каждого игрока в виде системы линейных неравенств:
Для игрока 1:
1,67×x1 + 4,5×x2 + 2,25×x3 ³ 1
2,12×x1 + 0×x2 + 2×x3 ³ 1
1,74×x1 + 0,7×x2 + 1,675×x3 ³ 1
x1³ 0; x2³ 0; x3³ 0
min Z = x1 + x2 + x3
Для игрока 2:
1,67×y1 + 2,12×y2 + 1,74×y3 £ 1
4,5×y1 + 0×y2 + 0,7×y3 £ 1
2,25×y1 + 2×y2 + 1,675×y3 £ 1
y1³ 0; y2³ 0; y3³ 0
max Z = y1 + y2 + y3
3. Решим обе задачи с использованием Excel:
Рисунок 2.2 – Поиск решения для первого игрока.
Аналогично для 2 игрока:
Рисунок 2.3 – Поиск решения для 2 игрока
В результате решения задачи получим следующие значения целевой функции и переменных: Z = 0,5771, γ* = 1/0,5771 = 1,7328; x1 = 0,5144, x2 = 0, x3 = 0,0626; y1 = 0,0582, y3 = 0,5189.
4. Для определения значений вероятностей выбора стратегий игроков 1 и 2 умножим значения переменных на γ*. P1 = x1×γ* = 0,8914, p2 =0, p3 = x3×γ* = 0,1083: q1 = y1×γ* = 0,1008, q2 = 0, q3 = y3×γ* = 0,8991.
5. Определим значение цены игры. Для этого из величины γ* вычтем 1,5 (значение модуля наименьшего отрицательного элемента) γ = 1,7328 - 1,5 = 0,2328.
Проверим правильность решения задачи с помощью программы Tora:
Рисунок 2.4 – Решение задачи в Tora.
Таким образом, в данной игре выиграет предприятие 1 (значение γ > 0). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с вероятностью 0,8914, а технологию 3 – с вероятностью 0,1083. Предприятие 2, соответственно, должно выбирать технологию 1 с вероятностью 0,1008, а технологию 3 – с вероятностью 0,8991. Значение математического ожидания выигрыша предприятия 1 составит 0,2328 тыс. д.е.
2.3 Пример 3. Решение статистической игры
Рассмотрим пример решения статистической игры в экономической задаче.
Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации – с осени до начала лета следующего года. Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации:
A1 - реализовать всю капусту осенью, непосредственно после уборки;
A2 - заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев;
A3 – заложить всю капусту на хранение и реализовать её в весенние месяцы.
Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц.
На региональном рынке капусты может сложиться одна из следующих трёх ситуаций:
S1 - поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта;
S2 - в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен – в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации;
S3 - в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной. Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются.Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 10.
Таблица 10
Выручка от реализации капусты, тыс. д.е.
Стратегии хозяйства | Выручка от реализации капусты, тыс. д.е. | ||
S1 | S2 | S3 | |
A1 | 30 | 25 | 22 |
A2 | 30 | 40 | 33 |
A3 | 30 | 40 | 60 |
В задаче необходимо определить:
1. Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно;
2. Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо:
а) получить минимально гарантированный выигрыш;
б) учесть значения риска от принятия различных решений;
в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3;
3. Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7.
Решение
1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (см. таблицу 11).
Таблица 11
Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты
S1 | S2 | S3 | |
A1 | 10 | 5 | 2 |
A2 | 0 | 10 | 3 |
A3 | -10 | 0 | 20 |
3. Определим наиболее выгодную стратегию по критерию максимального математического ожидания выигрыша:
W1 = 10×0,3 + 5×0,6 + 2×0,1 = 6,2
W2 = 0×0,3 + 10×0,6 + 3×0,1 = 6,3
W3 = -10×0,3 + 0×0,6 + 20×0,1 = -1
Таблица 12
Определение оптимальной стратегии в статистической игре по критерию максимального математического ожидания
S1 | S2 | S3 | Wi | |
Pj | 0,3 | 0,6 | 0,1 | |
A1 | 10 | 5 | 2 | 6.2 |
A2 | 0 | 10 | 3 | 6.3 |
A3 | -10 | 0 | 20 | -1 |
Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 (W = 6,3) (см. таблицу 12).
3. Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма.
Таблица 13
Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма
S1 | S2 | S3 | Wi (ММ) | Wi (НО) | Wi (ПО) | |
A1 | 10 | 5 | 2 | 2 | 5,67 | 7,6 |
A2 | 0 | 10 | 3 | 0 | 4,33 | 7 |
A3 | -10 | 0 | 20 | -10 | 3,33 | 11 |
Значения Wi для ММ-критерия:
W1 = min (10, 5, 2) = 2
W2 = min (0, 10, 3) = 0
W3 = min (-10, 0 20) =-10
W = maxWi = W1
Оптимальной стратегией по максиминному критерию является стратегия A1 (W = 2). Определим оптимальную стратегию по критерию недостаточного основания Лапласа. По данному критерию оптимальной является стратегия A1 (W = 5,67).
По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 – стратегия A3 (W = 11).
4. Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (см. таблицу 14).
Таблица 14
Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков
S1 | S2 | S3 | Ri | |
A1 | 0 | 5 | 18 | 18 |
A2 | 10 | 0 | 17 | 17 |
A3 | 20 | 10 | 20 | 20 |
Оптимальной стратегией по критерию минимаксного риска является стратегия A2 (W = 17).
6. Определим наиболее выгодную стратегию предприятия по критерию Ходжа-Лемана (см. таблицу 15).
Таблица 15
Определение оптимальной стратегии в статистической игре по критерию Ходжа-Лемана
S1 | S2 | S3 | Wi | |
Pj | 0,3 | 0,6 | 0,1 | |
A1 | 10 | 5 | 2 | 4,94 |
A2 | 0 | 10 | 3 | 4,41 |
A3 | -10 | 0 | 20 | -3,7 |
По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 (W = 4,94).
ЗАКЛЮЧЕНИЕ
Задачи, в которых возникают ситуации, где важную роль играют конфликты и совместные действия можно решать с помощью теории игр.
Решение задачи заключается в том, как должен вести себя разумный игрок в конфликте с разумным противником, чтобы обеспечить себе в среднем наибольший возможный выигрыш.
Для правильного применения теории игр в решении задач нужно знать основные понятия теории игр, их классификацию, уметь делать правильную постановку задачи с позиции теории игр и осуществлять их решение.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. http://www.spbgid.ruindex.phpnews=125958 актуальна на 15.11.2008.
2. Оуэн Г. Теория игр.- М.:Мир, 1971.- 230с.
3. Воробьев Н.Н. Теория игр для экономистов-кибернетиков. – М.: Наука, Главная редакция физико-математической литературы, 1985. – 272 с.
4. Вентцель Е.С. Элементы теории игр. – М.: Наука, 1961. – 67 с.
5. http://pasadvice.narod.ru/stat/teorigr.htm актуальна на 29.10.2008.
6. Балдин К.В., Воробьев С.Н., Уткин В.Б. Управленческие решения. - М.: Издательство – торговая корпорация «Дашков и Кͦ», 2006. - 496 с.
7. http://www.12manage.com/methods_game_theory_ru.html актуальна на 14.11.2008.
8. http://www.ecsocman.edu.ru/db/msg/54933.html актуальна на 3.11.2008.
9. Мулен Э. Теория игр с примерами из математической экономики: Пер с франц.- М.: Мир, 1985.-200 с.
10.Воробьев Н.Н. Теория игр. – М.: Наука, 1976. – 64 с.
11.Васин А.А., Морозов В.В. Введение в теорию игр с приложениями к экономике. – М.: 2003. – 278 с.
12.Интрилигатор М. Математические методы оптимизации и экономическая теория. - М.: Айрис – пресс, 2002. - 576 с.
13.http://ru.wikipedia.org/wiki/ актуальна на 11.11.2008.
14.Волков И.К., Загоруйко Е.А. Исследование операций. - М.: Издательство МГТУ им. Н.Э. Баумана, 2000. - 436 с.
15.Харина О.Ю. Методическое пособие для студентов экономических специальностей г Петропавловск, 2005. - 85с.
16.Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. – М.: Наука, 1984. – 495 с.
17.Лапшин К.А. Игровые модели и принятие решений. - М.: Москва, 2001. 45 с.
18.Таха, Хемди А. Введение в исследование операций. - М.: Издательский дом «Вильямс», 2005. – 912 с.
19.Шевчук Е.В., Касимов И.Р. Методическое пособие по выполнению курсовых проектов и работ: учебно-методическое пособие. Петропавловск: СКГУ им. М. Козыбаева, 2007. – 30 с.
20.Шинтемирова А.У., Морозова О.В. Инструкции по выполнению письменных работ студентами бакалавриата. - Петропавловск: СКГУ им. М. Козыбаева, 2006. – 60 с.