Статистические игры
Лекция № 3
Статистические игры
План лекции
- Особенности принятия решений в условиях неопределённости. Построение матрицы игры и матрицы рисков.
- Критерии принятия решений.
- Критерий Байеса.
- Критерий Лапласа
- Критерий Вальда.
- Критерий Сэвиджа.
- Критерий Гурвица.
1. Экономика и бизнес связаны с принятием решений в условиях неопределенности, т.е. отсутствия необходимой для обоснованного принятия решения информации.
Источники неопределённости:
- Нестабильность экономической и политической ситуации;
- Неопределённость действий партнёров по бизнесу;
- Недостаточная информация о спросе на товары и услуги
- Неизвестное качество сырья;
- Погодные и климатические условия и т.д.
Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся.
Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует с окружающей средой.
Отличительная особенность таких игр состоит в том, что в ней сознательно действует только один из участников. Объективно окружающая среда против игрока не действует. Она принимает одно из нескольких возможных состояний.
Методы принятия решений в играх с природой зависят от характера от того, известны или нет вероятности состояний окружающей среды, которую иногда называют «природа».
- Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределенности состояния окружающей среды, называется статистической игрой или игрой с природой.
- Сознательного игрока в таких играх называют ЛРП (лицо, принимающее решения).
Рассмотрим организацию и аналитическое представление игры с природой. Пусть сознательный игрок имеет m возможных стратегий: A1, A2, …, Am.
У «природы» имеется n возможных состояний (стратегий): П1, П2, …, Пn.
Тогда условия «игры с природой» задаются матрицей A выигрышей игрока:
Таблица 1
П1 |
П2 |
П3 |
…. |
Пn |
|
A1 |
a11 |
a12 |
a13 |
… |
a1n |
A2 |
a21 |
a22 |
a23 |
… |
a2n |
… |
… |
… |
… |
… |
… |
Am |
am1 |
am2 |
am3 |
… |
amn |
В некоторых случаях элементы этой матрицы могут рассматриваться как затраты (потери).
Другой способ задания матрицы игры с природой: в виде так называемой матрицы рисков
В данном случае величина риска это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей A.
- Риском игрока при использовании им стратегии и при состоянии «природы» называется разность между максимально возможным выигрышем при данном состоянии «природы» и выигрышем, который игрок получит реально, не имея этой информации.
(1)
Если элементы матрицы А потери, то
(2)
Пример 1. Транспортное предприятие должно определить уровень своих производственных возможностей так, чтобы удовлетворить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги неизвестен, но прогнозируется, что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует наилучший уровень провозных возможностей транспортного предприятия. Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения провозных возможностей над спросом (из-за простоя подвижного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Возможные прогнозируемые затраты на развитие провозных возможностей представлены в табл. 2. Необходимо выбрать оптимальную стратегию развития предприятия.
Таблица 2
Варианты возможностей развития транспортного предприятия |
Варианты спроса на транспортные услуги |
|||
1 |
2 |
3 |
4 |
|
1 |
6 |
12 |
20 |
24 |
2 |
9 |
7 |
9 |
28 |
3 |
23 |
18 |
15 |
19 |
4 |
27 |
24 |
21 |
15 |
Решение
Имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: П1, П2, П3, П4. Известны также четыре стратегии развития транспортного предприятия: А1, А2, А3, А4. Затраты на развитие при каждой паре Пj и Аi заданы следующей матрицей (Таблица 3).
Таблица 3
П1 |
П2 |
П3 |
П4 |
|
A1 |
6 |
12 |
20 |
24 |
A2 |
9 |
7 |
9 |
28 |
A3 |
23 |
18 |
15 |
19 |
A4 |
27 |
24 |
21 |
15 |
6 |
7 |
9 |
15 |
Построим матрицу рисков. В данном примере представляют затраты, т.е. потери, значит для построения матрицы рисков используется (4). Обозначим
Матрица рисков имеет следующий вид (таблица 4).
Таблица 4
R |
П1 |
П2 |
П3 |
П4 |
A1 |
0 |
5 |
11 |
9 |
A2 |
3 |
0 |
0 |
13 |
A3 |
17 |
11 |
6 |
4 |
A4 |
21 |
17 |
12 |
0 |
2. Результат решения задачи ЛПР определяет по одному из критериев принятия решений. Различают две группы критериев принятия решений в «играх с природой»:
- Критерии принятии решений в условиях риска, когда известны вероятности, с которыми природа принимает каждое из возможных состояний
- Критерий о принятии решений в условиях неопределенности, когда нет возможности получить информацию о вероятностях появления состояний природы.
2.1. Критерий Байеса
БАЙЕС ТОМАС
1702 1761
английский математик
Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:
(3)
где вероятность - го состояния природы.
Оптимальной по данному критерию считается та стратегия, при выборе которой значение математического ожидания выигрыша максимально.
(4)
Если элементы матрицы представляют собой затраты, то оптимальной по данному критерию считается та стратегия, при выборе которой значение математического ожидания затрат минимально
(5)
Продолжение примера 1.
Будем считать известными состояния спроса на услуги предприятия (таблица 5).
Таблица 5
П1 |
П2 |
П3 |
П4 |
||
A1 |
6 |
12 |
20 |
24 |
16,2 |
A2 |
9 |
7 |
9 |
28 |
12 |
A3 |
23 |
18 |
15 |
19 |
17,8 |
A4 |
27 |
24 |
21 |
15 |
21,6 |
qj |
0,1 |
0,4 |
0,3 |
0,2 |
Оптимальной по критерию Байеса является вторая стратегия развития предприятия.
- Показателем неэффективности стратегии Ai по критерию Байеса относительно рисков называется средне взвешенное значение риска в i-ой строке:
(6)
Оптимальной по критерию Бейса в игре относительно рисков является стратегия Ai, показатель неэффективности которой минимальный
(7)
Продолжение примера 1.
Таблица 6
R |
П1 |
П2 |
П3 |
П4 |
|
A1 |
0 |
5 |
11 |
9 |
7,1 |
A2 |
3 |
0 |
0 |
13 |
2,9 |
A3 |
17 |
11 |
6 |
4 |
8,7 |
A4 |
21 |
17 |
12 |
0 |
12,5 |
qj |
0,1 |
0,4 |
0,3 |
0,2 |
.
Оптимальной по критерию Байеса для рисков является вторая стратегия развития предприятия.
2.2. Критерий Лапласа
ПЬЕР - СИМОН ЛАПЛАС
1749 1827
французский математик и астроном
Вероятности состояний окружающей среды принимаются равными, и по каждой стратегии в платёжной матрице определяется, таким образом, среднее значение выигрыша или затрат:
(8)
Оптимальной по данному критерию считается та стратегия при выборе которой значение среднего выигрыша максимально (значение среднего проигрыша минимально):
(9)
(10)
В нашем примере
Таблица 7
П1 |
П2 |
П3 |
П4 |
||
A1 |
6 |
12 |
20 |
24 |
15,5 |
A2 |
9 |
7 |
9 |
28 |
13,25 |
A3 |
23 |
18 |
15 |
19 |
18,75 |
A4 |
27 |
24 |
21 |
15 |
21,75 |
Оптимальной по критерию Лапласа является вторая стратегия развития предприятия.
2.3 Критерий Вальда
ВАЛЬД АБРАХАМ
1902 1950
венгерский математик, статистик
С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник.
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.
Платёжная матрица дополняется столбцом, каждый которого представляет собой минимальное значение выигрыша в соответствующей стратегии ( или максимальное значение проигрыша):
Выбирается решение, для которого достигается значение
. (11)
максиминный критерий.
Если в исходной матрице по условию задачи результат aij представляет выигрыш лица, принимающего решение, то выбирается стратегия, для которого достигается значение
(12)
минимаксный критерий.
Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать критерий одним из фундаментальных.
Применение этого критерия оправдано, если решение реализуется только один раз и необходимо исключить какой бы то ни было риск.
Продолжение примера 1.
Таблица 8
П1 |
П2 |
П3 |
П4 |
||
A1 |
6 |
12 |
20 |
24 |
24 |
A2 |
9 |
7 |
9 |
28 |
28 |
A3 |
23 |
18 |
15 |
19 |
23 |
A4 |
27 |
24 |
21 |
15 |
27 |
Оптимальной по критерию Вальда является третья стратегия развития предприятия.
2.4. Критерий минимаксного риска Сэвиджа
ЛЕОНАРД ДЖИММИ СЭВИДЖ
1917 1971
американский математик и статистик
Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А, а матрицей рисков R:
(13)
Применение критерия Сэвиджа позволяет любыми путями избежать большого риска при выборе стратегии, а значит избежать большего проигрыша (потерь).
Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий.
Продолжение примера 1.
Таблица 9
R |
П1 |
П2 |
П3 |
П4 |
|
A1 |
0 |
5 |
11 |
9 |
11 |
A2 |
3 |
0 |
0 |
13 |
13 |
A3 |
17 |
11 |
6 |
4 |
17 |
A4 |
21 |
17 |
12 |
0 |
21 |
Оптимальной по критерию Вальда является первая стратегия развития предприятия.
2.5. Критерий пессимизма-оптимизма Гурвица
АДОЛЬФ ГУРВИЦ
1859 1919
немецкий математик
Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением
(14)
если aij выигрыши.
(15)
если aij потери (затраты).
P показатель пессимизма-оптимизма, который находится в интервале [0, 1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма. Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях. Чаще всего p = 0,5.
Если p = 1 критерий слишком пессимистичный, если p = 0 слишком оптимистичный.
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
(16)
В примере 1
Таблица 10
П1 |
П2 |
П3 |
П4 |
||||
A1 |
6 |
12 |
20 |
24 |
24 |
6 |
15 |
A2 |
9 |
7 |
9 |
28 |
28 |
7 |
17,5 |
A3 |
23 |
18 |
15 |
19 |
23 |
15 |
19 |
A4 |
27 |
24 |
21 |
15 |
27 |
15 |
21 |
Оптимальное решение заключается в выборе стратегии А1.
Таким образом, теория не дает однозначных и математически строгих рекомендации по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны.
Статистические игры