Экономическая кибернетика

Эк. Кибернетика.

Игра – матем. Модель конфликтной ситуации.

Стратегия игрока – это правила выбора действий в сложившейся ситуации.

Решение игры – это нахождение оптимальной стратегии для каждого игрока,

т.е. нахождение цены игры.

Оптимальная стратегия игрока – это стратегия, которая в среднем (настрив.

на длительную игру) дает игроку возможный наибольший выигрыш.

Неонтогонистическая – если выигрыш одной из сторон склад. из проигрыша др.

стороны, иначе антогонистическая – выигрыш одного равен проигрышу др.

Матричные игры.

- самые простые игры. Играют 2 чел. У каж конечное число стратегий. Список

стратегий известен каж играющему, т.е. игра с полной инф. Игра одноходовая.

Величина выигрыша известна заранее, опис. В числовых единицах. Оба дейст.

Сознательны, никто не поддается. Игра яв-ся антогонистической. Правила

определяют победителя.

Игры с седловой точкой обладают св-м устойчивости – если один игрок примен

оптим стратегию, то др. игроку не выгодно отклон-ся от своей оптим

стратегии.

Первонач сведен по т. вероятности.

Случайные событие – это событие, которое может произойти или не произойти в

данной ситуации.

Вероятность – это количественная характеристика, мера появ-я событий.

P(А)=(число благопр. событий)/(общее число событий).

М(х)=(i хipi – матем. ожидание.

D(x)=(i х2ipi – (M(x))2 – дисперсия.

((x)=(D(x) – средне квадратичное отклонение – показывает степень

разбросанности значений случайной величины относительно матем. ожидания.

Правило 3 сигм (():

P(M(x)-3((x)0); S*A- оптим стратегия.

Стратегия Вj активная второго игрока – если вероятность исполь-я ее в опти

стратегии больше нуля (Bi-акт, если q*i>0); S*B - оптим стратегия.

Неактивная стратегия – вероятность применения, которой в оптим стратегии

равна нулю.

Теорема устойчивости: Если один игрок применяет свою оптим стратегию, то 2

игроку не выгодно выходить за рамки своих активных стратегий.

Теорема: В матр. игре количество активных стратегий у каж игрока

одинаковое.

Применение решений в усл. неопределенности.

Рассмотрим игру человек и природа. Человек – лицо принимающее решение.

Природа – экон-я среда в состоянии рынка.

Отличия от матричной игры: Активные решения принимает только чел, он хочет

найти наиболее оптим решение. У природы стихийное поведение и она не

стремится к выигрышу. Считается, что чел знает список сост природы, но не

знает какое из них будет фактическим. В игре с природой чел труднее сделать

свой выбор, поэтому сущ несколько подходов нахождения оптимального решения.

Подход определяется склонностью чел к риску.

Риск – это может быть упущенная выгода или необход понести дополнит произв-

е затраты.

Элементы матрицы – это ожидание резуль. Деятельности в завис от сост

природы.

1) Подход махмах “оптимистический”: В каж точке мы находим макс элемент и

после этого находим макс из полученных чисел. (i=maxj aij((=maxi(i=(i0( выб

Аi0.

Выбираем макс значение. Чел ориентир на самый лучший возмож результат, не

обращ внимание на возмож неудачи.

2) Критерий Вальда – критерий пессимизма: Находим в каж строчке миним

элемент и выбираем ту стратегию, которая дает макс гарантируемый доход.

(i=minj aij((=maxi (i=(i ( выб Аi0.

3)Критерий Гурвица (() – ур пессимизма: Человек выбирает 0(((1. Находим

число (i=((i+(1-()(i ((maxi(i=(i0 (выб Аi0. Если (=1 – кр Вальда

(пессимизма), если (=0 – кр оптимизма. Конкретная величина ( опред-ся эк-

ой ситуацией.

4) Критерий Сэвиджа – кр минимального риска: Состав март риска по формуле

rij=(j-аij. (ij=max aij ( rij=(j-aij.

R=(rij) –матр риска; ri=maxj rij( mini ri=ri0 ( выб Аi0.

Если бы мы знали, то мы бы выбрали наиболее эф-е решение. Для самого эф-го

решения: rij=0 (если Пj) ( Аi. Риск = величине упущенной возможности.

У каж критерия есть свои особенности применения. Если мы оценив ситуацию

по разным критериям, то мы можем принять более обоснован решение. Трудность

обоснования яв-ся, что природа не стремится к выигрышу.

Принятие решения в усл риска.

Рассотрим вариант игры чел и природы в случаи, когда нам известно сост

природы. Природа к выигрышу не стремится. Находим стратегию, которая

приносит макс средний доход. Средний доход расчитывается по правилу теории

вероятности.

Величина среднего дохода равна матем ожиданию при этой стратегии.

1) М(Ai)=n(j=1aijpj Находим макс maxi M(Ai)

2) Правило минималь среднего риска. R=(Ai)=n(j=1rijpj. Находим наимень mini

R(Ai).

Лемма: Указ выше 2 критерия в результате всегда приводят к выбору одной и

той же оптим стратегии.

Док-во: Найдем миним сред риска mini R(Ai)= mini (jrijpj= mini ((j((j-

аij)pj)= mini ((j(j pj-(jаijpj)=((j(j pj – не зависит от переменной i,

значит это const С(= mini (С-(jаijpj)( минимум разности соот-ет максимуму

вычитаемого.

maxi (jаijpj=M(Ai).

Номера стратегий, на которых достиг миним среднего риска, равны номерам

стратегий обеспеч наиболь средний выигрыш.

Бейссовский подход нахождения оптимального решения.

Бейсовский подход: Если первонач распредел вероятности мы получ доход (Q(.

Если мы можем провести эксперемент дающий новое распред вероятности в завис

от первонач (Q(и нового (Q’ , мы делаем свой выбор стратегии. p'((Q’(.

Некоторые св-ва матричной игры.

Замеч№1 О масштабе игр: Пусть даны 2 игры одинаковой размерности с

платежной матрицей р(1) и р(2). При чем при любых i и j выпол

(а(2)ij=(a(1)ij+(), некоторые числа ( и (. Тогда: 1) опт стратегии 1 игрока

в 1 и 2 игре одинаковые. Опт стратегии 2 игрока одинаковы в обеих играх.

2) Цена второй игры V2=(V1+(.

Для некот методов решений все элементы матр должны быть не отрицательными.

Заме№2 О доминировании стратегий: Этот прием применяется для умень

размерности игры.

А: Аi доминирует над Ак (Аi>Ак), если для любого j выпол нерав-во аij>akj и

хотя бы одно из этих нерав-в строгое.

Ак – заведомо невыгодна; сред размер выигрыша меньше; р*к=0, стратегия

пассивная.

В: Вj доминирует над Вt (Вj>Вt), если для любого i выпол нерав-во аij>ait и

хотя бы одно из этих нерав-в строгое.

Bt – невыгодна ( q*t=0 – актив стратегия.

Доминир стратегии вычеркиваются и получ матр меньшей размерностью.

Замеч№3 Сравнение операций по методу Парето: Допустим есть операции Q1,

Q2,… Qn. Для каж опер-и расчит 2 параметра: 1) E(Q) – эффективность

(доход);

2) r(Q) – степень риска ((-сред квадратич отклон).

Самая лучшая операция – это опер с наилуч эф-ю и с наимень риском.

F(Q)=(E(Q)-r(Q), где ( - это склонность к риску (не мат проблема). Находим

макс из этих критериев maxi F(Qi). Операция Qi>Q, если эф-ть не менее

E(Qi)(E(Qj), а риск опер r(Qi)(r(Qj) и хотя бы одно из нерав-в строгое.

Доминир страт отбрас, как заведомо невыгодные.

Множ Парето – это все недоминир-е операции. Наиболее эф-е среди них.

Понятие о позиционных игр.

У каж игрока своя платежная матрица. Выигрыш одного не означ проигр др.

Таким способом можно высчитывать взаимные интересы игроков, а также

возможность образования коалиции. Можно расчит динамические игры учитывая

фактор времени и т.д.

Позиционные игры –возникает в случаи, когда надо принимать последо-но

несколько решений, при чем выбор решения опираются на предыдущ-е решения.

Рассотрим простейш случ позиц-й игры с природой. Решение изобр в виде

дерева решений.

Дерево решений – граф-е изобр-е всех возможных альтернатив игрока и сост

природы с указ вероятности соответ-х состояний и размеров выигрыша в каж

ситуации.

Альтернатива игрока изобр квадратом – список возможных стратегий в соот-й

ситуации. Сост-е природы кружочком, чел на них влиять не может. Делается

оценка каж вершины и наход макс оценка ситуаций соот-х каж ветви дерева

решений.

EMV – денежное решение; EMV=(i(отдача в i-ом сост-и)pi

maxвершина (EMV)=?