<< Пред. стр. 16 (из 17) След. >>
17. Орлов А.И. Интервальная статистика: метод максимального правдоподобия и метод моментов. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1995, с.114-124.Приложение 2
Нечеткие и случайные множества
В главе 8 рассматривались такие виды объектов нечисловой природы, как нечеткие и случайные множества. Цель настоящего приложения - глубже изучить свойства нечетких множеств и показать, что теория нечетких множеств в определенном смысле сводится к теории случайных множеств. Для достижения поставленной цели формулируется и доказывается цепь теорем.
В дальнейшем считается, что все рассматриваемые нечеткие множества являются подмножествами одного и того же множества Y.
П2-1. Законы де Моргана для нечетких множеств
Как известно, законами же Моргана называются следующие тождества алгебры множеств
(1)
Теорема 1. Для нечетких множеств справедливы тождества
(2)
(3)
Доказательство теоремы 1 состоит в непосредственной проверке справедливости соотношений (2) и (3) путем вычисления значений функций принадлежности участвующих в этих соотношениях нечетких множеств на основе определений, данных в главе 8.
Тождества (2) и (3) назовем законами де Моргана для нечетких множеств. В отличие от классического случая соотношений (1), они состоят из четырех тождеств, одна пара которых относится к операциям объединения и пересечения, а вторая - к операциям произведения и суммы. Как и соотношение (1) в алгебре множеств, законы де Моргана в алгебре нечетких множеств позволяют преобразовывать выражения и формулы, в состав которых входят операции отрицания.
П2-2. Дистрибутивный закон для нечетких множеств
Некоторые свойства операций над множествами не выполнены для нечетких множеств. Так, за исключением случая, когда А - "четкое" множество (т.е. функция принадлежности принимает только значения 0 и 1).
Верен ли дистрибутивный закон для нечетких множеств? В литературе иногда расплывчато утверждается, что "не всегда". Внесем полную ясность.
Теорема 2. Для любых нечетких множеств А, В и С
(4)
В то же время равенство
(5)
справедливо тогда и только тогда, когда при всех
Доказательство. Фиксируем произвольный элемент . Для сокращения записи обозначим Для доказательства тождества (4) необходимо показать, что
(6)
Рассмотрим различные упорядочения трех чисел a, b, c. Пусть сначала Тогда левая часть соотношения (6) есть а правая т.е. равенство (6) справедливо.
Пусть Тогда в соотношении (6) слева стоит а справа т.е. соотношение (6) опять является равенством.
Если то в соотношении (6) слева стоит а справа т.е. обе части снова совпадают.
Три остальные упорядочения чисел a, b, c разбирать нет необходимости, поскольку в соотношение (6) числа b и c входят симметрично. Тождество (4) доказано.
Второе утверждение теоремы 2 вытекает из того, что в соответствии с определениями операций над нечеткими множествами (см. главу 8)
и
Эти два выражения совпадают тогда и только тогда, когда, когда что и требовалось доказать.
Определение 1. Носителем нечеткого множества А называется совокупность всех точек , для которых
Следствие теоремы 2. Если носители нечетких множеств В и С совпадают с У, то равенство (5) имеет место тогда и только тогда, когда А - "четкое" (т.е. обычное, классическое, не нечеткое) множество.
Доказательство. По условию при всех . Тогда из теоремы 2 следует, что т.е. или , что и означает, что А - четкое множество.
П2-3. Нечеткие множества как проекции случайных множеств
С самого начала появления современной теории нечеткости в 1960-е годы началось обсуждение ее взаимоотношений с теорией вероятностей. Дело в том, что функция принадлежности нечеткого множества напоминает распределение вероятностей. Отличие только в том, что сумма вероятностей по всем возможным значениям случайной величины (или интеграл, если множество возможных значений несчетно) всегда равна 1, а сумма S значений функции принадлежности (в непрерывном случае - интеграл от функции принадлежности) может быть любым неотрицательным числом. Возникает искушение пронормировать функцию принадлежности, т.е. разделить все ее значения на S (при S 0), чтобы свести ее к распределению вероятностей (или к плотности вероятности). Однако специалисты по нечеткости справедливо возражают против такого "примитивного" сведения", поскольку оно проводится отдельно для каждой размытости (нечеткого множества), и определения обычных операций над нечеткими множествами с ним согласовать нельзя. Последнее утверждение означает следующее. Пусть указанным образом преобразованы функции принадлежности нечетких множеств А и В. Как при этом преобразуются функции принадлежности ? Установить это невозможно в принципе. Последнее утверждение становится совершенно ясным после рассмотрения нескольких примеров пар нечетких множеств с одними и теми же суммами значений функций принадлежности, но различными результатами теоретико-множественных операций над ними, причем и суммы значений соответствующих функций принадлежности для этих результатов теоретико-множественных операций, например, для пересечений множеств, также различны.
В работах по нечетким множествам довольно часто утверждается, что теория нечеткости является самостоятельным разделом прикладной математики и не имеет отношения к теории вероятностей (см., например, обзор литературы в монографиях [1,2]). Авторы, сравнивавшие теорию нечеткости и теорию вероятностей, обычно подчеркивали различие между этими областями теоретических и прикладных исследований. Обычно сравнивают аксиоматику и сравнивают области приложений. Надо сразу отметить, что аргументы при втором типе сравнений не имеют доказательной силы, поскольку по поводу границ применимости даже такой давно выделившейся научной области, как вероятностно-статистические методы, имеются различные мнения. Напомним, что итог рассуждений одного из наиболее известных французских математиков Анри Лебега по поводу границ применимости арифметики таков: "Арифметика применима тогда, когда она применима" (см. его монографию [3, с.21-22]).
При сравнении различных аксиоматик теории нечеткости и теории вероятностей нетрудно увидеть, что списки аксиом различаются. Из этого, однако, отнюдь не следует, что между указанными теориями нельзя установить связь, типа известного сведения евклидовой геометрии на плоскости к арифметике (точнее к теории числовой системы - см., например, монографию [4]). Напомним, что эти две аксиоматики - евклидовой геометрии и арифметики - на первый взгляд весьма сильно различаются.
Можно понять желание энтузиастов нового направления подчеркнуть принципиальную новизну своего научного аппарата. Однако не менее важно установить связи нового подхода с ранее известными.
Как оказалось, теория нечетких множеств тесно связана с теорией случайных множеств. Еще в 1974 г. в работе [5] было показано, что нечеткие множества естественно рассматривать как "проекции" случайных множеств. Рассмотрим этот метод сведения теории нечетких множеств к теории случайных множеств.
Определение 2. Пусть - случайное подмножество конечного множества У. Нечеткое множество В, определенное на У, называется проекцией А и обозначается Proj A, если
(7)
при всех
Очевидно, каждому случайному множеству А можно поставить в соответствие с помощью формулы (7) нечеткое множество В = Proj A. Оказывается, верно и обратное.
Теорема 3. Для любого нечеткого подмножества В конечного множества У существует случайное подмножество А множества У такое, что В = Proj A.
Доказательство. Достаточно задать распределение случайного множества А. Пусть У1 - носитель В (см. определение 1 выше). Без ограничения общности можно считать, что при некотором m и элементы У1 занумерованы в таком порядке, что
Введем множества
Положим
Для всех остальных подмножеств Х множества У положим Р(А=Х)=0. Поскольку элемент yt входит во множества Y(1), Y(2),..., Y(t) и не входит во множества Y(t+1),..., Y(m), то из приведенных выше формул следует, что Если то, очевидно, Теорема 3 доказана.
Распределение случайного множества с независимыми элементами, как следует из рассмотрений главы 8, полностью определяется его проекцией. Для конечного случайного множества общего вида это не так. Для уточнения сказанного понадобится следующая теорема.
Теорема 4. Для случайного подмножества А множества У из конечного числа элементов наборы чисел и выражаются один через другой.
Доказательство. Второй набор выражается через первый следующим образом:
Элементы первого набора выразить через второй можно с помощью формулы включений и исключений из формальной логики, в соответствии с которой
В этой формуле в первой сумме у пробегает все элементы множества Y\X, во второй сумме переменные суммирования у1 и у2 не совпадают и также пробегают это множество, и т.д. Ссылка на формулу включений и исключений завершает доказательство теоремы 4.
В соответствии с теоремой 4 случайное множество А можно характеризовать не только распределением, но и набором чисел В этом наборе а других связей типа равенств нет. В этот набор входят числа следовательно, фиксация проекции случайного множества эквивалентна фиксации k = Card(Y) параметров из (2k-1) параметров, задающих распределение случайного множества А в общем случае.
Будет полезна следующая теорема.
Теорема 5. Если Proj A = B, то
Для доказательства достаточно воспользоваться тождеством из теории случайных множеств формулой для вероятности накрытия из главы 8, определением отрицания нечеткого множества и тем, что сумма всех P(A=X) равна 1.
П2-4. Пересечения и произведения нечетких и случайных множеств
Выясним, как операции над случайными множествами соотносятся с операциями над их проекциями. В силу законов де Моргана (теорема 1) и теоремы 5 достаточно рассмотреть операцию пересечения случайных множеств.
Теорема 6. Если случайные подмножества А1 и А2 конечного множества У независимы, то нечеткое множество является произведением нечетких множеств Proj A1 и Proj A2 .
Доказательство. Надо показать, что для любого
(8)
По формуле для вероятности накрытия точки случайным множеством (глава 8)
(9)
Как известно, распределение пересечения случайных множеств можно выразить через их совместное распределение следующим образом:
(10)
Из соотношений (9) и (10) следует, что вероятность накрытия для пересечения случайных множеств можно представить в виде двойной суммы
(11)
Заметим теперь, что правую часть формулы (11) можно переписать следующим образом:
(12)
Действительно, формула (11) отличается от формулы (12) лишь тем, что в ней сгруппированы члены, в которых пересечение переменных суммирования принимает постоянное значение. Воспользовавшись определением независимости случайных множеств и правилом перемножения сумм, получаем, что из (11) и (12) вытекает равенство
Для завершения доказательства теоремы 6 достаточно еще раз сослаться на формулу для вероятности накрытия точки случайным множеством (глава 8).
Определение 3. Носителем случайного множества С называется совокупность всех тех элементов для которых
Теорема 7. Равенство
верно тогда и только тогда, когда пересечение носителей случайных множеств и пусто.
Доказательство. Необходимо выяснить условия, при которых
(13)
Положим
Тогда равенство (13) сводится к условию
(14)
Ясно, что соотношение (14) выполнено тогда и только тогда, когда р2р3=0 при всех т.е. не существует ни одного элемента такого, что одновременно и , а это эквивалентно пустоте пересечения носителей случайных множеств и . Теорема 7 доказана.
П2-5. Сведение последовательности операций над нечеткими множествами
к последовательности операций над случайными множествами
Выше получены некоторые связи между нечеткими и случайными множествами. Стоит отметить, что изучение этих связей в работе [5] (эта работа выполнена в 1974 г. и доложена на семинаре "Многомерный статистический анализ и вероятностное моделирование реальных процессов" 18 декабря 1974 г. - см. [5, с.169]) началось с введения случайных множеств с целью развития и обобщения аппарата нечетких множеств Л. Заде. Дело в том, что математический аппарат нечетких множеств не позволяет в должной мере учитывать различные варианты зависимости между понятиями (объектами), моделируемыми с его помощью, не является достаточно гибким. Так, для описания "общей части" двух нечетких множеств есть лишь две операции - произведение и пересечение. Если применяется первая из них, то фактически предполагается, что множества ведут себя как проекции независимых случайных множеств (см. выше теорему 6). Операция пересечения также накладывает вполне определенные ограничения на вид зависимости между множествами (см. выше теорему 7), причем в этом случае найдены даже необходимые и достаточные условия. Желательно иметь более широкие возможности для моделирования зависимости между множествами (понятиями, объектами). Использование математического аппарата случайных множеств предоставляет такие возможности.
Цель сведения нечетких множеств к случайным состоит в том, чтобы за любой конструкцией из нечетких множеств видеть конструкцию из случайных множеств, определяющую свойства первой, аналогично тому, как плотностью распределения вероятностей мы видим случайную величину. В настоящем пункте приводим результаты по сведению алгебры нечетких множеств к алгебре случайных множеств.
Определение 4. Вероятностное пространство {?, G, P} назовем делимым, если для любого измеримого множества ХG и любого положительного числа , меньшего Р(Х), можно указать измеримое множество такое, что
Пример. Пусть - единичный куб конечномерного линейного пространства, G есть сигма-алгебра борелевских множеств, а P - мера Лебега. Тогда {?, G, P} - делимое вероятностное пространство.
Таким образом, делимое вероятностное пространство - это не экзотика. Обычный куб является примером такого пространства.
Доказательство сформулированного в примере утверждения проводится стандартными математическими приемами, основанными на том, что измеримое множество можно сколь угодно точно приблизить открытыми множествами, последние представляются в виде суммы не более чем счетного числа открытых шаров, а для шаров делимость проверяется непосредственно (от шара Х тело объема отделяется соответствующей плоскостью).
Теорема 8. Пусть даны случайное множество А на делимом вероятностном пространстве {?, G, P} со значениями во множестве всех подмножеств множества У из конечного числа элементов, и нечеткое множество D на У. Тогда существуют случайные множества С1, С2, С3, С4 на том же вероятностном пространстве такие, что
где B = Proj A.
Доказательство. В силу справедливости законов де Моргана для нечетких (см. теорему 1 выше) и для случайных множеств, а также теоремы 5 выше (об отрицаниях) достаточно доказать существование случайных множеств С1 и С2 .
Рассмотрим распределение вероятностей во множестве всех подмножеств множества У, соответствующее случайному множеству С такому, что Proj C = D (оно существует в силу теоремы 3). Построим случайное множество С2 с указанным распределением, независимое от А. Тогда по теореме 6.
Перейдем к построению случайного множества С1. По теореме 7 необходимо и достаточно определить случайное множество так, чтобы ProjC1 = D и пересечение носителей случайных множеств и было пусто, т.е.
для и
для .
Построим , исходя из заданного случайного множества Пусть Исключим элемент у1 из для стольких элементарных событий , чтобы для полученного случайного множества было справедливо равенство
(именно здесь используется делимость вероятностного пространства, на котором задано случайное множество ). Для , очевидно,
Аналогичным образом последовательно исключаем у из для всех и добавляем у в для всех , меняя на каждом шагу только для так, чтобы
(ясно, что при рассмотрении случайное множество не меняется). Перебрав все элементы У, получим случайное множество , для которого выполнено требуемое. Теорема 8 доказана.
Основной результат о сведении теории нечетких множеств к теории случайных множеств дается следующей теоремой.
Теорема 9. Пусть - некоторые нечеткие подмножества множества У из конечного числа элементов. Рассмотрим результаты последовательного выполнения теоретико-множественных операций
где - символ одной из следующих теоретико-множественных операций над нечеткими множествами: пересечение, произведение, объединение, сумма (на разных местах могут стоять разные символы). Тогда существуют случайные подмножества того же множества У такие, что
и, кроме того, результаты теоретико-множественных операций связаны аналогичными соотношениями
где знак означает, что на рассматриваемом месте стоит символ пересечения случайных множеств, если в определении Bm стоит символ пересечения или символ произведения нечетких множеств, и соответственно символ объединения случайных множеств, если в Bm стоит символ объединения или символ суммы нечетких множеств.
Комментарий. Поясним содержание теоремы. Например, если
то
Как совместить справедливость дистрибутивного закона для случайных множеств (вытекающего из его справедливости для обычных множеств) с теоремой 2 выше, в которой показано, что для нечетких множеств, вообще говоря, ? Дело в том, что хотя в соответствии с теоремой 9 для любых трех нечетких множеств В1, В2 и В3 можно указать три случайных множества А1, А2 и А3 такие, что
где
но при этом, вообще говоря,
и, кроме случаев, указанных в теореме 2,
Доказательство теоремы 9 проводится по индукции. При t=1 распределение случайного множества строится с помощью теоремы 3. Затем конструируется само случайное множество А1, определенное на делимом вероятностном пространстве (нетрудно проверить, что на делимом вероятностном пространстве можно построить случайное подмножество конечного множества с любым заданным распределением именно в силу делимости пространства). Далее случайные множества А2, А3, ..., At строим по индукции с помощью теоремы 8. Теорема 9 доказана.
Замечание. Проведенное доказательство теоремы 9 проходит и в случае, когда при определении Bm используются отрицания, точнее, кроме Bm ранее введенного вида используются также последовательности результатов теоретико-множественных операций, очередной шаг в которых имеет вид
А именно, сначала при помощи законов де Моргана (теорема 1 выше) проводится преобразование, в результате которого в последовательности Bm остаются только отрицания отдельных подмножеств из совокупности , а затем с помощью теоремы 5 вообще удается избавиться от отрицаний и вернуться к условиям теоремы 9.
Итак, в настоящем приложении описаны связи между такими объектами нечисловой природы, как нечеткие и случайные множества, установленные в нашей стране в первой половине 1970-х годов. Через несколько лет, а именно, в начале 1980-х годов, близкие подходы стали развиваться и за рубежом. Одна из работ [6] носит примечательное название "Нечеткие множества как классы эквивалентности случайных множеств".
В эконометрике разработан ряд методов статистического анализа нечетких данных, в том числе методы классификации, регрессии, проверки гипотез о совпадении функций принадлежности по опытным данным и т.д., при этом оказались полезными общие подходы статистики объектов нечисловой природы (см. главу 8 и работы [1,2,5]). Методологические и прикладные вопросы теории нечеткости мы обсуждали в работах [1,2,7].
Цитированная литература
1. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука,1979.- 296 с.
2. Орлов А.И. Задачи оптимизации и нечеткие переменные. - М.: Знание, 1980. - 64 с.
3. Лебег А. Об измерении величин. - М.: Учпедгиз, 1960. - 204 с.
4. Ефимов Н.В. Высшая геометрия. - М.: ГИФМЛ, 1961. - 580 с.
5. Орлов А.И. Основания теории нечетких множеств (обобщение аппарата Заде). Случайные толерантности. - В сб.: Алгоритмы многомерного статистического анализа и их применения. - М.: Изд-во ЦЭМИ АН СССР, 1975. - С.169-175.
6. Goodman I.R. Fuzzy sets as eguivalence classes of random sets // Fuzzy Set and Possibility Theory: Recent Developments. - New York-Oxford-Toronto-Sydney-Paris-Frankfurt, Pergamon Press, 1982. - P.327-343. (Перевод: Гудмэн И. Нечеткие множества как классы эквивалентности случайных множеств. - В сб.: Нечеткие множества и теория возможностей. Последние достижения. - М.: Радио и связь, 1986. - С. 241-264.)
7. Орлов А.И. Математика нечеткости. - Наука и жизнь. 1982. No.7. С.60-67.
Приложение 3
Методика сравнительного анализа родственных эконометрических моделей
В методике введено понятие родственных эконометрических моделей. Выделены теоретические и эмпирические единичные показатели качества эконометрических моделей с целью сравнения родственных моделей. Рассмотрены методы получения ранжировок родственных математических моделей по тем или иным показателям их качества и указаны методы согласования таких ранжировок. Рассмотрены методы проверки согласованности, кластеризации и усреднения ранжировок. Разобран пример сравнения родственных математических моделей на основе эмпирических единичных показателей качества. Приведены математические основы методов согласования ранжировок и классификаций, включая соответствующие теоремы с доказательствами. Дан обзор теоретических основ методов проверки согласованности, кластеризации и усреднения ранжировок.
П3-1. Общие положения
1.1. Методика имеет целью:
- по единой схеме оценивать качество эконометрических моделей;
- проводить сравнение однотипных эконометрических моделей;
- осуществлять выбор эконометрических моделей среди однотипных с целью практического использования или углубленной доработки.
1.2. Методика основана на выделении теоретических и эмпирических единичных показателей качества эконометрической модели, построении на их основе групповых и обобщенных показателей качества, их согласования и использовании для решения задач, указанных в п.1.1
1.3. Методика предусматривает использование как методов, основанных на анализе результатов наблюдений или специально поставленных экспериментов, так и методов, использующих экспертные оценки специалистов.
П3-2. Родственные эконометрические модели
2.1. Под эконометрической моделью в настоящей методике понимается функция, отображающая набор входных переменных в набор выходных переменных. Входные и выходные переменные могут иметь как числовую, так и нечисловую природу, быть измеренными в различных шкалах, сами быть функциями. Модель может задаваться уравнением, системой уравнений, алгоритмом, таблицей, графиком, словесно (при использовании нечисловых переменных).
2.2. Входные переменные делятся на:
- экономические переменные (цены, стоимости, предпочтения потребителей и т.п.);
- переменные управления (менеджмента);
- социальные переменные (состав персонала, демографический профиль);
- технические переменные, описывающие технологические процессы и характеристики изделий;
- физические переменные (пространственные координаты, время, температура,..., например, высота источника загрязнения, диаметр пролива, скорость ветра), описывающие условия воздействия;
- химические переменные, описывающие свойства воздействующих химических веществ;
- переменные, описывающие объекты воздействия (реципиентов);
- переменные, описывающие окружающую среду;
- эмпирические и иные константы, рассчитанные авторами моделей по результатам экспериментов или теоретически,
- иные виды переменных.
Входные переменные, например, цены или скорость ветра, могут зависеть от времени.
2.3. Под выходными переменными понимают те, которые используются при формировании окончательных суждений об объектах и процессах или являются входными в смежных моделях. Они так же, как входные переменные, могут быть функциями.
2.4. Эконометрические модели называются родственными по выходу, если наборы их выходных переменных совпадают. Модели называются частично родственными по выходу, если наборы их выходных переменных частично совпадают. Эконометрические модели называются родственными, если наборы их входных и выходных переменных совпадают. Частично родственные по выходу модели становятся родственным по выходу, если отказываемся от рассмотрения всех выходных переменных, кроме совпадающих. При формальном расширении множества входных переменных путем объединения таковых для нескольких родственных по выходу моделей получаем родственные модели.
Поэтому без ограничения общности можно считать, что на множестве эконометрических моделей задано отношение толерантности "быть родственными моделями". Пара моделей входит в это отношение тогда и только тогда, когда пересечение множеств их выходных переменных не пусто. В таком случае их можно преобразовать в пару родственных моделей (в смысле определения, данного в предыдущем абзаце).
2.5. Для сравнения родственных моделей используются как объективные (теоретические и экспериментальные) методы, так и субъективные экспертные оценки. Для сравнения и оценки моделей строится иерархическая система показателей качества: на основе единичных показателей формируются групповые, а с их помощью - обобщенные. Теоретические единичные показатели качества рассматриваются в пункте П3-3. Основанные на обработке результатов экспериментов единичные показатели качества рассматриваются в П3-4.
2.6. Результаты оценивания показателей качества, полученные экспертным или объективным путем, в литературе выражаются различными способами. Согласно методологии настоящей методики их рекомендуется выражать, как правило, в виде ранжировок или упорядоченных классификаций (нестрогих линейных порядков). Допускается использование метода парных сравнений, нечетких и интервальных оценок или иного способа получения информации от экспертов (главу 12 выше).
2.7. Для получения агрегированных (групповых или обобщенных) оценок применяют согласование ранжировок. При этом выявляются противоречия между различными ранжировками и привлекается дополнительная информация для упорядочения пар объектов, являющихся противоречивыми (которые по-разному упорядочены в исходных ранжировках). Методы согласования ранжировок рассмотрены в пункте П3-5.
2.8. При невозможности согласования ранжировок (из-за большого числа противоречий) проводится усреднение ранжировок в соответствии с правила расчета эмпирических средних в статистике объектов нечисловой природы (см. главу 8). При этом предварительно проводится проверка согласованности экспертов или методов оценки и при необходимости - разбиение их на кластеры, т.е. группы экспертов, имеющих сходные между собой мнения, резко отличные от мнений иных групп. Итоговые ранжировки рассчитываются отдельно для каждого кластера и передаются лицу, принимающему решения. Методы проверки согласованности экспертов и - в случае необходимости - разбиения их на группы-кластеры, а также усреднения ранжировок рассматриваются в пункте П3-6.
П3-3. Теоретические единичные показатели качества
3.1. К теоретическим единичным показателям качества эконометрической модели относятся показатели, не связанные с непосредственным использованием при оценивании и сравнении моделей данных реальных наблюдений, а именно, группы показателей:
- адекватности (обоснованности);
- внутренней согласованности;
- устойчивости;
- полноты;
- эффективности использования.
3.2. К показателям адекватности (обоснованности) относятся показатели:
- соответствия модели экономической (управленческой, технической, физической, химической, биологической, экологической и др.) сути явления, ее связи с научными результатами соответствующих областей;
- наличия надежной информации об экспериментальном подтверждении модели, о точности и практическом применении сделанных с ее помощью выводов и прогнозов.
3.3. К показателям внутренней согласованности относятся показатели:
- логической непротиворечивости модели;
- соблюдения различных законов сохранения (в частности, балансовых соотношений);
- соблюдения соотношений теории размерностей;
- наличия или отсутствия произвольных (не обоснованных научными методами) предположений;
- выполнения естественных граничных и предельных соотношений.
3.4. К показателям устойчивости относятся показатели:
- непрерывности расчетных величин эконометрической модели в случае непрерывности входных переменных;
- устойчивости выводов относительно допустимых преобразований шкал измерения;
- малой вариабельности выходных переменных при незначительных изменениях входных переменных (включая эмпирические константы);
- устойчивости к аномальным значениям отдельных экспериментальных результатов (в случае, если применение модели предполагает проведение экспериментов);
- устойчивости к вычислительным погрешностям.
3.5. К показателям полноты относятся показатели, показывающие:
- насколько исчерпывающе набор выходных переменных отражает потребности конечного пользователя;
- насколько исчерпывающе набор выходных переменных отражает потребности смежных моделей;
- насколько исчерпывающе отражены в модели главные черты описываемого объекта (с точки зрения имеющейся в объектной области теории).
3.6. К показателям эффективности использования относятся показатели:
- простоты и наглядности модели;
- удобства пользования моделью;
- доступности информации, необходимой для применения модели;
- стоимости получения информации, необходимой для применения модели.
3.7. Перечень теоретических единичных показателей качества родственных моделей может быть дополнен в соответствии со спецификой моделируемого явления или процесса.
3.8. Оценивание теоретических единичных показателей качества родственных моделей проводится экспертным путем. Допускается использование одного или нескольких экспертов - в случае доступности исходной информации и отсутствии причин для возможного расхождения мнений экспертов. В противном случае необходимо проведение экспертного опроса в полном объеме.
П3 4. Эмпирические единичные показатели качества
4.1. Эмпирические единичные показатели качества применяются, когда имеются надежные результаты экспериментов, позволяющие сравнивать результаты измерений, наблюдений, анализов, проб с расчетными значениями, полученными на основе родственных моделей.
4.2. Для проведения такого сравнения на основе того или иного эмпирического единичного показателя качества могут быть использованы различные методы эконометрики, прикладной статистики и планирования экспериментов.
4.3. В случае одной числовой выходной переменной в соответствии с принятым в настоящей методике подходом используют два основных метода ранжировки родственных математических моделей (использующих два основных эмпирических единичных показателя качества):
- по сумме относительных отклонений результатов измерений от расчетных значений (п.4.4);
- по сумме рангов, присвоенных моделям в каждой экспериментальной точке в зависимости от близости к измеренным значениям (п.4.5);
а также дополнительные - по числу экспериментальных точек, в которых модель оказалась наилучшей (п.4.6).
4.4. При использовании метода ранжировки по сумме относительных отклонений для каждой модели подсчитывают относительную погрешность в каждой экспериментальной точке (относительно наблюденного значения), складывают эти относительные погрешности (без учета знаков) и ранжируют модели в порядке возрастания указанных сумм.
4.5. При использовании метода ранжировки по сумме рангов в каждой экспериментальной точке строят ранжировку (упорядочение) моделей по степени близости соответствующих расчетных значений к результату наблюдений (без учета знака отклонения) - самая точная модель получает ранг 1, вторая по точности - ранг 2, и т.д. Затем ранги складываются по всем экспериментальным точкам и модели ранжируются в порядке возрастания суммы рангов.
4.6. Вариантом метода ранжировки по числу экспериментальных точек, в которых модель оказалась наилучшей (без учета знака отклонения), является метод разбиения рассматриваемой совокупности родственных моделей на два класса - тех, которые оказались наилучшими хотя бы для одной экспериментальной точки (т.е. оптимальных по Парето), и остальных, никогда не бывших наилучшими.
Другой вариант предполагается учет числа точек, в которых та или иная из рассматриваемой совокупности родственных моделей оказалась наилучшей (наиболее точной). Чем в большем числе точек модель оказалась точнее, тем выше она оценивается. Число классов в этом варианте не фиксировано, оно может меняться от 1 (когда каждая модель оптимальна ровно в одной точке) до общего числа экспериментальных точек.
4.7. При наличии достаточной эмпирической информации целесообразно построить формально-статистические модели, например, линейного регрессионного анализа, примененного к входным переменным или функциям от них (например, логарифмам, если исходные модели описываются степенными функциями), рассчитать оценки параметров по экспериментальным данным (т.е. идентифицировать модели), добавить вновь построенные модели в перечень родственных моделей и сравнить их с остальными согласно настоящей методике.
4.8. Перечень эмпирических единичных показателей качества родственных математических моделей может быть дополнен в соответствии со спецификой моделируемого явления или процесса. В частности, могут быть использованы такие показатели, как:
- сумма квадратов отклонений расчетных значений от результатов измерений, наблюдений, анализов, проб;
- сумма модулей таких отклонений;
- сумма квадратов относительных погрешностей;
- величина максимально возможного отклонения (с учетом или без учета знака);
- расстояние (показатель близости) иного вида между вектором экспериментальных значений и вектором расчетных значений, соответствующих определенной модели, например, расстояние Махаланобиса при той или иной корреляционной (или весовой) матрице;
- в случае нескольких выходных параметров - различные характеристики качества планов эксперимента, разработанные в теории планирования эксперимента (в соответствии с перечнем, приведенным в монографии [1], глава II).
4.9. Пример сравнения (ранжировки) родственных математических моделей на основе эмпирических единичных показателей качества дан в пункте П3-7 ниже.
П3-5. Методы согласования ранжировок
5.1. Методы раздела 5 применяются в соответствии с п.2.6 для согласования ранжировок родственных моделей, полученных с помощью теоретических или эмпирических единичных показателей качества моделей, а также ранжировок, построенных на основе групповых показателей качества, в частности, показателей, рассмотренных в пп.3.2 - 3.6.
5.2. При согласовании ранжировок исходят из двух или нескольких ранжировок, вообще говоря, со связями (нестрогих линейных порядков). В каждой ранжировке модели располагаются в порядке понижения качества, причем некоторые модели могут признаваться эквивалентными (по рассматриваемому показателю качества). Ранжировки моделей могут быть получены как при их объективном сравнении по различным показателям качества, так и от экспертов, сравнивающих модели по тому или иному показателю или их набору.
5.3. На первом этапе согласования ранжировок выделяются противоречивые пары моделей. Пара моделей А и В признается противоречивой, если в одной из рассматриваемых ранжировок модель А строго лучше модели В, а в какой-то другой модель В строго лучше модели А. Тем самым определяется симметричное бинарное отношение (квазитолерантность) на множестве моделей.
5.4. В соответствии с правилами теории бинарных отношений проводится транзитивное замыкание квазитолерантности, построенной в соответствии с п. 5.3. Устанавливается порядок между классами эквивалентности, соответствующий порядкам во всех исходных ранжировках. Полученная ранжировка называется согласующей для множества исходных ранжировок. При сравнении согласующей ранжировки с любой из исходных не существует ни одной противоречивой пары (это вытекает из теорем, приведенных в пункте П3-8 ниже).
5.5. При необходимости упорядочения по качеству моделей, входящих в один класс согласующей ранжировки (т.е. эквивалентных в соответствии с ней), привлекается дополнительная информация. Эта информация может опираться на дополнительные показатели качества, на результаты дополнительных исследований, как экспериментальных, так и теоретических, в частности, проведенных методами статистики объектов нечисловой природы (см. главу 8 выше).
П3-6. Методы проверки согласованности, кластеризации и усреднения ранжировок
6.1. При необходимости упорядочения по качеству моделей, входящих в один класс согласующей ранжировки (п.5.5), применяют методы проверки (статистической) согласованности, при необходимости - кластерного анализа, а затем - усреднения ранжировок, разработанные в статистике объектов нечисловой природы.
6.2. Методы, указанные в п.6.1, предполагают использование того или иного расстояния (меры различия) в пространстве ранжировок (со связями). В соответствии с методологией настоящей методики используется расстояние Кемени-Снелла, связанное с коэффициентом ранговой корреляции Кендалла, при проверке (статистической) согласованности и - при необходимости - проведении кластерного анализа. При усреднении ранжировок используется мера различия, основанная на коэффициенте ранговой корреляции Спирмена. Допускается использование иных расстояний и мер близости (различия) в том числе:
- расстояния, основанного на понятии ближайшего соседа;
- иных расстояний и мер близости, разработанных в статистике объектов нечисловой природы.
6.3. При использовании одновременно нескольких расстояний (мер различия или близости) в пространстве ранжировок (со связями) в соответствии с методологией настоящей методики необходимо использовать выводы, устойчивые относительно выбора того или иного расстояния (меры различия) в пространстве ранжировок (со связями).
6.4. В соответствии с методологией настоящей методики сначала проверяется согласованность набора ранжировок с помощью коэффициента ранговой конкордации Кендалла и Бебингтона Смита (при небольшом числе связей) или теории люсианов (если ранжировки построены на основе парных сравнений моделей), а также согласованность оценивается экспертно.
6.5. В случае недостаточной согласованности набора ранжировок проводится их разбиение на группы схожих между собой тем или иным методом кластерного анализа. Результат разбиения должен быть достаточно устойчив относительно выбора метода кластер-анализа. Деление показателей качества на группы, по которым модели оцениваются схожим образом, или экспертов на группы с близкими мнениями используется неформально при дальнейшем сравнении родственных математических моделей.
6.6. При положительном ответе на вопрос о согласованности ранжировок результирующая (итоговая) ранжировка находится как эмпирическое среднее (медиана Кемени) согласно статистике объектов нечисловой природы (с учетом сказанного в пп. 6.2, 6.3). При отрицательном ответе на вопрос о согласованности ранжировок результирующие (итоговые) ранжировки находятся отдельно для каждого кластера.
6.7. Информация о расчетных формулах по методам раздела 6 и их теоретических основах приведены в пункте П3-9 ниже.
П3-7. Пример сравнения родственных эконометрических моделей на основе эмпирических единичных показателей качества
При решении задач экологического страхования необходимо проанализировать последствия возможных аварий на химических производствах. Другими словами, в экологическом страховании экономические проблемы переплетаются с проблемами химической безопасности биосферы. Поэтому нет ничего удивительного в том, что в качестве примера рассматриваются 8 родственных эконометрических (если угодно - математических) моделей стационарных процессов испарения жидкости с открытых поверхностей. Модели будем различать по фамилиям предложивших и изучавших их специалистов. Это модели Лебузера (в дальнейшем кратко Л), Мак-Кея (М-К), Гусева-Баранаева (Г-Б), Клячко (К), Стефана (Стеф), Братсерта (Б), Дикона (Д), Соломона (Сол). Имеются данные о 12 конкретных экспериментах. Для соответствующих 12 наборов входных переменных получены расчетные значения по упомянутым 8 моделям. В табл.1 приведены значения относительных погрешностей (в процентах и без учета знака) расчетных значений относительно реальных.
Табл.1. Относительные погрешности (в %)
для 8 родственных моделей
№ эксп. Д Л М-К Б Г-Б Сол Стеф К 1 44,3 17,0 7,6 11,2 74,8 20,7 48,8 64,5 2 36,4 15,3 6,9 0,4 103,1 4,3 42,9 52,3 3 18,0 48,6 37,7 29,4 161,7 22,1 26,4 39,1 4 38,9 14,4 7,8 7,8 109,3 4,9 50.8 18,0 5 61,7 28,3 32,4 42,1 31,3 41,1 9,0 49,3 6 27,8 30,5 19,2 15,4 12,8 9,5 33,1 51,7 7 52,1 11,6 18,7 25,5 44,6 27,4 58,3 55,5 8 43,0 0,1 9,4 6,2 70,5 18,9 43,5 75,8 9 51,6 11,4 21,8 21,3 48,0 30,9 53,3 75,8 10 39,5 5,1 2,9 1,1 78,9 14,4 40,9 74,7 11 49,2 11,9 20,2 15,6 48,9 29,1 48,3 81,7 12 8,5 106,8 95,9 59,2 268,5 85,4 17,9 129,8 Сумма 471 301 280,5 235,2 1072,4 308,7 533,2 768,2
В последней строке табл.1 в соответствии с п.4.4 методики приведены суммы относительных отклонений результатов измерений от расчетных значений. Упорядочение (ранжировка) по сумме относительных погрешностей (отклонений) имеет вид:
Б < М-К < Л < Сол < Д < Стеф < К < Г-Б . (1)
В табл.2 приведены ранги 8 моделей по точности приближения в отдельных экспериментальных точках (ранг 1 - самая точная модель, ранг 2 - вторая по точности,..., ранг 8 - самая далекая от истинного экспериментального значения модель). Они получены путем сравнения относительных погрешностей из табл.1.
Табл.2. Ранги 8 моделей по точности приближения
№ эксп. Д Л М-К Б Г-Б Сол Стеф К 1 5 3 1 2 8 4 6 7 2 5 4 3 1 8 2 6 7 3 1 7 5 4 8 2 3 6 4 6 4 2,5 2,5 8 1 7 5 5 7 1 3 5 2 4 8 6 6 5 6 4 3 2 1 7 8 7 6 1 2 3 5 4 8 7 8 5 1 3 2 7 4 6 8 9 6 1 3 2 5 4 7 8 10 5 3 2 1 8 4 6 7 11 7 1 2 2 6 4 5 8 12 1 6 5 3 8 4 2 7 Сумма 59 38 36,5 30.5 75 38 71 84 Итоговый ранг 5 3,5 2 1 7 3,5 6 8