Методы поддержки принятия решений в условиях определенности

Пусть заданы критерии K1,…,Kn; X = { x | x = (x1,…,xn) } – множество векторных оценок вариантов по этим критериям. Как уже говорилось, числовая функция f: X →R, называется функцией полезности (ценности, предпочтительности), если она обладает следующим свойством: f(x)≥f(y) ⇔ xRy.

Если известна функция полезности, то поиск оптимального варианта сводится к задаче нахождения x* = arg max f(x), x∈X – аргумента максимума функции полезности на множестве X.

Как найти функцию полезности? Методы построения функции полезности делятся на эвристические и аксиоматические.

К эвристическим методам можно отнести метод главного критерия и метод обобщенного критерия.

Метод главного критерия сводится к оптимизации по одному выбранному критерию, который объявляется главным, при условии, что остальные критерии не больше (или не меньше) приемлемых значений.

Метод обобщенного критерия заключается в свёртке набора критериев в числовую функцию, которая и будет являться функцией полезности.

Виды свёрток:

1) аддитивная свёртка: f(x) = α 1K1(x)+…+αnKn(x);

2) мультипликативная свёртка: f (x) =K1α1 *...*K1α1 ;

3) приведенная свёртка: f(x) = min(Ki(x)/α i) по всем i=1, …, n (или f(x) = max(Ki(x)/αi) по всем i=1, …, n).


Взаимная независимость критериев и аддитивная функция ценности

Аксиоматические методы построения функции полезности – это формальные методы, основанные на том, что формулируются специальные предположения (аксиомы) о свойствах предпочтения, выполнение которых гарантирует существование функции полезности конкретного вида.

Обычно, при использовании таких методов функцию полезности строят в аддитивном виде – как сумму функций полезности по каждому критерию с некоторыми весовыми коэффициентами α 1,…, α n
f(x 1, ...,xn)=∑ i=1 nαifi(xi) ,         (4.1)
где fi – функция полезности критерия Ki.

Введем несколько определений и обозначений.

Пусть KI ⊂ K = {K1,…,Kn} – подмножество Ī, т.е. группа критериев с номерами I = {i1,…,im} из множества {1,…,n}. Обозначим через Ī множество {1,…,n}\I, тогда – множество всех критериев, не вошедших в I. Векторную оценку x будем записывать в виде (xI,xĪ).

Говорят, что критерии KIне зависят по предпочтению от критериев KĪ, если предпочтения для любых двух векторных оценок x = (xI,xĪ) и x’ = (xI’,xĪ), содержащих одинаковые компоненты с номерами из Ī, не зависят от самих значений этих компонент.

Пример 4.1. Поясним введенные обозначения. Пусть n=5, I={1,3,4}, Ī={2,5}.

x = (7,1,2,8,2) = (xI,xĪ), где xI = (7,2,8),xĪ = (1,2).

y = (4,1,8,3,2) = (yI,yĪ), где yI = (4,8,3), yĪ= (1,2).

Таким образом, xĪ = yĪ.

Если критерии KI не зависят по предпочтению от критериев KĪ и векторная оценка x предпочтительнее, чем векторная оценка y, то и, например, векторная оценка x1 = (7,4,2,8,5) будет предпочтительнее, чем y1 = (4,4,8,3,5), потому что их значения по критериям из группы KI совпадают с соответствующими значениями оценок x и y, а оценки по остальным критериям одинаковые. Таким образом, вместо xĪ=yĪ=(1,2) можно подставить любую оценку (a,b) и предпочтение сохранится: (7,a,2,8,b) предпочтительнее, чем (4,a,8,3,b).

Пример 4.2. Поясним понятие зависимости критериев на следующем примере. Рассмотрим задачу принятия решения, в которой лицом, принимающим решения, является группа туристов-байдарочников. Их цель – выбрать место для стоянки. Они оценивают место предстоящей стоянки по трем критериям: К1 – наличие дров (шкала критерия {«много», «мало»}), К2 – качество места для купания (шкала критерия {«хорошее», «плохое»}), К3 – наличие комаров (шкала критерия {«много», «мало»}). В этом примере множество критериев {K1,K2} зависит от оставшихся критериев, т.е. от множества {K3}, т.к. вполне вероятно, что вариант с векторной оценкой x=(«много», «плохое», «много») окажется предпочтительнее варианта с векторной оценкой y=(«мало», «хорошее», «много»), т.к. наличие большого количества комаров обесценивает качество купания и добавляет весомости критерию «наличие дров». Однако если значение оценки по критерию K3 изменится, то скорее всего, изменятся и предпочтения ЛПР – вариант с векторной оценкой y’=(«мало», «хорошее», «мало») окажется предпочтительнее варианта с векторной оценкой x’=(«много», «плохое», «мало»). Чтобы добиться независимости критериев необходимо иначе их сформулировать. Критерий K2 сформулируем как «возможность комфортного купания». Тогда критерии будут независимы.

Критерии K1,…,Kn такие, что любой набор KI из них не зависит по предпочтению от остальных критериев KĪ, называются взаимно независимыми по предпочтению.

Теорема Дебре (критерий существования аддитивной функции полезности). Функция полезности может быть задана в аддитивном виде (4.1) тогда и только тогда, когда критерии K1,…,Kn взаимно независимы по предпочтению (при n≥ 3).

При n=2 кроме взаимной независимости критериев требуется выполнение условия соответственных замещений (при n≥ 3 оно выполняется автоматически): Для любых x1, x2, y1, y2, a, b, c, d, если (x1, x2) I (x1-a, x2+b) и (x1, y2) I (x1-a, y2+c), то (y1, x2) I (y1-d, x2+b) и (y1, y2) I (y1-d, y2+c). То есть если увеличение на b и c разных значений x2 и y2 критерия K2 при некотором опорном значении x1 критерия K1 компенсируется одним и тем же уменьшением этого значения x1 критерия K1, то такие же увеличения b и c тех же значений x2 и y2 критерия K2 сохраняются и при любом другом опорном значении y1 критерия K1 (см. рис. 4.1).

Рис. 4.1. Условие соответственных замещений.

                                                                                                        

                                                                                                                Рис.4.1. Условие соответственных замещений

Как осуществляется проверка взаимной независимости критериев по предпочтению?

Непосредственно по определению проверить независимость критериев затруднительно, т.к. даже при небольших n возникает большое число наборов критериев, которые надо сравнить. Однако результаты, полученные Леонтьевым и Горманом, позволяют существенно облегчить проверку. Сформулируем один из них.

Утверждение (Леонтьев-Горман). Если любая пара критериев {Ki, Kj} не зависит по предпочтению от остальных (n-2) критериев, то все критерии K1,…,Kn взаимно независимы по предпочтению.

Таким образом, проверка сводится к установлению независимости только каждой из пар критериев от всех остальных критериев.

На практике для проверки на независимость по предпочтению наборов KI и KĪ можно поступить следующим образом. Берём набор xĪ+ наилучших (явно хороших) значений KĪ и подбираем (запрашиваем у ЛПР) два разных набора xI' и xI'' таких, что (xI', xĪ+) I (xI'', xĪ+). Затем берём набор xĪ– самых плохих оценок и спрашиваем у ЛПР, сохранилось ли безразличие (xI', xĪ) I (xI'', xĪ). Если нет, то критерии KI зависят от критериев KĪ. Если да, повторяем процедуру еще для некоторых других xI' и xI''. Если по-прежнему безразличие имеет место, задаём вопрос в общем виде (сохранится ли безразличие при любых наборах). Если да, то наборы критериев KI и KĪ независимы.

Рассмотрим два метода построения аддитивной функции полезности для n=2.

1. Шаговый метод совместного шкалирования

Пусть условие соответственных замещений выполнено. Функцию ценности в соответствии с теоремой Дебре будем искать в виде

                                                                                                                        f(x1 ,x2 ) = f1 (x1 ) + f2 (x2 ).

Обозначим диапазоны изменения оценок x1 и x2: x1* ≤ x1 ≤ x1*, x2* ≤ x2 ≤ x2*.

Полагаем f(x1*,x2*) = f1(x1*) = f2(x2*) = 0 (начало отсчета).

Берем любое значение x11 > x1*, достаточно близкое к нему. Устанавливаем f1(x11) = 1 (единица измерения).

От ЛПР требуем указать значение x21 такое, что (x11, x2*) I (x1*, x21), для этого значения также f1(x21) = 1.

Затем у ЛПР запрашиваем значения x12 и x22такие, что:

(x12, x2*) I (x11, x21) I (x1*, x22).

f(x11,x21) = 1+1 = 2 ⇒ f1(x12) = f2(x22) = 2.

Такая процедура оправдана, поскольку выполняются условия соответственных замещений.

Далее у ЛПР запрашиваем значения x13 и x23 такие, что:

                                                                                                        (x13, x2*) I (x12, x21) I (x11, x22) I (x1*, x23) ⇒ f1(x13) = f2(x23) = 3.
Продолжив этот процесс, получаем наборы значений f2(x2*), f1(x11), f1(x12), f1(x13)… и f2(x2*), f2(x21), f2(x22), f1(x23)…, по которым с помощью интерполяции строятся функции f1(x) и f2(x).

2. Метод половинного деления по ценности

Метод позволяет находить функцию полезности в виде f(x1 ,x2 ) = α1 f1 (x1 )+α2 f2 (x2 ), α1 >0, α2 >0, α12 =1.

Положим f1(x1*) = f2(x2*) = 0, f1(x1*) = f2(x2*) = 1

Построим функцию f1.

ЛПР просим указать среднюю по полезности оценку x10.5 ∈ [x1*; x1*], то есть такую, что изменение полезности на [x1*; x10.5] равно изменению полезности на [x110.5; x1*]. Устанавливаем f1(x10.5) = 0,5.

Далее аналогично получаем x10.25 ∈ [x1*; x110.5], для которой устанавливаем f1(x10.25) = 0,25 и x10.75 ∈ [x105; x1*] , для которой устанавливаем f1(x10.75) = 0,75 и т.д.

С помощью интерполяции восстанавливаем функцию f1 по её значениям в точках x10.5, x10.25, x10.75 и т.д.

Функция f2 строится аналогично.

Для нахождения весового коэффициента α1 достаточно запросить у ЛПР пару одинаковых по предпочтительности оценок (x1', x2') I (x1'', x2’’). Тогда f(x1’,x2’) = f(x1’’,x2’’), следовательно, α1f1(x1’)+(1- α1)f2(x2’) = α1f1(x1’’)+(1-α1)f2(x2’’), а из этого равенства уже можно выразить α1 и α2 = 1 – α1.


Аксиоматическая теория важности критериев

В качестве примера аксиоматического метода, не использующего понятие функции полезности, рассмотрим аксиоматическую теорию важности критериев.

Рассмотрим многокритериальную модель, в которой каждый вариант s представляется его векторной оценкой x=(x1,...,xn), где числоxi – оценка варианта по критерию Ki ,n – количество критериев. Будем считать, что критерии Ki,...,Kn однородны, то есть имеют общую шкалу.

ЛПР, как правило, имеет определенные представления о сравнительной важности критериев K1,...,Kn . Эта информация Ω составляется из сообщений о равноценности и превосходстве в важности критериев. Точный смысл этих понятий дается следующими определениями, в которых через xr,t обозначена векторная оценка, полу¬ченная из x перестановкой компонент xr и xt (например, если x =(5,3,2,4), то x1,3 =(2,3,5,4)):

- критерии Kr и Kt равноценны (это – сообщение Kr˜ Kt или же Kt ˜ Kr ) означает, что всякие две векторные оценки x и xr,t одинаковы по предпочтительности;

- критерий Kr, важнее, чем Kt (это – сообщение Kr> Kt ) означает, что векторная оценка x , у которой xr > xt , предпочтительнее, чем y=xr,t .

Таким образом, сообщение ω0 о равноценности критериев Kr и Kt задает на n -мерном числовом пространстве Rn симметричное отношение безразличия
                                                                                                                                  Iω1: xIω1y ⇔ y=xr,t ,
а сообщение ω2 о превосходстве в важности Kr над Kt – асимметричное отношение предпочтения
                                                                                                                        Pω2:xPω2y ⇔ y=xr,t, xr xt

Говорят, что множество Ω информационных сообщений типа Ω12 о сравнительной важности критериев непротиворечиво, если для каждой пары критериев Kr,Kt оно содержит не более одного сообщения из трех: Kr ˜ Kt , Kr > Kt или Kt > Kr .

Набор Ω информационных сообщений типа ω12 о сравнительной важности критериев порождает отношение нестрогого предпочтения RΩ , определяемое как транзитивное замыкание объединения отношений Iω и Pω для всех ω∈Ω и отношения Парето R0
                                                                                                                        RΩ= Rt[∪ ω∈Ω Rω∈R0]
(здесь символом обозначена операция транзитивного замыкания бинарного отношения,Rω=Pω ∪ Iω,Pω1=Iω2= ∅ ). Согласно этому определению, xRΩy выполняется тогда и только тогда, когда существуют гипотетические варианты с векторными оценками z(i), i=1,...,k , такие, что
                                                                                                                      x=z(0)R(1)z(1)...z(k-1)R(K+1)y,        (4.1)
где каждое R(j) есть Rω(ij) для некоторого ω(ij)∈ Ω или R0 , причем xIΩy (xPΩy ) тогда и только тогда, когда все R(j) суть Iω(ij) или I0 (хотя бы одно R(j) есть Pω(ij) или P0 ). Цепочку вида (4.1) называют опорной цепочкой от x к y , а число k – ее длиной. ~f

Пример 4.3. Рассмотрим две векторные оценки x=(4, 5, 3, 2) и y=(3, 2, 4, 5). Покажем, что, если на множестве критериев K={K1, K2, K3, K4} предпочтения ЛПР описываются информацией Ω={K1≻K2, K2∼K3, K3≻K4}, то xRΩy.

Для этого построим опорную цепочку вида (4.1) от x к y. Рассмотрим гипотетический вариант с векторной оценкой z(1)=x2,3 =(4,3,5,2), тогда z(0)=xIf2 ∼ f3. Аналогично z(2= x1,2=(3,4,5,2), z(1) pf2 > f3 z2. Аналогично z3= x3,4=(3,4,2,5,), z(2) pf3> f4 z3. Аналогично z(4)=x2,3 =(3,2,4,5), z3If2 ˜ f3 z4=y.

Информация Ω о сравнительной важности критериев K1,...,Kn задает на множестве {K1,...,Kn } бинарное отношение Q, состоящее из пар Ki ,Kj и Kj,Ki для информационных сообщений типа ω1= Ki ˜ Kj и пар Ki ,Kj для сообщений типа ω2 =Ki > Kj . Отношение Q является отношением предпочтения на множестве критериев. Тогда отношению RΩ= Tr[∪ ω ∈ ΩRω∪ R0] однозначно соответствует расширенный набор сообщений, кото¬рый обозначим Ω^ . Если Ω=Ω^ , то будем говорить, что информация Ω является полной. Если информация Ω не полна и содержит сообщения только типа ω1 , то легко проверить, что в этом случае RΩ=RΩ^ , если же имеются также сообщения типа ω2 , то можно утверждать только, что RΩ⊆ RΩ^ . Однако, транзитивность отношений предпочтения (в данном случае – отношения предпочтения на множестве критериев) в теории принятия индивидуальных решений по ряду известных соображений связывают с рациональностью поведения. В связи с этим расширим определение RΩ так, чтобы отношения для неполной и полной информации совпадали:

                                                                                                                 RΩ= Tr[∪ ω ∈ ΩRω∪ R0]

Пример 4.4. Дополним информацию Ω из примера 4.3 так, чтобы отношение предпочтения Q на множестве критериев было полным: Ω^ ={K1≻K2, K1≻K3, K1≻K4, K2∼K3, K2≻K4, K3≻K4}. В этом случае для проверки того, что xRΩy можно указать более короткую опорную цепочку:

                                                                                        x=(4, 5, 3, 2)pk1 > k3 z(1)=(3, 5, 4, 2) pk1 > k3 (3, 2, 4, 5) =y.

Для случаев когда информация Ω отвечает определенным требованиям известны результаты, позволяющие осуществлять проверку условия xRΩy , не прибегая к построению опорных цепочек (4.1) [12]. Сформулируем один из таких результатов.

Для задач с равноважными критериями (т.е. для задач, в которых информация Ω такова, что всякие два критерия равноважны) справедливо следующее утверждение. Пусть ψ(x) – вектор-функция, располагающая в порядке убывания все компоненты вектора x так, что ψ1(x)=max xi и ψn(x)=min xψi .

Tеорема 4.1. Если критерии K1,...,Kn равноваж¬ны, то xRΩ y(xPΩy,xIΩy) тогда и только тогда, когда ψ(x)R0 ψ(y) (соответственно ψ(x)P0 ψ(y) , ψ(x)I0 ψ(y) )).

Пример 4.5. Рассмотрим две векторные оценки x=(4, 5, 3, 2) и y=(3, 2, 4, 5). Покажем, что, если K1∼K2∼K3∼Ki4, то xIΩy. В самом деле ψ(x)= ψ(y)=(5, 4, 3, 2), то есть ψ(x)I0ψ(y) , следовательноxIΩy .

Опишем алгоритм сравнения пары вариантов по отношению RΩ , то есть проверки справедливости условия xRΩ y. Он основан на переборе опорных цепочек вида
                                                                                                                        x=z0R(1)z(1)...z(k-1)R(k)R0y,          (4.2)
где z(i+1) получается из z(i) с помощью перестановки (r t), если R(i+1) есть Iω для ω=Kr∼Kt, и если R(i+1) есть Pω для ω=Kr≻Kt при условии Zr(i) > Zt(i)

Нетрудно видеть, что для данной пары векторных оценок x, y опорная цепочка вида (4.2) существует тогда и только тогда, когда существует опорная цепочка вида (4.1). Действительно, опорная цепочка (4.2) является частным случаем опорной цепочки (4.1). С другой стороны, по опорной цепочке (4.1) можно построить опорную цепочку вида (4.2), включая в нее лишь те R(i), которые являются Iω или Pω , и последовательно совершая в векторной оценке соответствующие перестановки компонент.

Построим непротиворечивое множество Ω^={ω1, … , ωl^} , состоящее из сообщений множества Ω и сообщений, получающихся из них из соображений транзитивности отношения предпочтения на множестве критериев.

Перебор осуществляется среди опорных цепочек вида (4.2), длины не более чем n(n-2)/2, в которых каждое Rω есть Rω для некоторого ω∈Ω^ . Обоснование такому ограничению перебора дается в [13].

Очевидно, что все возможные опорные цепочки вида (4.2) можно получить, осуществляя обход дерева, изображенного на рисунке 4.1, и осуществляя в векторной оценке x последовательно соответствующие перестановки компонент, соответствующих вершинам-сообщениям дерева, составляющим цепь от корневой вершины до текущей. Очевидно также, что если в ходе построения одной из опорных цепочек получена векторная оценка zI, совпадающая с векторной оценкой z(i), i<I, то дальнейшее построение этой опорной цепочки проводить бессмысленно, так как те же векторные оценки могут быть получены из векторной оценки z(i). В соответствии с этим построен алгоритм.

Алгоритм 4.1. Проверка условия xRΩy

Шаг 1. Корень дерева ω назначить текущей вершиной. Текущей вершине поставить в соответствие векторную оценку x.

Шаг 2. Сделать шаг левостороннего обхода дерева и назначить очередную вершину текущей. Если обход закончен, то выполнить шаг 6. Если текущей вершиной является вершина ω'i (то есть, сообщение о r-том и t-том критерии), то поставить в соответствие текущей вершине векторную оценку с переставленными r-той и t-той компонентами по сравнению с векторной оценкой, соответствующей родительской вершине.

Шаг 3. Если ω'i =Kr≻Kt и r-тая компонента текущей векторной оценки меньше t-той компоненты, то сделать текущую вершину концевой и перейти к шагу 2.

Шаг 4. Если текущая векторная оценка равна одной из оценок, соответствующих вершинам ветви дерева от корня до родительской вершины текущей вершины, то сделать текущую вершину концевой и перейти к шагу 2.

Шаг 5. Если векторная оценка, соответствующая текущей вершине, превосходит по отношению Парето оценку y, то xRΩy и опорной цепочкой является список соответствующих вершинам дерева от корня до текущей вершины векторных оценок (конец), иначе перейти к шагу 2.

Шаг 6. xRΩy не верно, конец.

                                                

                                                                                                                  Рис 4.1. Дерево алгоритма