Рассмотрим теперь случай, когда в модели проблемной ситуации имеются случайные факторы λ∈Λ с известными законами распределения вероятностей.
В таких задачах связь между реализацией определенной стратегии s∈S и наступлением некоторого исхода g∈G неоднозначна: в зависимости от значения параметра λ, может наступить тот или иной исход, т.е. g = ψ(s,λ).
Пусть G = {g1,…,gn} – множество исходов, pi(s) – вероятность исхода gi при использовании стратегии s∈S.
Пусть исходы оцениваются по единственному критерию K(g) (предполагаем, что чем больше K(g), тем лучше), тогда K'(s) = K(ψ(s,λ)) – значение критерия при выборе стратегии s – является случайной величиной с законом распределения вероятностей: F(x,s) = P(K'(s)<x).
Теоретически мы можем построить R' – отношение стохастического доминирования: R' = { | F(x,s) ≤ F(x,t) ∀ x}. Таким образом, sR't ⇔ ∀x [ P(K'(s)<x) ≤ P(K'(t)<x) ], т.е. стратегия s доминирует стратегию t, если вероятность P того, что значение критерия K' при её выборе будет меньше некоторого произвольно заданного числа x, не превосходит такой вероятности в случае выбора t.
По R' можно построить P' – отношение строгого стохастического доминирования и I' – отношение стохастического безразличия, а дальше задача будет сводиться к нахождению множества S* максимальных по P' стратегий – так называемых недоминируемых стратегий.
Однако на практике отношение R' (и тем более P') содержит, как правило, очень малое число пар, поэтому такой принцип оптимальности будет очень слабым (будет отсеивать мало вариантов или вообще ничего не отсеивать).
Поэтому применяют другие принципы оптимальности, основанные на преобразовании K'(s) в числовую функцию, с помощью которой все стратегии сравниваются по предпочтительности и из них выбирается оптимальная. К ним относятся:
- принцип гарантированного результата (выбираем стратегии, дающие наилучшие значения К' при наихудшем λ);
- принцип среднего результата (выбираем стратегии, которые, в среднем, дают лучшее значение K'): M[K'(s)] → max;
- принцип кучности результата (выбираем стратегии, при которых дисперсия значений K' при разных λ минимальна): D[K'(s)] → min.
На практике закон распределения K'(s) и его характеристики (M[K'(s)] – математическое ожидание и D[K'(s)] – дисперсия) определяются опытным путем с использованием методов математической статистики.
Существуют и другие методы принятия решений в условиях риска. Они основаны на способах построения функции полезности, предложенных фон Нейманом и Моргенштерном [3].
При наличии случайных факторов в задаче принятия решений необходимо учитывать не только предпочтения ЛПР по отношению к различным исходам, но и его отношение, склонность к риску.
Пример 5.1. У ЛПР имеется возможность принять участие в одной из двух лотерей: l1, участвуя в которой, он выиграет 200 р. с вероятностью 0,9 или проиграет 800 р. с вероятностью 0,1; и l2, участвуя в которой, с вероятностью 0,9 он ничего не выиграет и не проиграет, а с вероятностью 0,1 выиграет 1000 р. В какой из них ему выгоднее участвовать?
Итак, g11 = 200, p1(g11) = 0,9, g12 = –800, p1(g12) = 0,1 в лотерее l1, g21 = 0, p2(g21) = 0,9, g22 = 1000, p2(g22) = 0,1.
m1 = p1(g11)*g11+p1(g12)*g12 = 200*0,9 + (–800)*0,1 = 100.
m2 = p2(g21)*g21+p2(g22)*g22 = 0*0,9 + 1000*0,1 = 100.
Таким образом, математические ожидания выигрышей m1 = m2, то есть эти лотереи одинаковы по принципу среднего результата.
Δ1 = |g12 – g11| = |–800–200| = 1000, Δ2 = |g22 – g21| = |1000–0| = 1000, т.е. разброс выигрышей в этих лотереях одинаковый.
D1 = (g11 – m1)2*p1(g11) + (g12 – m1)2*p1(g12) = (200–100)2*0,9+(–800–100)2*0,1 = 90000, D2 = (g21 – m2)2*p2(g21) + (g22 – m2)2*p2(g22) = (0–100)2*0,9+ +(1000–100)2*0,1 = 90000. Таким образом, дисперсии совпадают, то есть эти лотереи одинаковы и по принципу кучности.
Однако по содержательному смыслу эти лотереи совершенно различны: лотерея l2 беспроигрышная, но выигрывают в ней редко, зато внушительную сумму, а в лотерее l1 ЛПР скорее всего выиграет небольшую сумму, но может и проиграть, причем не мало. Таким образом, на первый план выходит задача выявления склонности ЛПР к риску.
Фон Нейманом и Моргенштерном сформулированы достаточно общие условия, при выполнении которых существует функция полезности f:G→R𝓡 такая, что: ξRη ⇔ Mξ[f] ≥ Mη[f], где R – отношение предпочтения, отражающее склонность ЛПР к риску, ξ и η – сравниваемые стратегии, а M – математическое ожидание.
В случае, когда множество исходов G = {g1,…,gn} конечно, стратегии ξ и η описываются векторами вероятностей (p1ξ,…,pnξ) и (p1η,…,pnη) соответственно, а математические ожидания функции полезности вычисляются по формулам: Mξ[f] = f(g1)*p1ξ +…+ f(gn)*pnξ, Mη[f] = f(g1)*p1η +…+ f(gn)*pnη.
Итак, при наличии функции полезности каждый исход g характеризуется некоторой полезностью f(g), каждая стратегия s – ожидаемой полезностью Ms[f], а решение задачи принятия решений следует искать в виде: Ms[f] → max.
Пару l=(G, p), включающую множество исходов G и вектор p=(p1,…,pn), где pi – вероятность наступления исхода gi при выборе стратегии s, в теории принятия решений называют лотереей, а сами исходы gi – выигрышами.
Лотерею удобно изображать графически.
Возможны случаи, когда исходом является другая лотерея, например:
При построении модели проблемной ситуации должна быть выявлена система предпочтений ЛПР и его склонность к риску, то есть должно быть построено отношение предпочтений R на множестве распределений вероятностей на G.
Человеку трудно сравнивать по предпочтению лотереи с большим числом исходов. ЛПР гораздо проще ответить на вопрос типа: при каком значении вероятности p ему безразлично: а) участвовать в лотерее l, в которой выигрыш g' будет получен с вероятностью p, а выигрыш g'' – с вероятностью (1-p), где g' предпочтительнее, чем g'', или б) получить без участия в лотерее выигрыш g''' такой, что g' предпочтительнее, чем g''', но g''' предпочтительнее, чем g''.
На основе ответов на вопросы такого типа можно сравнить по предпочтению любые две лотереи, а значит практически построить отношение R и соответствующую ему функцию полезности f при условии, что ЛПР допускает применение правил фон Неймана – Моргенштерна.
1) Правило замены: если в исходной лотерее один из выигрышей заменить на другой, равный по предпочтительности, то получим лотерею, равнопредпочтительную исходной;
2) Правило свертывания: одинаковы по предпочтительности лотереи l1 и l2,
2)где p = p1*π1 + p2*π2 + … + pn*πn.
Покажем, каким образом можно построить отношение R и функцию f, опираясь на правила (1) и (2). Предположим для простоты, что в G существует наиболее предпочтительный (наилучший) исход g* и наименее предпочтительный (наихудший) исход g*. Положим f(g*)=0 , f(g*)=1. Этим задается начало отсчета и масштаб измерений.
Лотерею lp с исходами g*, наступающим с вероятностью p, и g*, наступающим с вероятностью (1-p), назовем базовой.
Любой исход g∈G по предпочтительности лежит между g* и g*, так что можно указать вероятность p, при которой получение выигрыша g без лотереи эквивалентно участию в базовой лотерее lp. Примем f(g)=p – ожидаемая полезность от участия в lp равна p.
Тогда по правилу замены произвольную лотерею
можно представить в виде равнопредпочтительной ей лотереи
которая, в свою очередь, по правилу свертывания в силу p=p1*f(g1)+…+pn*f(gn) представляется в виде равнопредпочтительной ей базовой лотереи
Таким образом, для любой лотереи l можно найти равнопредпочтительную ей базовую лотерею lp, при этом Ml[f] = p1*f(g1) + … + pn*f(gn) = p.
Построенная таким образом функция полезности f позволяет сравнить по предпочтительности любые две лотереи. Действительно, для любых лотерей l' и l'' можно построить равнопредпочтительные им лотереи lp' и lp'' соответственно. Тогда (l' R l'') ⇔ (Ml'[f] ≥ Ml''[f]) ⇔ (p' ≥ p''), то есть из двух лотерей предпочтительнее та, для которой вероятность получения наилучшего исхода g* в базовой лотерее больше.
Достоверным эквивалентом лотереи l называется величина l^ такая, что f(l^)=Ml[f] (полезность l^ равна ожидаемой полезности l). Тo есть для ЛПР безразлично, получить l^ наверняка или участвовать в лотерее l.
Средним результатом лотереи l называется величина l, равная математическому ожиданию выигрыша.
Пусть исходы G={g,…,gn} оцениваются единственным количественным критерием K(gi) = xi, X=[x_,x- /i] – непрерывная шкала критерия эффективности K, а функция полезности f, построенная на ней, является монотонно возрастающей.
Характеристику отношения ЛПР к риску можно получить путем анализа его выбора среди альтернатив: принять участие в лотерее l с равновероятными исходами g* и g*, K(g*)=a, K(g*)=b или получить наверняка l =(a+b)/2.
ЛПР не склонен к риску, если для любой лотереи l f( l)>f(l^) (или l >l^, так как f монотонна).
ЛПР безразличен к риску, если для любой лотереи l f(l )=f(l^) (или l=l^).
ЛПР склонен к риску, если для любой лотереи l f( l)
Для ЛПР безразличного к риску функция полезности линейна, значит можно обоснованно применять принцип среднего результата. В серьезных ситуациях большинство людей не склонны к риску.
Если выявлено отношение ЛПР к риску, то на практике можно построить функцию полезности по методу пяти точек [2].
Пусть K(g)∈[x_,x- ].
Для x0=x_, x1=x- положим f(x0 )=0, f(x1 )=1. Этим устанавливается начало отсчета и масштаб измерения функции полезности.
Просим ЛПР указать достоверный эквивалент x0,5 лотереи с равновероятными исходами x0 и x1 . Согласно определению f(x0,5 )=0,5.
Просим ЛПР указать достоверный эквивалент x0,25 лотереи с равновероятными исходами x0 и x0,5 , f(x0,25 )=0,25.
Просим ЛПР указать достоверный эквивалент x0,75 лотереи с равновероятными исходами x0,5 и x1 , f(x0,75 )=0,75.
Поскольку x0,5 должен быть достоверным эквивалентом лотереи с равновероятными исходами x0,25 и x0,75 то проверяем это, и, в случае необходимости, корректируем результаты.
Строим график f(x) интерполяцией по полученным точкам, учитывая вид кривой в зависимости от отношения ЛПР к риску.