В теории принятия решений рассматриваются сложные ситуации, для которых характерно по крайней мере одно из условий – наличие случайных или неопределенных факторов, многокритериальность, необходимость учета мнений нескольких лиц с несовпадающими интересами.
Одно из важнейших исходных положений теории принятия решений состоит в том, что в перечисленных случаях не существует оптимального в каком-то абсолютном смысле решения, а можно говорить лишь о «лучших» или «оптимальных» решениях с точки зрения данного ЛПР с его системой предпочтений. Поэтому, чтобы найти оптимальное решение формальными средствами, необходимо построить модель предпочтений, адекватную истинным предпочтениям ЛПР.
В этом состоит отличие теории принятия решений от оптимизационных постановок задач, рассматриваемых в теории оптимального управления, математического программирования, комбинаторной оптимизации и других областях математики. В этих задачах основанием для выбора служит уже «готовая» целевая функция, являющаяся мерой качества варианта.
Процесс принятия решения включает:
1. Определение целей, с которыми будет осуществляться предстоящее действие, т.е. осознание того, чего ЛПР хочет достичь.
2. Выбор наиболее предпочтительного («наилучшего», «оптимального» и т.п.) варианта действий, ведущих к достижению поставленных целей.
3. Реализация выбранного варианта действий (решения).
Теория принятия решений может быть применена для реализации второго этапа этого процесса. Знание теории принятия решений поможет ЛПР и на первом этапе грамотно сформулировать цели. Третий этап выходит за рамки математической теории принятия решений.
Сформулируем модель проблемной ситуации, то есть постановку задачи принятия решений (ЗПР). Обычно в ней выделяют следующие элементы:
S – множество вариантов s действий, ведущих в той или иной степени к достижению поставленной цели, называемых вариантами решения задачи, стратегиями или альтернативами.
G – множество последствий g реализации каждой из стратегий, называемых исходами.
Λ – множество возможных значений неопределенного фактора – описание среды ЗПР, т.е. тех факторов, которые влияют на получение того или иного исхода при реализации той или иной стратегии. При этом каждый исход g представляется как функция от выбранной стратегии s и значения неопределенного фактора λ: g = ψ(s,λ).
p – описание системы предпочтений ЛПР. В общем случае ЛПР имеет систему предпочтений на множестве исходов G. В некоторых случаях, при условии, что неопределенные факторы λ отсутствуют, можно рассматривать систему предпочтений ЛПР непосредственно на множестве вариантов S.
ς – вся остальная информация о проблемной ситуации, представленная в формализованном виде. Например, это может быть информация о важности критериев, об отношении ЛПР к риску и т.п.
d – требуемое действие на множестве S, например: выделить лучший вариант s*, выделить подмножество S* лучших вариантов, ранжировать варианты, классифицировать варианты из S и
т.п. Как правило, будем рассматривать задачу выделения из S подмножества лучших вариантов. Таким образом, ЗПР можно сформулировать так: дано: D = S, G, p, Λ, ψ, ς
Требуется определить: d
Пример 1.1. Покупка цифрового фотоаппарата.
ЛПР – покупатель. Каждая стратегия s в этой задаче будет выглядеть так:
«Купить фотоаппарат модели X». Каждый исход g описывается набором свойств выбираемого фотоаппарата, степень выраженности которых можно охарактеризовать численными критериями: дороговизна (сумма в рублях), удобство пользования (оценка
по 10-балльной шкале), качество получаемых изображений (размер матрицы фотоаппарата в мегапикселях), zoom объектива (кратность), компактность (сумма измерений по длине, высоте и толщине). Система предпочтений ЛПР p будет описываться
набором тех из перечисленных выше критериев, которые важны для него. Неопределенным фактором λ в этой задаче можно считать, например, заводской брак при выпуске конкретного фотоаппарата. От ЛПР может быть получена также дополнительная
информация ς. Например, это может быть информация о сравнительной важности критериев («удобство важнее цены») или ограничения на их величину («размер матрицы не меньше, чем 4 Mpix», «не дороже 10 тысяч рублей»).
Требуемым действием d является выбор фотоаппарата для покупки из имеющегося ассортимента S.
На этом примере можно подчеркнуть еще одну характерную черту процесса принятия решения: чаще всего он носит итерационный характер. Покупку можно представить как последовательность ЗПР, в которой результат S* (множество
понравившихся фотоаппаратов) предыдущей задачи становится множеством исходных вариантов S для следующей задачи.
Пример 1.2. Прием абитуриентов в университет.
В числе других в приемную комиссию одного из факультетов университета подали документы абитуриенты Иванов и Петров. Необходимо решить, кого из них предпочтительнее принять на обучение.
Количество баллов, набранное абитуриентами на ЕГЭ:
Иванов: математика – 88, литература – 69.
Петров: математика – 63, литература – 92.
В этой задаче в роли ЛПР выступает приемная комиссия университета.
S = {s1, s2}. Стратегия s1 – принять Иванова, стратегия s2 – принять Петрова. Предпочтения ЛПР p описываются с помощью двух критериев – «оценка по математике» и «оценка по литературе».
Если никакой дополнительной информации ς нет, то выбор между Ивановым и Петровым представляется затруднительным. Если же известно, что документы были поданы на технический факультет,
то предпочтительнее стратегия s1. Если факультет является гуманитарным, то предпочтительнее стратегия s2. В этом примере информация ς формулируется в виде сообщения «оценка по математике важнее, чем оценка по литературе»
или «оценка по литературе важнее, чем оценка по математике».
Пример 1.3. Выбор стратегии поведения при изучении дисциплины «Х».
Студент в начале нового семестра решает, до какой степени усердно он будет изучать некоторый предмет «Х». Он выступает в роли ЛПР и рассматривает следующие стратегии поведения:
s1 – не посещать групповые занятия, не заниматься самостоятельно;
s2 – посещать, но не заниматься;
s3 – не посещать, но заниматься;
s4 – посещать, заниматься.
Исходы gi будут оцениваться по критериям К1 (оценка, полученная на экзамене) со шкалой {5,4,3,2,1}, где 1 – не сдал на пересдаче) и К2 (затраченные усилия) со шкалой {«много», «средне», «мало», «никаких»}.
При таких шкалах теоретически возможно 20 различных исходов (см. рис.1.1). При выборе определенной стратегии может наступить тот или иной исход с большей или меньшей вероятностью. Вероятность
получения оценки j при выборе стратегии si обозначена здесь pij. Случайные факторы λ, действующие в этом примере – это «удачный билет», настроение преподавателя, самочувствие и волнение студента и прочее. Хотя закономерного
при сдаче экзаменов больше – так, некоторые исходы практически не реализуемы, например, характеризуемые векторными оценками (5, «никаких») или (1,«много»). Значение критерия К2 (затраченные усилия) однозначно определяется
выбранной стратегией.
В основу классификации ЗПР могут быть положены различные признаки.
В зависимости от количества равноправных ЛПР различают:
а) задачи индивидуального принятия решения или выбора (имеется единственное ЛПР);
б) задачи группового принятия решения или выбора (имеется более одного ЛПР).
В зависимости от среды задачи Λ различают ЗПР:
а) в условиях определенности (неопределенные факторы λ отстутствуют);
б) в условиях риска (имеются случайные факторы λ с известными законами распределения вероятности Fλ(x) = P(λ<x));
в) в условиях неопределенности (имеются случайные факторы λ с неизвестными законами распределения);
г) в условиях противодействия (параметр λ характеризует активные действия противника).
В зависимости от количества критериев, используемых для оценки исходов, различают:
а) однокритериальные задачи (для описания предпочтений ЛПР используется единственный критерий);
б) многокритериальные задачи (для описания предпочтений ЛПР используется более одного критерия).
В зависимости от требований, предъявляемых к результату, различают задачи:
а) выбора единственного варианта;
б) выбора подмножества вариантов;
в) упорядочения вариантов;
г) классификации вариантов.
В процессе принятия решений наряду с ЛПР участвуют и другие лица. Владельцем проблемы называют человека, который, по мнению окружающих, должен ее решать и нести ответственность за принятые решения. Но это далеко не всегда означает, что владелец проблемы является также и ЛПР. Конечно, он может быть таковым, и практика дает нам многочисленные примеры совмещения этих двух ролей. Но бывают ситуации, когда владелец проблемы является лишь одним из нескольких человек, принимающих участие в ее решении. Иногда личности ЛПР и владельца проблемы просто не совпадают. Бывают семьи, в которых номинальный глава семьи ничего не решает. Точно так же некоторые руководители стремятся переложить на других принятие решений: глава фирмы полагается на своего заместителя, а президенты подписывают подготовленные другими (иногда противоречивые) распоряжения. Таким образом, владелец проблемы и ЛПР могут быть как одним человеком, так и разными личностями.
Третьей ролью, которую может играть человек в процессе принятия решений, является роль руководителя или участника активной группы — то есть группы людей, имеющих общие интересы и старающихся оказать влияние на процесс выбора и его результат.
Пример 1.4. При принятии решения о строительстве новой автомагистрали городские власти (ЛПР, а в идеале и владелец проблемы) должны учесть мнение следующих активных групп:
- автовладельцев, которые заинтересованы в новой трассе;
- дорожностроительных организаций, которым может достаться контракт;
- жителей близлежащих домов;
- людей, чья недвижимость пойдет под снос;
- экологических и природоохранных организаций и т.п.
Пример 1.5. В задаче о выборе стратегии поведения при изучении дисциплины «Х» (см. пример 1.3) активными группами, мнения которых необходимо учитывать, являются, например, родители
студента.
В процессе принятия решений человек может выступать в качестве эксперта, то есть профессионала в той или иной области, к которому обращаются за оценками и рекомендациями люди, включенные
в этот процесс.
Пример 1.6. В задаче о покупке цифрового фотоаппарата (см. пример 1.1) экспертом является продавец-консультант. Консультант должен выслушать пожелания покупателя, указать набор фотоаппаратов,
в наибольшей степени соответствующих этим пожеланиям, и классифицировать их с учетом параметра цена/качество.
Пример 1.7. В задаче о выборе стратегии поведения при изучении дисциплины «Х» (см. пример 1.3) в качестве экспертов могут выступать старшекурсники, которые уже сдали этот предмет.
Грамотный руководитель при принятии сложных решений привлекает к их разработке еще одного участника – консультанта по принятию решений. Его роль сводится к разумной организации процесса принятия решений, помощи ЛПР и владельцу проблемы в правильной постановке задачи, выявлении позиций активных групп, организации работы с экспертами. Консультант является специалистом в теории принятия решений. Он не обязан знать в совершенстве предметную область – он рекомендует методы принятия решения и, возможно, советует, каких экспертов привлечь.
Кроме того, в принятии решений неявно участвует окружение ЛПР, сотрудники той организации, от имени которой ЛПР принимает решения. Обычно эта группа людей имеет общие взгляды, общие ценностные установки. Именно этой группе ЛПР в первую очередь объясняет логичность, разумность, обоснованность своего решения. В связи с этим, хотя ЛПР и принимает индивидуальные решения, он учитывает политику и предпочтения данной группы лиц.
Набор правил или алгоритм, позволяющий находить подмножество S*⊆ S наилучших вариантов решений, называется принципом оптимальности. Математически принцип оптимальности задается
как отображение χ: S* = χ(D), где D – математическая модель проблемной ситуации, включающая S, G, P, Λ, ψ, ς. Принцип оптимальности формализует понятие «лучший вариант».
Примеры принципов оптимальности:
1. Простейший принцип оптимальности выражается формулой S* = {s*}, где s* – любой (произвольный) элемент множества S. Этот принцип оптимальности осуществляет случайный выбор. Таким принципом оптимальности руководствуется игрок в рулетку, полагаясь на удачу. Его также приходится применять в условиях дефицита времени, в ситуациях, когда принять хоть какое-то решение лучше, чем не принять никакого. Еще одним распространенным случаем применения этого принципа является ситуация, когда он является последним в последовательности применяемых принципов оптимальности. В этом случае вся имеющаяся информация использована на предыдущих этапах, все неподходящие стратегии отсеяны, оставшиеся сравнить невозможно – приходится выбирать любую.
2. Пусть предпочтения ЛПР удалось описать с помощью единственного критерия К, заданного на множестве. Критерий может максимизироваться (K(s)→max) и минимизироваться (K(s)→min). Если критерий K максимизируется, то исход s’ лучше, чем исход s’’ в смысле свойства, измеряемого критерием K, тогда и только тогда, когда K(s’)>K(s’’). Принцип оптимальности, основанный на максимизации значения критерия, выражается формулой S* = {s∈ S | K(s) = K*}, где K* = max K(s) по всем s∈ S.
3. Пусть исходы из S оцениваются по n критериям: K1, K2, …, Kn. Для определенности предположим, что все критерии максимизируются. Для таких постановок известны различные принципы оптимальности, в частности:
а) оптимальность по Парето: вариант s∈ S включается в множество S*, если не существует варианта t∈ S, такого, что Ki(t)≥ Ki(s) для всех i=1…n и Kj(t)> Kj(s) для некоторого j, 1≤j≤n
б) лексикографический принцип оптимальности: вариант s∈ S включается в множество S*, если значение критерия Ki для варианта s больше значений критерия Ki для
всех прочих вариантов t∈ S и при этом для всех критериев с номерами j=1,…,i - 1 выполняется Kj(s)≤Kj(t). Этот принцип оптимальности соответствует случаю, когда критерии упорядочены по важности в абсолютном смысле: первый
критерий – самый важный, второй критерий стоит рассматривать, только если имеется несколько вариантов, имеющих максимальную оценку по первому критерию, и т.д.
Замечание. Принципы оптимальности, приведенные в пп. а) и б), основаны на формировании бинарных отношениях предпочтения. Принцип оптимальности (а) – на отношении Парето, а принцип оптимальности (б) – на отношении лексикографического порядка (см. раздел «Бинарные отношения предпочтения и функция выбора» главы 2).