Моделирование проблемной ситуации

Общие положения

В теории принятия решений рассматриваются сложные ситуации, для которых характерно по крайней мере одно из условий – наличие случайных или неопределенных факторов, многокритериальность, необходимость учета мнений нескольких лиц с несовпадающими интересами.

Одно из важнейших исходных положений теории принятия решений состоит в том, что в перечисленных случаях не существует оптимального в каком-то абсолютном смысле решения, а можно говорить лишь о «лучших» или «оптимальных» решениях с точки зрения данного ЛПР с его системой предпочтений. Поэтому, чтобы найти оптимальное решение формальными средствами, необходимо построить модель предпочтений, адекватную истинным предпочтениям ЛПР.

В этом состоит отличие теории принятия решений от оптимизационных постановок задач, рассматриваемых в теории оптимального управления, математического программирования, комбинаторной оптимизации и других областях математики. В этих задачах основанием для выбора служит уже «готовая» целевая функция, являющаяся мерой качества варианта.

Процесс принятия решения включает:

1. Определение целей, с которыми будет осуществляться предстоящее действие, т.е. осознание того, чего ЛПР хочет достичь.

2. Выбор наиболее предпочтительного («наилучшего», «оптимального» и т.п.) варианта действий, ведущих к достижению поставленных целей.

3. Реализация выбранного варианта действий (решения).

Теория принятия решений может быть применена для реализации второго этапа этого процесса. Знание теории принятия решений поможет ЛПР и на первом этапе грамотно сформулировать цели. Третий этап выходит за рамки математической теории принятия решений.


Постановка задачи принятия решений

Сформулируем модель проблемной ситуации, то есть постановку задачи принятия решений (ЗПР). Обычно в ней выделяют следующие элементы:

S – множество вариантов s действий, ведущих в той или иной степени к достижению поставленной цели, называемых вариантами решения задачи, стратегиями или альтернативами.

G – множество последствий g реализации каждой из стратегий, называемых исходами.

Λ – множество возможных значений неопределенного фактора – описание среды ЗПР, т.е. тех факторов, которые влияют на получение того или иного исхода при реализации той или иной стратегии. При этом каждый исход g представляется как функция от выбранной стратегии s и значения неопределенного фактора λ: g = ψ(s,λ).

p – описание системы предпочтений ЛПР. В общем случае ЛПР имеет систему предпочтений на множестве исходов G. В некоторых случаях, при условии, что неопределенные факторы λ отсутствуют, можно рассматривать систему предпочтений ЛПР непосредственно на множестве вариантов S.

ς – вся остальная информация о проблемной ситуации, представленная в формализованном виде. Например, это может быть информация о важности критериев, об отношении ЛПР к риску и т.п.

d – требуемое действие на множестве S, например: выделить лучший вариант s*, выделить подмножество S* лучших вариантов, ранжировать варианты, классифицировать варианты из S и т.п. Как правило, будем рассматривать задачу выделения из S подмножества лучших вариантов. Таким образом, ЗПР можно сформулировать так: дано: D = S, G, p, Λ, ψ, ς
Требуется определить: d


Примеры проблемных ситуаций

Пример 1.1. Покупка цифрового фотоаппарата.

ЛПР – покупатель. Каждая стратегия s в этой задаче будет выглядеть так:
«Купить фотоаппарат модели X». Каждый исход g описывается набором свойств выбираемого фотоаппарата, степень выраженности которых можно охарактеризовать численными критериями: дороговизна (сумма в рублях), удобство пользования (оценка по 10-балльной шкале), качество получаемых изображений (размер матрицы фотоаппарата в мегапикселях), zoom объектива (кратность), компактность (сумма измерений по длине, высоте и толщине). Система предпочтений ЛПР p будет описываться набором тех из перечисленных выше критериев, которые важны для него. Неопределенным фактором λ в этой задаче можно считать, например, заводской брак при выпуске конкретного фотоаппарата. От ЛПР может быть получена также дополнительная информация ς. Например, это может быть информация о сравнительной важности критериев («удобство важнее цены») или ограничения на их величину («размер матрицы не меньше, чем 4 Mpix», «не дороже 10 тысяч рублей»).

Требуемым действием d является выбор фотоаппарата для покупки из имеющегося ассортимента S.

На этом примере можно подчеркнуть еще одну характерную черту процесса принятия решения: чаще всего он носит итерационный характер. Покупку можно представить как последовательность ЗПР, в которой результат S* (множество понравившихся фотоаппаратов) предыдущей задачи становится множеством исходных вариантов S для следующей задачи.

Пример 1.2. Прием абитуриентов в университет.

В числе других в приемную комиссию одного из факультетов университета подали документы абитуриенты Иванов и Петров. Необходимо решить, кого из них предпочтительнее принять на обучение.

Количество баллов, набранное абитуриентами на ЕГЭ:

Иванов: математика – 88, литература – 69.

Петров: математика – 63, литература – 92.

В этой задаче в роли ЛПР выступает приемная комиссия университета.

S = {s1, s2}. Стратегия s1 – принять Иванова, стратегия s2 – принять Петрова. Предпочтения ЛПР p описываются с помощью двух критериев – «оценка по математике» и «оценка по литературе».

Если никакой дополнительной информации ς нет, то выбор между Ивановым и Петровым представляется затруднительным. Если же известно, что документы были поданы на технический факультет, то предпочтительнее стратегия s1. Если факультет является гуманитарным, то предпочтительнее стратегия s2. В этом примере информация ς формулируется в виде сообщения «оценка по математике важнее, чем оценка по литературе» или «оценка по литературе важнее, чем оценка по математике».

Пример 1.3. Выбор стратегии поведения при изучении дисциплины «Х».

Студент в начале нового семестра решает, до какой степени усердно он будет изучать некоторый предмет «Х». Он выступает в роли ЛПР и рассматривает следующие стратегии поведения:

s1 – не посещать групповые занятия, не заниматься самостоятельно;

s2 – посещать, но не заниматься;

s3 – не посещать, но заниматься;

s4 – посещать, заниматься.

Исходы gi будут оцениваться по критериям К1 (оценка, полученная на экзамене) со шкалой {5,4,3,2,1}, где 1 – не сдал на пересдаче) и К2 (затраченные усилия) со шкалой {«много», «средне», «мало», «никаких»}.

При таких шкалах теоретически возможно 20 различных исходов (см. рис.1.1). При выборе определенной стратегии может наступить тот или иной исход с большей или меньшей вероятностью. Вероятность получения оценки j при выборе стратегии si обозначена здесь pij. Случайные факторы λ, действующие в этом примере – это «удачный билет», настроение преподавателя, самочувствие и волнение студента и прочее. Хотя закономерного при сдаче экзаменов больше – так, некоторые исходы практически не реализуемы, например, характеризуемые векторными оценками (5, «никаких») или (1,«много»). Значение критерия К2 (затраченные усилия) однозначно определяется выбранной стратегией.

Рис.1.1. Возможные исходы

Классификация задач принятия решения

В основу классификации ЗПР могут быть положены различные признаки.

В зависимости от количества равноправных ЛПР различают:

а) задачи индивидуального принятия решения или выбора (имеется единственное ЛПР);

б) задачи группового принятия решения или выбора (имеется более одного ЛПР).

В зависимости от среды задачи Λ различают ЗПР:

а) в условиях определенности (неопределенные факторы λ отстутствуют);

б) в условиях риска (имеются случайные факторы λ с известными законами распределения вероятности Fλ(x) = P(λ<x));

в) в условиях неопределенности (имеются случайные факторы λ с неизвестными законами распределения);

г) в условиях противодействия (параметр λ характеризует активные действия противника).

В зависимости от количества критериев, используемых для оценки исходов, различают:

а) однокритериальные задачи (для описания предпочтений ЛПР используется единственный критерий);

б) многокритериальные задачи (для описания предпочтений ЛПР используется более одного критерия).

В зависимости от требований, предъявляемых к результату, различают задачи:

а) выбора единственного варианта;

б) выбора подмножества вариантов;

в) упорядочения вариантов;

г) классификации вариантов.


Участники процесса принятия решений

В процессе принятия решений наряду с ЛПР участвуют и другие лица. Владельцем проблемы называют человека, который, по мнению окружающих, должен ее решать и нести ответственность за принятые решения. Но это далеко не всегда означает, что владелец проблемы является также и ЛПР. Конечно, он может быть таковым, и практика дает нам многочисленные примеры совмещения этих двух ролей. Но бывают ситуации, когда владелец проблемы является лишь одним из нескольких человек, принимающих участие в ее решении. Иногда личности ЛПР и владельца проблемы просто не совпадают. Бывают семьи, в которых номинальный глава семьи ничего не решает. Точно так же некоторые руководители стремятся переложить на других принятие решений: глава фирмы полагается на своего заместителя, а президенты подписывают подготовленные другими (иногда противоречивые) распоряжения. Таким образом, владелец проблемы и ЛПР могут быть как одним человеком, так и разными личностями.

Третьей ролью, которую может играть человек в процессе принятия решений, является роль руководителя или участника активной группы — то есть группы людей, имеющих общие интересы и старающихся оказать влияние на процесс выбора и его результат.

Пример 1.4. При принятии решения о строительстве новой автомагистрали городские власти (ЛПР, а в идеале и владелец проблемы) должны учесть мнение следующих активных групп:

- автовладельцев, которые заинтересованы в новой трассе;

- дорожностроительных организаций, которым может достаться контракт;

- жителей близлежащих домов;

- людей, чья недвижимость пойдет под снос;

- экологических и природоохранных организаций и т.п.

Пример 1.5. В задаче о выборе стратегии поведения при изучении дисциплины «Х» (см. пример 1.3) активными группами, мнения которых необходимо учитывать, являются, например, родители студента.

В процессе принятия решений человек может выступать в качестве эксперта, то есть профессионала в той или иной области, к которому обращаются за оценками и рекомендациями люди, включенные в этот процесс.

Пример 1.6. В задаче о покупке цифрового фотоаппарата (см. пример 1.1) экспертом является продавец-консультант. Консультант должен выслушать пожелания покупателя, указать набор фотоаппаратов, в наибольшей степени соответствующих этим пожеланиям, и классифицировать их с учетом параметра цена/качество.

Пример 1.7. В задаче о выборе стратегии поведения при изучении дисциплины «Х» (см. пример 1.3) в качестве экспертов могут выступать старшекурсники, которые уже сдали этот предмет.

Грамотный руководитель при принятии сложных решений привлекает к их разработке еще одного участника – консультанта по принятию решений. Его роль сводится к разумной организации процесса принятия решений, помощи ЛПР и владельцу проблемы в правильной постановке задачи, выявлении позиций активных групп, организации работы с экспертами. Консультант является специалистом в теории принятия решений. Он не обязан знать в совершенстве предметную область – он рекомендует методы принятия решения и, возможно, советует, каких экспертов привлечь.

Кроме того, в принятии решений неявно участвует окружение ЛПР, сотрудники той организации, от имени которой ЛПР принимает решения. Обычно эта группа людей имеет общие взгляды, общие ценностные установки. Именно этой группе ЛПР в первую очередь объясняет логичность, разумность, обоснованность своего решения. В связи с этим, хотя ЛПР и принимает индивидуальные решения, он учитывает политику и предпочтения данной группы лиц.


Принципы оптимальности

Набор правил или алгоритм, позволяющий находить подмножество S*⊆ S наилучших вариантов решений, называется принципом оптимальности. Математически принцип оптимальности задается как отображение χ: S* = χ(D), где D – математическая модель проблемной ситуации, включающая S, G, P, Λ, ψ, ς. Принцип оптимальности формализует понятие «лучший вариант».

Примеры принципов оптимальности:

1. Простейший принцип оптимальности выражается формулой S* = {s*}, где s* – любой (произвольный) элемент множества S. Этот принцип оптимальности осуществляет случайный выбор. Таким принципом оптимальности руководствуется игрок в рулетку, полагаясь на удачу. Его также приходится применять в условиях дефицита времени, в ситуациях, когда принять хоть какое-то решение лучше, чем не принять никакого. Еще одним распространенным случаем применения этого принципа является ситуация, когда он является последним в последовательности применяемых принципов оптимальности. В этом случае вся имеющаяся информация использована на предыдущих этапах, все неподходящие стратегии отсеяны, оставшиеся сравнить невозможно – приходится выбирать любую.

2. Пусть предпочтения ЛПР удалось описать с помощью единственного критерия К, заданного на множестве. Критерий может максимизироваться (K(s)→max) и минимизироваться (K(s)→min). Если критерий K максимизируется, то исход s’ лучше, чем исход s’’ в смысле свойства, измеряемого критерием K, тогда и только тогда, когда K(s’)>K(s’’). Принцип оптимальности, основанный на максимизации значения критерия, выражается формулой S* = {s∈ S | K(s) = K*}, где K* = max K(s) по всем s∈ S.

3. Пусть исходы из S оцениваются по n критериям: K1, K2, …, Kn. Для определенности предположим, что все критерии максимизируются. Для таких постановок известны различные принципы оптимальности, в частности:

а) оптимальность по Парето: вариант s∈ S включается в множество S*, если не существует варианта t∈ S, такого, что Ki(t)≥ Ki(s) для всех i=1…n и Kj(t)> Kj(s) для некоторого j, 1≤j≤n

б) лексикографический принцип оптимальности: вариант s∈ S включается в множество S*, если значение критерия Ki для варианта s больше значений критерия Ki для всех прочих вариантов t∈ S и при этом для всех критериев с номерами j=1,…,i - 1 выполняется Kj(s)≤Kj(t). Этот принцип оптимальности соответствует случаю, когда критерии упорядочены по важности в абсолютном смысле: первый критерий – самый важный, второй критерий стоит рассматривать, только если имеется несколько вариантов, имеющих максимальную оценку по первому критерию, и т.д.

Замечание. Принципы оптимальности, приведенные в пп. а) и б), основаны на формировании бинарных отношениях предпочтения. Принцип оптимальности (а) – на отношении Парето, а принцип оптимальности (б) – на отношении лексикографического порядка (см. раздел «Бинарные отношения предпочтения и функция выбора» главы 2).

Обложка
Анотация
Оглавление
 

Введение
 
 
 

Глава 1 (Вы здесь)
Моделирование
проблемной
ситуации

Глава 2
Описание
предпочтений
 

Глава 3
Элементы
теория
выбора

Глава 4
Методы поддержки
принятия решений в
условиях определенности

Глава 5
Принятие
решений в
условиях риска

Глава 6
Слабоструктурированные
задачи принятия
решения

Глава 7
Задачи
группового
выбора

Библио-
графический
список