Применение метода анализа данных - деревья решений

Своевременная разработка и принятие правильного решения - главные задачи работы управленческого персонала любой организации. Непродуманное решение может дорого стоить компании. На практике результат одного решения заставляет нас принимать следующее решение и т.д. Когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего решения или исходов испытаний, то применяют схему, называемую деревом решений.

Деревья решений - один из методов автоматического анализа данных, основные идеи которого восходят к работам П. Ховленда (Р. Hoveland) и Е. Ханта (Е. Hunt) конца 50-х годов XX в. Их итогом явилась основополагающая монография, давшая импульс развитию этого направления.

Построение деревьев классификации - один из наиболее важных приемов, используемых при проведении "добычи данных и разведывательного анализа" (Data Mining), реализуемый как совокупность методов аналитической обработки больших массивов информации с целью выявить в них значимые закономерности и/или систематические связи между предикторными переменными, которые затем можно применить к новым совокупностям измерений.

Дерево решений представляет из себя некий графический инструмент, который помогает производить действия, такие, как: описание возможных стратегий игрока, описание неопределенных исходов (неизвестные стратегии второй стороны) и их вероятностей, вычисление EMV по стратегиям первого игрока, выбор стратегии с максимальным значением EMV. Как правило, применение этого графического средства предполагает использование следующих соглашений:

) деревья решений состоят из вершин (круги, квадраты и треугольники) и ветвей (линии);

) вершины соответствуют определенным моментам времени. Вершины-решения (квадраты) соответствуют моментам времени, когда ЛПР (лицо принимающее решение) принимает решение. Вершины-вероятности (круги) соответствуют моментам времени, когда разрешается одна из неопределенностей. Оконечные вершины (треугольники) соответствуют окончанию задачи, когда все решения приняты, все неопределенности разрешились и все платежи произошли;

) развитие ситуации во времени происходит согласно данной графической схеме слева направо;

) ветви, идущие из вершин-решений, соответствуют различным возможным решениям. Ветви, идущие из вершин-вероятностей, соответствуют различным возможным вариантам разрешения неопределенности и не являются объектом чьего-либо управления;

) вероятности соответствуют ветвям, исходящим из вершин вероятностей. Эти вероятности являются условными вероятностями при условии свершения события, соответствующего вершине, из которой они исходят. Поэтому сумма вероятностей по всем ветвям, исходящим из одной вершины, равна 1;

) каждой оконечной вершине соответствуют два числовых значения.

Первое - это вероятность прихода в данную оконечную вершину и второе - значение платежа, соответствующее данному сценарию развития событий.