Методы добычи данных при построении локальной метрики в системах вывода по прецедентам


Декомпозиция метода (основные фазы) - часть 3


Невозможно выработать единый вариант для такой адаптации, так как это в большой степени зависит от предметной области. Если существуют алгоритмы адаптации, они обычно предполагают наличие зависимости между признаками прецедентов и признаками содержащихся в них решений. Такие зависимости могут задаваться человеком при построении базы прецедентов или обнаруживаться в базе автоматически.

Процесс модификации решения при его адаптации к текущему случаю может включать ряд шагов, от простой замены некоторых компонентов в имеющемся решении, корректировки или интерполяции (числовых) признаков или изменения порядка операций, до более существенных. Имеются и другие подходы:

  • Повторная конкретизация переменных в существующем прецеденте и присвоение им новых значений.
    • Уточнение параметров. Некоторые прецеденты могут содержать числовые значения, например, время выполнения какого-либо этапа плана. Это значение должно быть уточнено в соответствии с новым значением другого свойства.

  • Поиск в памяти. Иногда требуется найти способ преодоления затруднения, возникшего как побочный эффект замены одних компонентов решения другими.

Обратная связь, возникающая при сохранении решений для новых проблем, означает, что вывод по прецедентам по своей сути является "самообучающейся" технологией, благодаря чему рабочие характеристики каждой базы прецедентов с течением времени и накоплением опыта непрерывно улучшаются. Разработка баз прецедентов по конкретной проблеме или области деятельности происходит на естественном (русском, английском) языке, то есть не требует никакого программирования, и может быть выполнена наиболее опытными сотрудниками – экспертами, работающими в данной конкретной области.

Не стоит, однако, рассчитывать, что экспертная система будет действительно принимать решения. Принятие решения всегда остается за человеком, а система лишь предлагает несколько возможных вариантов и указывает на самый "разумный" из них с ее точки зрения.

Наименование метрики Тип признаков Формула для оценки меры близости (метрики)
Эвклидово расстояние Количественные
Манхэттенская метрика Количественные
Мера сходства Хэмминга Номинальные (качественные)
,
где nik – число совпадающих признаков у образцов Xi и Xk.
Мера сходства Роджерса-Танимото Номинальные шкалы

где – число совпадающих единичных признаков у образцов Xi и Xk;
, – общее число еди-ничных признаков у образцов Xi и Xk соответственно.
Расстояние Махалонобиса Количественные

W – ковариационная матрица выборки
Расстояние Журавлева Смешанные
, где

Таблица 1. Основные типы метрик.




Начало  Назад  Вперед



Книжный магазин