Методы добычи данных при построении локальной метрики в системах вывода по прецедентам


Декомпозиция метода (основные фазы)


Хотя не все системы вывода, основанного на прецедентах, полностью включают этапы, приведенные ниже (Рис. 1), подход, основанный на прецедентах, в целом состоит из следующих компонентов [Aamodt 94]:

  • Извлечение наиболее релевантных прецедентов для текущего случая из библиотеки прецедентов.
  • Адаптация выбранного решения для текущего случая, если это необходимо.
  • Применение решения.
  • Оценка применения (проверка корректности).
  • Сохранение. Добавление текущего случая в базу прецедентов.

    Рис 1. Цикл вывода на основе прецедентов

    Проблема выбора подходящего прецедента является одной из самых важных в таких системах. Естественно искать подходящий прецедент в той области пространства поиска, где находятся решения сходных проблем, иначе говоря, поиск должен быть организован сообразно цели. Но как определить, какие именно решения считать сходными?

    Эффективность поиска прецедентов для текущего случая во многом зависит от того, по каким признакам организован индекс в базе прецедентов. Это, в свою очередь, требует хороших знаний о предметной области и конечной цели решения проблемы. Однако выбор наилучшего индекса не может быть столь же прост, как это звучит, так как не имеется никаких общих рекомендаций для этого. Для ориентира, однако, можно привести четыре свойства хороших индексов [Kolodner 83]:

  • Направленность: Индексы должны быть направлены на решение цели.
  • Абстрактность: Индексы должны быть достаточно абстрактны, чтобы прецедент мог быть использован в разных запросах.
  • Конкретность: Индексы должны быть распознаваемы в других ситуациях без дальнейшей обработки.
  • Полноценность: Индексы должны быть способны дифференцировать прецеденты.

    После того, как прецеденты извлечены, нужно выбрать "наиболее подходящий" из них. Это определяется сравнением признаков текущего случая и выбранных прецедентов. Определение метода, на котором будет основываться нахождение меры сходства прецедентов, решается во время создания системы ее разработчиками. Наиболее популярным и часто используемым является метод "ближайшего соседа" (nearest neighbour) [Anand 99].


    Начало  Назад  Вперед



    Книжный магазин