Методы добычи данных при построении локальной метрики в системах вывода по прецедентам


Заключение


В работе предложен метод принятия решений, основанный на совместном применении ранее не комбинировавшихся (по крайней мере, в отечественных разработках) методов извлечения знаний и вывода по прецедентам, где методы добычи данных используются для автоматического отбора из большой базы прецедентов.

На данный момент все существующие интегрированные системы подобного рода пытаются строить для себя модель данных как способ получения фонового знания. Например, системы, использующие байесовские сети – причинно-следственную модель, системы, использующие предварительную кластеризацию – понятийную модель.

Основная цель привлечения фонового знания в системах вывода по прецедентам – получение сведений для разумного выбора наиболее подходящих прецедентов и адаптации найденного решения. А это, в свою очередь, в большой степени зависит от выбранной меры близости. Наиболее часто используемым методом в выборе прецедентов является метод "ближайшего соседа". В произволе, который допускают системы при выборе меры близости в этом методе, и заключается их главный недостаток.

Предложенная в работе локальная контекстно-зависимая метрика имеет интерпретацию расстояния и позволяет ранжировать объекты, по отношению к исследуемому, целыми числами. При ее построении может быть использована как предварительная кластеризация базы прецедентов, так и разбиение базы на классы эквивалентности с привлечением экспертного знания.

Неполное описания объектов и попадание текущего случая в пересечение понятий (что часто встречается на практике) также не являются препятствием. Более того, сам факт такого пересечения используется в предлагаемой метрике.

При построении метрики используется предложенный авторами модифицированный метод кластерного анализа, ориентированный на распознавание объектов в ситуациях, когда объекты и кластеры имеют не полностью совпадающие наборы признаков. Эта метрика применима к широкому кругу приложений и не накладывает ограничений на типы используемых атрибутов.

В нашей стране такой подход еще не получил должного развития.


Начало    Вперед



Книжный магазин