на априорные вероятности этих классов ЛГМ, определим вероятность ошибки по формуле:
2.5.15
где составляющая ошибки Е12 - вероятность, связанная с классификацией наблюдений в класс1, когда они в действительности они принадлежат классу 2; Е21 - вероятность классификации наблюдений, принадлежащих классу 1, в классе 2.
Наглядно вероятность ошибки распознавания изображена на рис.2.5.3.
рис. 2.5.3. Заштрихованная область отражает вероятность ошибки.
Пусть стоимость использования всех доступных каналов сканера слишком высока и, кроме того, разумный выбор некоторого поднабора каналов обеспечит достаточную точность классификации, эта операция получила название - отбор признаков. Выбор каналов осуществляется следующим образом. Решение этой задачи требует сравнения альтернативных поднаборов измерений спектральных признаков на основе оценки качества классификации, которую они могут обеспечить. Сравнивать необходимо на основе вероятности ошибки классификатора, а также принимая во внимание стоимость классификации ЛГМ. Вероятность ошибки тесно связана с областью, лежащей ниже функции распределения вероятностей в зоне перекрытия. Количественной мерой степени разделения функций плотности служит нормализованное расстояние, определяемое по формуле:
2.5.16
где dнорм - мера статистической разделимости классов ЛГМ.
Чем больше статистическая разделимость классов, тем меньше вероятность ошибки. Более эффективной мерой статистической разделимости является J-M расстояние и определяется по формуле:
2.5.17
J-M расстояние - мера средней разности между функциями плотности для двух классов, разумный способ измерения разделимости классов ЛГМ. Пусть классы горючих материалов имеют нормальные функции плотности, тогда 2.5.17 приведем к виду:
2.5.18
где 2.5.19
Член с отрицательной экспонентой в уравнении 2.5.18 дает экспоненциально уменьшающийся вес возрастающим разностям между функциями плотности классов горючих материалов. В результате J-M расстояние имеет “насыщающее” поведение.
рис. 2.5.4. J-M расстояние и вероятность правильного распознавания
как функции нормализованного расстояния.
а - J-M расстояние J;
б - вероятность правильного распознавания Рс (%).
Эффект с отрицательной экспонентой, которая позволяет приобретать J-M расстоянию насыщающее поведение, позволяет использовать J-M расстояние для распознавания многих классов ЛГМ.
J-M расстояние позволяет определить границы вероятности ошибки, например для двух классов горючих материалов с равными априорными вероятностями.
Вероятность ошибки ограничивается
2.5.20
Исходная информация может содержать много информации, не приносящей пользы в процессе классификации и даже затрудняющей его. Это для нас шум. Выделение признаков выполняет две функции:
- отделение полезной информации от шума;
- сокращение размерности данных с целью упрощения вычислений, выполняемых классификатором.
Принимая во внимание, что время, необходимое для выполнения умножений, дает подавляющий вклад в общее время каждой классификации, время классификации пропорционально (n+1)х n,
где n - размерность данных.
Использование блока выделения признаков дает значительное сокращение стоимости классификации.
Естественный Рецептор Блок Блок
объект (датчик) выделение принятия Результат
признаков решения
рис. 2.5.5. Модель системы распознавания образов с блоком выделения признаков.
Существует три метода выделения признаков при распознавании различных классов ЛГМ:
- подмножества;
- отношения;
- линейные комбинации.
Подмножества: нахождение подмножеств признаков - просто отбор признаков, блок выделения признаков передает m измерений, подавляя оставшиеся.
Отношения: в этом случае каждый компонент вектора признаков - отношение двух измерений образа, то есть
Линейные комбинации: каждый из m компонентов вектора признаков (m<n) является линейной комбинацией измерений образа, то есть
2.5.21
где все - константы.
Для записи 2.5.21 можно использовать векторное (матричное) обозначение:
Эти методы выделения признаков, которые используются для построения блока выделения признаков системы распознавания образов относительно просты и снижают стоимость системы распознавания лесных горючих материалов по спектральным признаком.
Химическое загрязнение среды промышленностью
На
всех стадиях своего развития человек был тесно связан с окружающим миром. Но с
тех пор как появилось высокоиндустриальное общество, опасное вмешательство
человека в природу резко усилилось, расширился объём этого вмешательства, оно
ста ...
Очистка сточных вод от ионов аммония методом окисления
Вода – одно из самых важных веществ для всех живых организмов на земле, в том
числе и человека. Чистая пресная вода необходима человеку в быту, она широко
используется на всех промышленных и сельскохозяйственных предприятиях, а также
...