Нейроинформатика

       

Контрастирование на основе оценки


Рассмотрим сеть, правильно решающую все примеры обучающего множества. Обозначим через

Контрастирование на основе оценки
веса всех связей. При обратном функционировании сети по принципу двойственности или методу обратного распространения ошибки сеть вычисляет вектор градиента функции оценки H по весам связей -
Контрастирование на основе оценки
. Пусть
Контрастирование на основе оценки
- текущий набор весов связей, а оценка текущего примера равна
Контрастирование на основе оценки
. Тогда в линейном приближении можно записать функцию оценки в точке w как
Контрастирование на основе оценки
. Используя это приближение можно оценить изменение оценки при замене
Контрастирование на основе оценки
на как
Контрастирование на основе оценки
, где q - номер примера обучающего множества, для которого были вычислены оценка и градиент. Величину
Контрастирование на основе оценки
будем называть показателем чувствительности к замене
Контрастирование на основе оценки
на
Контрастирование на основе оценки
для примера q . Далее необходимо вычислить показатель чувствительности, не зависящий от номера примера. Для этого можно воспользоваться любой нормой. Обычно используется равномерная норма (максимум модуля):
Контрастирование на основе оценки
. Умея вычислять показатели чувствительности, можно приступать к процедуре контрастирования.

Приведем простейший вариант этой процедуры:

  1. Вычисляем показатели чувствительности.
  2. Находим минимальный среди показателей чувствительности -
    Контрастирование на основе оценки
    .
  3. Заменим соответствующий этому показателю чувствительности вес
    Контрастирование на основе оценки
    на
    Контрастирование на основе оценки
    , и исключаем его из процедуры обучения.
  4. Предъявим сети все примеры обучающего множества. Если сеть не допустила ни одной ошибки, то переходим ко второму шагу процедуры.
  5. Пытаемся обучить отконтрастированную сеть. Если сеть обучилась безошибочному решению задачи, то переходим к первому шагу процедуры, в противном случае переходим к шестому шагу.
  6. Восстанавливаем сеть в состояние до последнего выполнения третьего шага. Если в ходе выполнения шагов со второго по пятый был отконтрастирован хотя бы один вес, (число обучаемых весов изменилось), то переходим к первому шагу. Если ни один вес не был отконтрастирован, то получена минимальная сеть.

Возможно использование различных обобщений этой процедуры. Например, контрастировать за один шаг процедуры не один вес, а заданное пользователем число весов. Наиболее радикальная процедура состоит в контрастировании половины весов связей. Если половину весов отконтрастировать не удается, то пытаемся отконтрастировать четверть и т.д. Отметим, что при описанном методе вычисления показателей чувствительности, предполагается возможным вычисление функции оценки и проведения процедуры обучения сети, а также предполагается известным обучающее множество. Возможен и другой путь.



Содержание раздела