Основы теории нейронных сетей

         

Архитектура АРТ


Адаптивная резонансная теория включает две парадигмы, каждая из которых определяется формой входных данных и способом их обработки. АРТ-1 создана для обработки двоичных входных векторов, в то время как АРТ-2, более позднее обобщение АРТ-1, может классифицировать как двоичные, так и непрерывные векторы. В данном курсе рассматривается только АРТ-1. Для краткости АРТ-1 в дальнейшем будем обозначать как APT.



Функционирование сети APT в процессе классификации


Процесс классификации в APT состоит из трех основных фаз: распознавание, сравнение и поиск.

Фаза распознавания. В начальный момент времени входной вектор отсутствует на входе сети; следовательно, все компоненты входного вектора

Принцип адаптивного резонанса
можно рассматривать как нулевые. Тем самым сигнал
Принцип адаптивного резонанса

устанавливается в

Принцип адаптивного резонанса
и, следовательно, в нуль устанавливаются выходы всех нейронов слоя распознавания. Поскольку все нейроны слоя распознавания начинают работу в одинаковом состоянии, они имеют равные шансы выиграть в последующей конкуренции. Затем на вход сети подается входной вектор
Принцип адаптивного резонанса
, который должен быть классифицирован. Этот вектор должен иметь одну или более компонент, отличных от нуля, в результате чего и
Принцип адаптивного резонанса
, и
Принцип адаптивного резонанса

становятся равными единице. Это "подкачивает" нейроны слоя сравнения, обеспечивая один из двух единичных входов, необходимых для возбуждения нейронов в соответствии с правилом двух третей, и тем самым позволяя нейрону возбуждаться, если соответствующая компонента входного вектора

Принцип адаптивного резонанса

равна единице. Таким образом, в течение данной фазы вектор

Принцип адаптивного резонанса
в точности дублирует вектор
Принцип адаптивного резонанса
.

Далее, для каждого нейрона в слое распознавания вычисляется свертка вектора его весов

Принцип адаптивного резонанса
и вектора
Принцип адаптивного резонанса
(см. рис. 11.5). Нейрон с максимальным значением свертки имеет веса, наилучшим образом соответствующие входному вектору. Он выигрывает конкуренцию и возбуждается, одновременно затормаживая все остальные нейроны этого слоя. Таким образом, единственная компонента
Принцип адаптивного резонанса
вектора
Принцип адаптивного резонанса
(см. рис. 11.3) становится равной единице, а все остальные компоненты становятся равными нулю.

Принцип адаптивного резонанса

Рис. 11.5. 

В результате сеть APT запоминает образы в весах нейронов слоя распознавания — один нейрон для каждой категории классификации. Нейрон слоя распознавания, веса которого наилучшим образом соответствуют входному вектору, возбуждается, его выход устанавливается в единичное значение, а выходы остальных нейронов этого слоя устанавливаются в нуль.

Фаза сравнения. Единственный возбужденный нейрон в слое распознавания возвращает единицу обратно в слой сравнения в виде своего выходного сигнала

Принцип адаптивного резонанса
.




Процесс классификации в APT состоит из трех основных фаз: распознавание, сравнение и поиск.

Фаза распознавания. В начальный момент времени входной вектор отсутствует на входе сети; следовательно, все компоненты входного вектора

Принцип адаптивного резонанса
можно рассматривать как нулевые. Тем самым сигнал
Принцип адаптивного резонанса

устанавливается в

Принцип адаптивного резонанса
и, следовательно, в нуль устанавливаются выходы всех нейронов слоя распознавания. Поскольку все нейроны слоя распознавания начинают работу в одинаковом состоянии, они имеют равные шансы выиграть в последующей конкуренции. Затем на вход сети подается входной вектор
Принцип адаптивного резонанса
, который должен быть классифицирован. Этот вектор должен иметь одну или более компонент, отличных от нуля, в результате чего и
Принцип адаптивного резонанса
, и
Принцип адаптивного резонанса

становятся равными единице. Это "подкачивает" нейроны слоя сравнения, обеспечивая один из двух единичных входов, необходимых для возбуждения нейронов в соответствии с правилом двух третей, и тем самым позволяя нейрону возбуждаться, если соответствующая компонента входного вектора

Принцип адаптивного резонанса

равна единице. Таким образом, в течение данной фазы вектор

Принцип адаптивного резонанса
в точности дублирует вектор
Принцип адаптивного резонанса
.

Далее, для каждого нейрона в слое распознавания вычисляется свертка вектора его весов

Принцип адаптивного резонанса
и вектора
Принцип адаптивного резонанса
(см. рис. 11.5). Нейрон с максимальным значением свертки имеет веса, наилучшим образом соответствующие входному вектору. Он выигрывает конкуренцию и возбуждается, одновременно затормаживая все остальные нейроны этого слоя. Таким образом, единственная компонента
Принцип адаптивного резонанса
вектора
Принцип адаптивного резонанса
(см. рис. 11.3) становится равной единице, а все остальные компоненты становятся равными нулю.

Принцип адаптивного резонанса

Рис. 11.5. 

В результате сеть APT запоминает образы в весах нейронов слоя распознавания — один нейрон для каждой категории классификации. Нейрон слоя распознавания, веса которого наилучшим образом соответствуют входному вектору, возбуждается, его выход устанавливается в единичное значение, а выходы остальных нейронов этого слоя устанавливаются в нуль.

Фаза сравнения. Единственный возбужденный нейрон в слое распознавания возвращает единицу обратно в слой сравнения в виде своего выходного сигнала

Принцип адаптивного резонанса
. Эта единственная единица может быть визуально представлена в виде "веерного" выхода, подающегося через отдельную связь с весом
Принцип адаптивного резонанса
на каждый нейрон в слое сравнения, обеспечивая каждый нейрон сигналом
Принцип адаптивного резонанса
, равным величине
Принцип адаптивного резонанса
(нулю или единице) (см. рис. 11.6).

Принцип адаптивного резонанса

Рис. 11.6. 

Алгоритмы инициализации и обучения построены таким образом, что каждый весовой вектор

Принцип адаптивного резонанса
имеет двоичные значения весов; кроме того, каждый весовой вектор
Принцип адаптивного резонанса
представляет собой масштабированную версию соответствующего вектора
Принцип адаптивного резонанса
. Это означает, что все компоненты
Принцип адаптивного резонанса

(вектора возбуждения слоя сравнения) также являются двоичными величинами.

Так как вектор

Принцип адаптивного резонанса
не является больше нулевым, сигнал
Принцип адаптивного резонанса

устанавливается в нуль. Таким образом, в соответствии с правилом двух третей, возбудиться могут только нейроны, получающие на входе одновременно единицы от входного вектора

Принцип адаптивного резонанса
и вектора
Принцип адаптивного резонанса
.

Другими словами, обратная связь от распознающего слоя действует так, чтобы установить компоненты

Принцип адаптивного резонанса
в нуль в случае, если входной вектор не соответствует входному образу (т. е. если
Принцип адаптивного резонанса
и
Принцип адаптивного резонанса

не имеют совпадающих компонент).

Если имеются существенные различия между

Принцип адаптивного резонанса
и
Принцип адаптивного резонанса

(малое количество совпадающих компонент векторов), несколько нейронов на фазе сравнения будут возбуждаться и

Принцип адаптивного резонанса
будет содержать много нулей, в то время как
Принцип адаптивного резонанса
содержит единицы. Это означает, что возвращенный вектор
Принцип адаптивного резонанса
не является искомым и возбужденные нейроны в слое распознавания должны быть заторможены. Такое торможение производится блоком сброса (см. рис. 11.2), который сравнивает входной вектор
Принцип адаптивного резонанса
и вектор
Принцип адаптивного резонанса
и вырабатывает сигнал сброса, если степень сходства этих векторов меньше некоторого уровня. Влияние сигнала сброса заключается в установке выхода возбужденного нейрона в нуль, отключая его на время текущей классификации.

Фаза поиска. Если не выработан сигнал сброса, сходство является адекватным и процесс классификации завершается. В противном случае, другие запомненные образы должны быть исследованы с целью поиска лучшего соответствия. При этом торможение возбужденного нейрона в распознающем слое приводит к установке всех компонент вектора

Принцип адаптивного резонанса
в 0,
Принцип адаптивного резонанса
устанавливается в 1 и входной вектор
Принцип адаптивного резонанса
опять прикладывается в качестве
Принцип адаптивного резонанса
. В результате другой нейрон выигрывает соревнование в слое распознавания и другой запомненный образ
Принцип адаптивного резонанса
возвращается в слой сравнения. Если
Принцип адаптивного резонанса
не соответствует
Принцип адаптивного резонанса
, возбужденный нейрон в слое распознавания снова тормозится. Этот процесс повторяется до тех пор, пока не встретится одно из двух событий:

Найден запомненный образ, сходство которого с вектором

Принцип адаптивного резонанса

выше уровня параметра сходства, т. е.

Принцип адаптивного резонанса
. Если это происходит, проводится обучающий цикл, в процессе которого модифицируются веса векторов
Принцип адаптивного резонанса
и
Принцип адаптивного резонанса
, связанных с возбужденным нейроном в слое распознавания.Все запомненные образы проверены, определено, что они не соответствуют входному вектору, и все нейроны слоя распознавания заторможены. В этом случае предварительно не распределенный нейрон в распознающем слое выделяется этому образу и его весовые векторы
Принцип адаптивного резонанса

и

Принцип адаптивного резонанса
устанавливаются соответствующими новому входному образу.

Проблема производительности. Описанная сеть должна производить последовательный поиск среди всех запомненных образов. В аналоговых реализациях это будет происходить очень быстро; однако, при моделировании на обычных цифровых компьютерах процесс может оказаться очень длительным. Если же сеть APT реализуется на параллельных процессорах, все свертки на распознающем уровне могут вычисляться одновременно. В этом случае поиск может стать очень быстрым.

Время, необходимое для стабилизации сети с латеральным торможением, может быть длительным при моделировании на последовательных цифровых компьютерах. Чтобы выбрать победителя в процессе латерального торможения, все нейроны в слое должны быть вовлечены в одновременные вычисления и передачу. Этот процесс может потребовать проведения большого объема вычислений перед достижением сходимости.

Принцип адаптивного резонанса

<




Эта единственная единица может быть визуально представлена в виде "веерного" выхода, подающегося через отдельную связь с весом
Принцип адаптивного резонанса
на каждый нейрон в слое сравнения, обеспечивая каждый нейрон сигналом
Принцип адаптивного резонанса
, равным величине
Принцип адаптивного резонанса
(нулю или единице) (см. рис. 11.6).

Принцип адаптивного резонанса

Рис. 11.6. 

Алгоритмы инициализации и обучения построены таким образом, что каждый весовой вектор
Принцип адаптивного резонанса
имеет двоичные значения весов; кроме того, каждый весовой вектор
Принцип адаптивного резонанса
представляет собой масштабированную версию соответствующего вектора
Принцип адаптивного резонанса
. Это означает, что все компоненты
Принцип адаптивного резонанса


(вектора возбуждения слоя сравнения) также являются двоичными величинами.

Так как вектор
Принцип адаптивного резонанса
не является больше нулевым, сигнал
Принцип адаптивного резонанса


устанавливается в нуль. Таким образом, в соответствии с правилом двух третей, возбудиться могут только нейроны, получающие на входе одновременно единицы от входного вектора
Принцип адаптивного резонанса
и вектора
Принцип адаптивного резонанса
.

Другими словами, обратная связь от распознающего слоя действует так, чтобы установить компоненты
Принцип адаптивного резонанса
в нуль в случае, если входной вектор не соответствует входному образу (т. е. если
Принцип адаптивного резонанса
и
Принцип адаптивного резонанса


не имеют совпадающих компонент).

Если имеются существенные различия между
Принцип адаптивного резонанса
и
Принцип адаптивного резонанса


(малое количество совпадающих компонент векторов), несколько нейронов на фазе сравнения будут возбуждаться и
Принцип адаптивного резонанса
будет содержать много нулей, в то время как
Принцип адаптивного резонанса
содержит единицы. Это означает, что возвращенный вектор
Принцип адаптивного резонанса
не является искомым и возбужденные нейроны в слое распознавания должны быть заторможены. Такое торможение производится блоком сброса (см. рис. 11.2), который сравнивает входной вектор
Принцип адаптивного резонанса
и вектор
Принцип адаптивного резонанса
и вырабатывает сигнал сброса, если степень сходства этих векторов меньше некоторого уровня. Влияние сигнала сброса заключается в установке выхода возбужденного нейрона в нуль, отключая его на время текущей классификации.

Фаза поиска. Если не выработан сигнал сброса, сходство является адекватным и процесс классификации завершается. В противном случае, другие запомненные образы должны быть исследованы с целью поиска лучшего соответствия. При этом торможение возбужденного нейрона в распознающем слое приводит к установке всех компонент вектора
Принцип адаптивного резонанса
в 0,
Принцип адаптивного резонанса
устанавливается в 1 и входной вектор
Принцип адаптивного резонанса
опять прикладывается в качестве
Принцип адаптивного резонанса
.



В результате другой нейрон выигрывает соревнование в слое распознавания и другой запомненный образ
Принцип адаптивного резонанса
возвращается в слой сравнения. Если
Принцип адаптивного резонанса
не соответствует
Принцип адаптивного резонанса
, возбужденный нейрон в слое распознавания снова тормозится. Этот процесс повторяется до тех пор, пока не встретится одно из двух событий:

Найден запомненный образ, сходство которого с вектором
Принцип адаптивного резонанса


выше уровня параметра сходства, т. е.
Принцип адаптивного резонанса
. Если это происходит, проводится обучающий цикл, в процессе которого модифицируются веса векторов
Принцип адаптивного резонанса
и
Принцип адаптивного резонанса
, связанных с возбужденным нейроном в слое распознавания.Все запомненные образы проверены, определено, что они не соответствуют входному вектору, и все нейроны слоя распознавания заторможены. В этом случае предварительно не распределенный нейрон в распознающем слое выделяется этому образу и его весовые векторы
Принцип адаптивного резонанса


и
Принцип адаптивного резонанса
устанавливаются соответствующими новому входному образу.

Проблема производительности. Описанная сеть должна производить последовательный поиск среди всех запомненных образов. В аналоговых реализациях это будет происходить очень быстро; однако, при моделировании на обычных цифровых компьютерах процесс может оказаться очень длительным. Если же сеть APT реализуется на параллельных процессорах, все свертки на распознающем уровне могут вычисляться одновременно. В этом случае поиск может стать очень быстрым.

Время, необходимое для стабилизации сети с латеральным торможением, может быть длительным при моделировании на последовательных цифровых компьютерах. Чтобы выбрать победителя в процессе латерального торможения, все нейроны в слое должны быть вовлечены в одновременные вычисления и передачу. Этот процесс может потребовать проведения большого объема вычислений перед достижением сходимости.


Описание APT


Сеть APT представляет собой векторный классификатор. Входной вектор классифицируется в зависимости от того, на какой из множества ранее запомненных образов он похож. Свое классификационное решение сеть APT выражает в форме возбуждения одного из нейронов распознающего слоя. Если входной вектор не соответствует ни одному из запомненных образов, создается новая категория путем запоминания образа, идентичного новому входному вектору. Если определено, что входной вектор похож на один из ранее запомненных с точки зрения определенного критерия сходства, запомненный вектор будет изменяться (обучаться) под воздействием нового входного вектора таким образом, чтобы стать более похожим на этот входной вектор.

Запомненный образ не будет изменяться, если текущий входной вектор не окажется достаточно похожим на него. Таким образом, решается дилемма стабильности-пластичности. Новый образ может создавать дополнительные классификационные категории, однако он не может заставить измениться существующую память.



Принцип адаптивного резонанса


Привлекательной особенностью нейронных сетей с адаптивным резонансом является то, что они сохраняют пластичность при запоминании новых образов, и, в то же время, предотвращают модификацию старой памяти. Нейросеть имеет внутренний детектор новизны - тест на сравнение предъявленного образа с содержимым памяти. При удачном поиске в памяти предъявленный образ классифицируется с одновременной уточняющей модификацией синаптических весов нейрона, выполнившего классификацию. Такую ситуацию называют возникновением адаптивного резонанса в сети в ответ на предъявление образа. Если резонанс не возникает в пределах некоторого заданного порогового уровня, то тест новизны считается успешным и образ воспринимается сетью как новый. Модификация весов нейронов, не испытавших резонанса, при этом не производится.

Важным понятием в теории адаптивного резонанса является так называемый шаблон критических черт (critical feature pattern) информации. Этот термин показывает, что не все черты (детали), представленные в некотором образе, являются существенными для системы восприятия. Результат распознавания определяется присутствием специфичных критических особенностей в образе. Рассмотрим это на примере.

Принцип адаптивного резонанса

Рис. 11.1. 

Обе пары картинок на рис. 11.1 имеют общее свойство: в каждой из пар черная точка в правом нижнем углу заменена на белую, а белая точка в левом нижнем углу — на черную. Такое изменение для правой пары картинок (на рисунке — пара (b)), очевидно, является не более чем шумом, и оба образа (b) есть искаженные версии одного и того же изображения. Тем самым, измененные точки не являются для этого образа критическими.

Совершенно иная ситуация изображена на левой паре картинок (a). Здесь такое же изменение точек оказывается слишком существенным для образа, так что правая и левая картинки являются различными образами. Следовательно, одна и та же черта образа может быть не существенной в одном случае и критической — в другом. Задачей нейронной сети будет формирование правильной реакции в обоих случаях: "пластичное" решение о появлении нового образа для пары (a) и "стабильное" решение о совпадении картинок (b).




При этом выделение критической части информации должно получаться автоматически в процессе работы и обучения сети, на основе ее индивидуального опыта.

Отметим, что, в общем случае, одного лишь перечисления черт (даже если его предварительно выполнит человек, предполагая определенные условия дальнейшей работы сети) может оказаться недостаточно для успешного функционирования искусственной нейронной системы: критическими могут оказаться специфические связи между несколькими отдельными чертами.

Второй значительный вывод теории — необходимость самоадаптации алгоритма поиска образов в памяти. Нейронная сеть работает в постоянно изменяющихся условиях, так что предопределенная схема поиска, отвечающая некоторой структуре информации, может в дальнейшем оказаться неэффективной при изменении этой структуры. В теории адаптивного резонанса адекватность достигается введением специализированной ориентирующей системы, которая самосогласованно прекращает дальнейший поиск резонанса в памяти и принимает решение о новизне информации. Ориентирующая система также обучается в процессе работы.

При наличии резонанса теория АРТ предполагает возможность прямого доступа к образу памяти, откликнувшемуся на резонанс. В этом случает шаблон критических черт выступает ключем-прототипом для прямого доступа.

Эти и другие особенности теории адаптивного резонанса нашли свое отражение в нейросетевых архитектурах, которые получили такое же название — АРТ.


Упрощенная архитектура APT


На рис. 11.2 показана упрощенная конфигурация сети APT, представленная в виде пяти функциональных модулей. Она включает два слоя нейронов — так называемые "слой сравнения" и "слой распознавания". Приемник 1, Приемник 2 и Сброс обеспечивают управляющие функции, необходимые для обучения и классификации. Перед рассмотрением вопросов функционирования сети в целом необходимо рассмотреть отдельно назначения модулей; далее обсуждаются функции каждого из них.

Принцип адаптивного резонанса

Рис. 11.2. 

Слой сравнения. Слой сравнения получает двоичный входной вектор

Принцип адаптивного резонанса
и первоначально пропускает его неизмененным для формирования выходного вектора
Принцип адаптивного резонанса
. На более поздней фазе в распознающем слое вырабатывается двоичный вектор
Принцип адаптивного резонанса
, модифицирующий вектор
Принцип адаптивного резонанса
, как описано ниже.

Каждый нейрон в слое сравнения (см. рис. 11.3) получает три двоичных входа (0 или 1): (1) компонента

Принцип адаптивного резонанса
входного вектора
Принцип адаптивного резонанса
; (2) сигнал обратной связи
Принцип адаптивного резонанса
— взвешенная сумма выходов распознающего слоя; (3) вход от Приемника 1 (один и тот же сигнал подается на все нейроны этого слоя).

Принцип адаптивного резонанса

Рис. 11.3. 

Чтобы получить на выходе нейрона единичное значение, как минимум два из трех его входов должны равняться единице; в противном случае его выход будет нулевым. Таким образом, реализуется правило двух третей. Первоначально выходной сигнал

Принцип адаптивного резонанса
Приемника 1 установлен в единицу, обеспечивая один из входов, необходимых для возбуждения нейронов, а все компоненты вектора
Принцип адаптивного резонанса
установлены в 0; следовательно, в этот момент вектор
Принцип адаптивного резонанса
идентичен двоичному входному вектору
Принцип адаптивного резонанса
.

Слой распознавания.

Слой распознавания осуществляет классификацию входных векторов. Каждый нейрон в слое распознавания имеет соответствующий вектор весов

Принцип адаптивного резонанса
. Только один нейрон с весовым вектором, наиболее соответствующим входному вектору, возбуждается; все остальные заторможены.

Как показано на рис. 11.4, нейрон в распознающем слое имеет максимальную реакцию, если вектор

Принцип адаптивного резонанса
, являющийся выходом слоя сравнения, соответствует набору его весов; следовательно, веса представляют запомненный образ или экземпляр для категории входных векторов.




Такие веса являются действительными числами, а не двоичными величинами. Двоичная версия этого образа также запоминается в соответствующем наборе весов слоя сравнения (рис. 11.3); этот набор состоит из весов связей, соединяющих определенные нейроны слоя распознавания, по одному весу на каждый нейрон слоя сравнения.

Принцип адаптивного резонанса

Рис. 11.4. 

В процессе функционирования каждый нейрон слоя распознавания вычисляет свертку вектора собственных весов и входного вектора
Принцип адаптивного резонанса
. Нейрон, веса которого наиболее близки вектору
Принцип адаптивного резонанса
, будет иметь самый большой выход, тем самым выигрывая соревнование и одновременно затормаживая все остальные нейроны в слое. Как показано на рис. 11.5, нейроны внутри слоя распознавания взаимно соединены в латерально-тормозящую сеть. В простейшем случае (единственном, рассмотренном в данной работе) предусматривается, что только один нейрон в слое возбуждается в каждый момент времени (т. е. только нейрон с наивысшим уровнем активации будет иметь единичный выход; все остальные нейроны будут иметь нулевой выход). Эта конкуренция реализуется введением связей с отрицательными весами
Принцип адаптивного резонанса


с выхода каждого нейрона
Принцип адаптивного резонанса
на входы остальных нейронов. Таким образом, если нейрон имеет большой выход, он тормозит все остальные нейроны в слое. Кроме того, каждый нейрон имеет связь с положительным весом со своего выхода на свой вход. Если нейрон имеет единичный выходной уровень, эта обратная связь стремится усилить и поддержать его.

Приемник 2.
Принцип адаптивного резонанса
, выход Приемника 2, равен единице, если входной вектор
Принцип адаптивного резонанса
имеет хотя бы одну единичную компоненту. Более точно,
Принцип адаптивного резонанса
является логическим ИЛИ от компонента вектора
Принцип адаптивного резонанса
. Приемник 1. Как и сигнал
Принцип адаптивного резонанса
, выходной сигнал
Принцип адаптивного резонанса


Приемника 1 равен 1, если хотя бы одна компонента двоичного входного вектора
Принцип адаптивного резонанса


равна единице; однако, если хотя бы одна компонента вектора
Принцип адаптивного резонанса


равна единице,
Принцип адаптивного резонанса
устанавливается в нуль. Таблица, определяющая эти соотношения:

ИЛИ от компонента вектора XИЛИ от компонента вектора RG1
000
101
110
010


Сброс. Модуль сброса измеряет сходство между векторами
Принцип адаптивного резонанса
и
Принцип адаптивного резонанса
. Если они отличаются сильнее, чем требует параметр сходства, вырабатывается сигнал сброса возбужденного нейрона в слое распознавания.

В процессе функционирования модуль сброса вычисляет сходство как отношение количества единиц в векторе
Принцип адаптивного резонанса
к их количеству в векторе
Принцип адаптивного резонанса
. Если это отношение ниже значения параметра сходства, вырабатывается сигнал сброса.










Главная сайта