1.5.Пространство признаков
Простейшая система распознавания букв реализуется следующим образом.
Образ буквы, например, «А», налагается на входной слой нейросети — рецепторы. Конфигурация возбужденных рецепторов, порождая прохождение возбуждения через внутренние слои нейросети , образуя путь возбуждения, определяет возбуждение , если не гаснет по пути, одного из нейронов выходного слоя, говорящего "это буква А". Интуитивно ясно, что устойчивость такой схемы по отношению к огромному множеству конфигураций возбуждений рецепторов, соответствующих одной только букве А, вряд ли высока. Вглядываясь в себя, мы видим, что такое непосредственное распознавание осуществляется далеко не всегда, особенно — на этапе получения школьного образования, ибо наше образование получается на основе признаков и определений (правил вывода).
Как можно охарактеризовать строчную букву «а»? Это кружочек, справа примыкает палочка с хвостиком вправо.
А прописная А? Две палочки с перекладинкой. Но ведь буква Н тоже соответствует этому определению. Тогда мы добавляем: две палочки, соединенные вверху. Кстати, соединение вверху может быть в результате небрежности лишь обозначено. Тогда о намеке на него мы можем судить по наклону палочек. Дальнейшая небрежность может привести к неразличимости букв А и Н.
Значит, существует ряд признаков, лежащих в основе определений. И мы, на интуитивном уровне, понимаем, что такой способ распознавания гораздо более устойчив к искажениям и особенностям почерка, однозначен и надежен. Ведь при изображении буквы А можно допустить не только небрежность в верхнем соединении палочек, но и значительную разницу в общем наклоне буквы, в длинах боковых палочек, в месте расположения перекладины, в ее наклоне и длине и т.д. Искажение может привести к сомнениям лишь при крайней похожести на цифру 4, на телеграфный столб или на греческую . Но даже в этом случае окончательный вывод может быть сделан на основе контекста, т.е. по использованию дополнительных признаков "по умолчанию".
Значит, необходимо ввести такие признаки, как наличие кружка, палочек, хвостиков, их взаимного расположения и т.д. То есть, необходимо построить пространство признаков, преобразовать входные изображения в это пространство, и тогда появится возможность получения более определенного и устойчивого к искажениям заключения.
Перевод входного изображения в пространство признаков значительно расширяет возможности "разглядывания" — масштабирования, размещения, поиска угла наклона и т.д., т.е. позволяет с более высокой достоверностью производить распознавание.
Например, изображение танка может в разных ракурсах ложиться на входной слой рецепторов. Конечно, можно запомнить, что "и это — танк", "и это — тоже танк" и т.д. Но если ввести хотя бы такое определение, как "массивный корпус на гусеничном ходу (тоже нуждается в определении), а сверху башня с дулом пушки, и все такое зелененькое", то это научит хотя бы принимать меры предосторожности.
1.6.Максимальное возбуждение нейронов выходного слоя
Как же реализуется принцип ассоциаций? Уместны предположения о том, как это реализовано в природе.
Представим себе отдельно выходной слой (рис.1.12).
Рис. 1.12. Области возбуждения выходного слоя
Рассматривая прохождение возбуждения, например, при подаче изображения буквы А, в модели нейросети, можно предположить, что не один нейрон, строго соответствующий этой букве, придет в возбужденное состояние, как это предполагается в логической модели. В его окрестности возбудятся и другие нейроны. Эта величина возбуждения будет угасать с ростом удаления. Нам же нужно, чтобы максимальной величиной возбуждения в этой окрестности обладал именно отмеченный нейрон. Более того, желательно, чтобы этот и только этот нейрон обладал высокой, существенно различимой, величиной возбуждения. Это обеспечит определенность и однозначность при дальнейшем использовании полученного вывода для принятия решения и для построения других логических цепочек, использующих это решение. Такая локализация сигнала возбуждения позволит ответить на вопрос: "на что более всего похож предъявляемый образ, несмотря на случайные отличия и оказываемые помехи?"
Способы максимизации и локализации уровня возбуждения основаны на нахождении экстремума функции возбуждения, построенной на области выходного слоя. Здесь нельзя обойтись без обмена тормозящими воздействиями между нейронами выходного слоя. Простейшая идея состоит в следующем. Все нейроны области выходного слоя имеют между собой синапсические связи такие, что каждый нейрон связан с ближайшими нейронами тормозящими связями, по модулю пропорциональными величине собственного возбуждения или алгебраической разности возбуждений. Тогда в итоге взаимодействия двух нейронов более "сильный" нейрон увеличит свой потенциал, сообщив более "слабому" нейрону тормозящее воздействие. Такое пошаговое "состязание" на фоне приходящего подтверждения от эталона и выделит сильнейшего. Более того, "слабый" нейрон может "слабеть" до тех пор, пока взвешенная сумма подаваемых ему сигналов не станет меньше его порога (рис.1.13).
Получается так, что области возбуждений оказываются "закрепленными" за типами объектов (рис.1.12)— за буквами, цифрами, продуктами питания и т.д. В развитой сети (как и в самом головном мозге), нейроны отдельных ее областей через нейроны внутренних слоев вновь порождают пути прохождения возбуждений в другие области нейросети и т.д.
Такой принцип локальности, пронизывающий всю структуру сети, в сочетании с принципом иерархии — возможностью построения новых выводов на основе сделанных, позволяет на деле реализовать связи каждый с каждым. Никакой вывод не может оставаться недоступным и неиспользованным при построении сложных умозаключений.
Принцип локальности не отвергает существования маловероятных связей каждого с каждым. Эта вероятность может быть высокой вследствие аномалий генетического характера. Например, человек, которого мы относим к уникумам, может видеть кожей вследствие того, что нейроны, воспринимающие кожные ощущения, сильно связаны с нейронами выходного слоя, "отвечающими" за зрение. И вместо того, чтобы возбуждение в сторону последних при слабых связях угасло, оно становится результативным. Ведь в целом все нейроны устроены одинаково.
Большое число связей способствует высокой надежности мозга. Ведь ежедневная гибель огромного числа нейронов, из-за алкоголя, наркотиков, токсикации, а также травм, компенсируются другими путями прохождения возбуждений, иногда даже связанными с необходимостью переобучения. Впрочем, ограниченный ресурс возможного не спасает, в конце концов, от деградации.
Рис. 1.13. Локализация возбуждения
Однако следует отметить, что локализация и максимизация возбуждения на выходном слое особенно важны тогда, когда действительно необходима высокая степень определенности. Это важно в том случае, если получаемый вывод (решение) немедленно участвует в цепочке последующих, использующих его, выводов. В конце концов, все обусловлено назначением сети, решаемой задачей. Можно представить себе возможный аттракцион — реакцию фантастического чудовища на изображение, как это представлено на рисунках 1.4 и 1.5. Там по виду изображения на экране инициируются те или иные программы действий: радости, гнева, поднятия лап, виляния хвостом и т.д. Возбуждение определенных нейронов выходного слоя связывается с запуском соответствующих программ. Величина возбуждения может являться основным параметром для этих программ. Программы не исключают друг друга, и в одном такте могут запускаться несколько программ.
Можно представить радостную модель гурмана-дегустатора (рис.1.14), по аромату блюда определяющего состав использованных ингредиентов и приходящего в восторг или в уныние от представленного букета.
В большинстве частных задач, где нейросеть обучается с помощью "учителя", т.е. на основе действий извне при ее настройке, присутствует элемент принудительного закрепления нейронов выходного слоя за выводами. В процессе последующего обучения преимущественно с помощью весов синапсических связей добиваются адекватной реакции сети.
Рис. 1.14. Нейродегустатор
|