Основные категории


Для того чтобы разработанные в данной монографии рекомендации могли быть поняты однозначно, необходимо четко определить основные категории.

В широком понимании инвестор . это юридическое или физическое лицо, принимающее решение и осуществляющее инвестиции, вкладывающее собственные, заемные или иные привлеченные средства в инвестиционные проекты, финансовые или реальные активы корпораций, государственные долговые обязательства. Имущественный капитал, вкладываемый инвестором, может быть представлен в виде финансовых ресурсов, имущества, интеллектуального продукта. В корпоративном секторе экономики инвестор не просто вкладывают капитал в новый бизнес, подобно предпринимателю, но осуществляет долговременные вложения в достаточно крупные проекты, связанные со значительными производственными, техническими, технологическими преобразованиями и новшествами. Инвестор также отличается от спекулянта. Спекулянт приобретает ценные бумаги ненадолго, рассчитывая на быстрый рост их рыночной стоимости.

Если его расчет оказывается верным, он, как правило, продает эти ценные бумаги и намечает вариант нового вложения с расчетом на увеличение его рыночной стоимости. Инвестор покупает ценные бумаги, руководствуясь при этом мотивами получения регулярного дивидендного дохода, безопасности первоначальных капиталовложений и, если возможно, прироста стоимости капитала. В качестве инвесторов могут выступать органы, уполномоченные управлять государственным и муниципальным имуществом или имущественными правами; финансовые учреждения, называющиеся профессиональными или институциональными инвесторами; российские граждане и юридические лица; иностранные физические и юридические лица; государства и международные организации.

При объединении средств многих инвесторов для осуществления совместного инвестирования в предусмотренных законодательством формах возникает категория коллективного инвестора. Инвестор может выступать в роли вкладчика, заказчика, кредитора, покупателя, а также выполнять функции любого другого участника инвестиционной деятельности. Он самостоятельно определяет объемы, направления и эффективность осуществляемых инвестиций. Инвестор имеет право владеть, пользоваться и распоряжаться объектами и результатами осуществления инвестиций, включая реинвестиции. По распоряжению инвестора права владения, пользования, распоряжения инвестициями и их результатами могут быть переданы физическим и юридическим лицам в порядке, установленном законодательством.

В контексте данной книги понятие инвестор включает себя не всех субъектов, подпадающих под данное выше определение. Прежде всего . это инвестор, приобретающий с целью получения прибыли основные ценные бумаги корпораций . акции и облигации. Кроме того . это инвестор, который контролирует существенную часть уставного капитала крупной или средней акционерной компании (не менее 5%), что позволяет ему оказывать заметное влияние на компанию путем голосования на общем собрании и/или через своих официальных представителей в выборных органах управления компанией. Однако данный инвестор не является стратегическим инвестором, т.е. не оказывает прямого влияния на производственные процессы, не имеет своих доверенных лиц в высшем менеджменте компании и не стремится к заключению компанией сделок, в которых он имеет собственный интерес.

В соответствии с данным определением инвестора предполагается, что такого рода инвестор имеет возможности и необходимые ресурсы для того, чтобы использовать на практике разработанные в настоящей монографии методологию, алгоритмы и математический аппарат.

Под доходом инвестора от ценных бумаг подразумевается совокупность прямого годового дохода в виде выплаченных дивидендов и косвенного дохода в виде прироста курсовой стоимости акций. Чрезвычайно широкий диапазон доходности российских ценных бумаг и неоднозначное понимание данной категории в различных случаях затрудняет их точное сопоставление по этому показателю. Методологически, с целью получения принципиальной возможности сравнения, требуется упростить используемые категории настолько, чтобы большинство наблюдаемых на практике явлений могло бы быть однозначно и с приемлемой точностью описано с помощью таких категорий. Иначе говоря, необходимо получить возможность однозначно оценить доходность различных ценных бумаг в условиях, когда полученная из различных источников количественная информация о доходности сильно искажена. Доступные для инвесторов показатели доходности рассчитываются по различным методикам, часть из которых публично не раскрывается. Поэтому примем к рассмотрению в данной книге искусственные показатели, обозначив их здесь общепринятыми терминами.

Для простоты под дивидендным доходом будем понимать простую сумму всех дивидендных выплат, начисленных за соответствующий годовой период, отнесенную к концу года (без учета процедуры дисконтирования, используемой для точной привязки размеров денежных потоков к единой временной точке). Риски невыплаты или задержки выплаты дивидендов также не будут рассматриваться.

Прирост курсовой стоимости компании в общем случае зависит от многих факторов (общего состояния фондового рынка, рыночных ожиданий относительно конкретной компании и т.д.). Чтобы повысить индикативность данного показателя в отношение производственно-финансовой деятельности конкретной компании, целесообразно абстрагироваться от рыночного субъективизма и текущих конъюнктурных факторов. Кроме этого, так как прирост курсовой стоимости компании здесь рассматривается отдельно от дивидендного дохода, следует исключить влияние последнего. Поэтому под приростом курсовой стоимости в контексте данной книги будем понимать не рыночный показатель, а его материально финансовую основу . капитализированную часть прибыли, приходящуюся на одну акцию в процентах от основного капитала.

Цель и задачи исследования


При анализе потенциальной доходности ценных бумаг необходимо учитывать множество различных факторов. Каждое предприятие в современных российских условиях по-своему уникально. Совершаемые крупными инвесторами сделки по покупке или продаже пакетов фиксируются редко, информация о ценах и условиях сделок в большинстве случаев недоступна для третьих лиц.

Каждый участник сделки рассматривает ее с точки зрения определенных личных целей, и цена продажи всегда определяется только участниками сделки . покупателем и продавцом. В связи с этим поиск сопоставимых примеров крайне затруднителен. Тем не менее, между объектами инвестиций существует некоторое сходство. Определенное понимание рынка крупных сделок может быть достигнуто путем изучения достаточного количества сделок по косвенным признакам. Важнейшими источниками информации служат:

 с одной стороны, производственно финансовые показатели эмитентов, ценные бумаги которых являются объектами сделок;

 с другой стороны, сами факты купли продажи пакетов ценных бумаг и изменения производственно-финансовых показателей, последовавшие за заключением сделок.



Эти данные могут быть подвергнуты обработке при помощи определенного процесса самоорганизации, позволяющего определить наиболее, равно как и наименее типичные сделки и объекты инвестиций в рамках заданных критериев, а также учесть их последствия. Для оценки потенциальной доходности ценных бумаг особую важность представляет расчет будущих финансовых потоков, возникающих в процессе функционирования предприятий. Общепризнанных способов выбора показателей, однозначно определяющих будущую доходность, и определения их сравнительной важности в настоящее время не существует. Таким образом, целью исследования, описываемого в данной монографии, является определение и научное обоснование таких способов оценки эмитентов, которые позволили бы инвесторам принять наиболее правильные управленческие решения относительно своих портфелей ценных бумаг.

Особенность переходной экономики, в условиях которой развивается современная Россия, заключается в высокой изменчивости всех наблюдаемых тенденций.

Распределение данных нестационарного процесса изменения состояния российских предприятий совершенно различно даже для двух последовательных лет. Однако очевидно, что близкие по характеристикам предприятия ведут себя сходным образом, что позволяет говорить о некоторых закономерностях. Важнейшая задача исследования . выявить такие закономерности в экономической деятельности эмитентов и проинтерпретировать их с точки зрения интересов инвесторов.

В качестве теоретической базы, которая позволяет говорить о сходности предприятий-эмитентов, используется концепция стратегических групп. Стратегическую группу можно определить как группу компаний, действующих в одной и той же отрасли и имеющих много сходных черт в отношении структуры затрат, степени диверсификации деятельности, организационной структуры и мотивации. Стратегическая группа представляет собой более узкую совокупность предприятий, чем сектор экономики. Каждый сектор может включать в себя различные стратегические группы, сформированные в зависимости от стратегии, которой придерживаются образующие ее компании. Иметь представление о существующих в той или иной отрасли стратегических группах полезно не только для инвесторов, но и для эмитентов. Если какая-либо компания желает изменить свое стратегическое положение, она должна предварительно ознакомиться с фундаментальными проблемами, с которыми ей придется столкнуться при разработке приемлемого плана действий.

Традиционные подходы (1)


В настоящее время известно множество технических средств и методов для преобразования финансовых данных в информацию, используемую в процессе принятия решений. Развитие математического аппарата происходило параллельно с эволюцией соответствующих научных дисциплин, таких как статистика, исследование операций и вычислительная техника. Любая компьютерная программа по статистике дает представление о разнообразии средств, имеющихся в распоряжении финансовых аналитиков. Подобные программы делают современные вычислительные методы и сложные прогностические модели широкодоступными. Но, несмотря на растущую сложность статистических методов, даже простой статистический анализ и построение нескольких графиков уже значительно способствуют процессу преобразования данных в полезную информацию, позволяя, по крайней мере, подготовить почву для более тщательного анализа.

Первичное исследование или первичный анализ данных (IDA . initial data analysis) является важным этапом большинства статистических исследований с точки зрения не только изучения и обобщения данных, но также и построения простых моделей. Достоинством такого анализа его интуитивная понятность, ценная для интерпретации очевидных тенденций в развитии предприятий. В ряде случаев он позволяет дать предварительную оценку относительного «здоровья» российских компаний.

Из всех методов первичного анализа наиболее популярными являются одномерные методы, обрабатывающие каждую из переменных независимо. Под переменными здесь понимаются временные ряды финансовоэкономических показателей каждого отдельного предприятия. Примерами подобных методов могут служить гистограммы, диаграммы в виде дерева и схемы, в которых связи между элементами обозначаются стрелками. Эти графические методы обеспечивают наглядную информацию о данных и являются широко распространенным на практике исследовательским инструментом.

Целью анализа временных рядов является выявление основных факторов, влияющих на динамику развития предприятия, с помощью статистических методов. Иногда такой анализ позволяет выявить наиболее явные тенденции развития предприятия, однако, если в рядах данных наблюдаются повторяемость или однородные циклы, его применение может быть связано с серьезными трудностями. В этом случае схемы или диаграммы, объединяющие данные о финансово-экономических показателях, содержат противоречивую информацию. Они отражают лишь заметные на поверхности признаки процессов, причины которых скрыты в многообразии проявлений. Различные тенденции в экономическом поведении предприятий проявляются в наблюдаемых показателях совместно, нередко . в различных направлениях. Они не могут быть выявлены в явном виде при простом анализе результатов своего воздействия. Эффективность метода анализа временных рядов при использовании в финансовой сфере сильно зависит от качества исходной информации.

Для подготовки рекомендаций по управлению


Для подготовки рекомендаций по управлению пакетом акций необходимо знать не только то, каких дополнительных поступлений в настоящем можно ожидать в связи с принятием того или иного решения, но и то, каким образом это решение повлияет на динамику развития эмитента в будущем. Микро имитационная модель является хорошим средством оценки ожидаемых дивидендных поступлений и динамики развития предприятия. Используя данные микро уровня, т.е. данные об экономическом субъекте, эти модели показывают, как скажется принятие того или иного управленческого решения на доходности ценных бумаг. При использовании данных моделей для прогнозирования строится экстраполяция имеющихся данных на будущее и рассчитывается ожидаемая доходность по этой новой выборке. Единого подхода к построению микро имитационных моделей пока не существует, однако все множество микро имитационных моделей можно условно разбить на два класса . статические и динамические модели. Статические модели чаще всего используются для имитации возможных краткосрочных последствий конкретных управленческих решений в виде увеличения или уменьшения денежных потоков. Динамические модели используются, главным образом, для имитации долгосрочных последствий в виде изменения финансово-экономического положения предприятия. Главное различие между этими подходами заключается в том, что статические модели исходят из предположения, что поведение предприятия (относительно сферы деятельности и качественных экономических параметров) в результате управленческих решений не изменится. Динамические микро имитационные модели отражают реакцию экономических субъектов на решения акционеров, т.е. изменение финансовых параметров в ответ на изменение структуры распределения прибыли. Если в статическую модель ввести предположения о том, как изменится поведение предприятия в ответ на принятие тех или иных управленческих решений, модель превратится в динамическую. В стандартной микро имитационной модели содержится три основные компоненты:  база данных микроэкономического уровня . данных по выборке экономических субъектов (как правило, такая база данных содержит балансовые отчеты и иную документацию, представляемую в регулирующие органы, за несколько последних лет);  программа экономических расчетов, которая может быть дополнена также блоком «поведенческих реакций» предприятий в ответ на решения акционеров;  программа представления результатов, которая формирует и выводит на экран или на печать итоговые таблицы. Информация по отдельным предприятиям поступает из массива данных по экономическим субъектам микроуровня в программу экономических расчетов, которая по некоторым формулам делает расчеты финансовоэкономических показателей предприятия. Параметры этих расчетов задаются исследователем. После этого формируется ряд выходных таблиц (отчетов), в которых представлены результаты расчетов. Блок прогнозирования не является обязательной компонентой микроимитационной модели, однако он желателен. Рассмотрим этот процесс подробнее. Источником данных для микроимитационных моделей служит база данных по некоторой выборке предприятий. Такая база данных должна содержать по возможности полную информацию, необходимую для расчетов. В первую очередь, это должны быть сведения, которые предприятия сами указывают в своих балансах и финансовых отчетах, а также сведения из других источников, например сведения о стоимости находящейся в собственности эмитентов недвижимости и т.д. Выборка для микроимитационного моделирования должна быть по возможности представительной. С этой целью процедуры ее должны быть тщательно продуманы.

Адаптивные нейронные сети


Как было показано в предыдущем разделе, закономерности, которые кроются в цифровой информации, на практике используются не полностью. Доля переработки исходных данных о предприятиях, которые содержатся в финансовых отчетах и базах данных, в практически значимые знания невелика, так как арсенал классической статистики не позволяет решать такую задачу. Традиционные статистические методы способны обнаруживать регулярности, тенденции и структурные связи в совокупностях предварительно не обработанных многомерных данных. Однако лишь немногие из них позволяют непосредственно визуализировать связи, существующие между их элементами. При этом техника такой визуализации не свободна от недостатков.

Однако существуют методы, которые дают возможность закономерностям, скрытым в массивах данных, проявляются визуально в автоматическом режиме. Данные как бы самостоятельно упорядочиваются, располагаясь в двумерном пространстве в соответствии с их внутренним устройством. Посредством процесса, именуемого самоорганизацией, такие методы образуют топологическое представление исходных данных из элементов, получаемых на выходе. Наличие связей становится очевидным в результате нелинейного проецирования многомерного пространства данных на двумерную плоскость выходных данных. Программно-математической основой этих методов являются самоорганизующиеся нейронные сети. Впервые подобный метод был предложен в 1982 г. под названием метода самоорганизующихся карт. В настоящее время эти методы уже доказали свою высокую эффективность в области экономики и финансов.

Искусственные нейронные сети являются аппаратом из области нейрокомпьютинга (neural computing) быстро развивающейся в последнее время области вычислительных технологий, стимулированной исследованиями мозга. Вычислительные операции в таких сетях выполняются большим числом сравнительно простых процессорных элементов (processing element). Структура сети (network) тождественна математически определенной структуре вычислительной системы, в которой все операции выполняются в определенных узлах, а поток информации отображается направленными ребрами графа. Каждый узел (или нейрон . neuron) сети представлен процессорным элементом . Нейроно подобной ячейкой, которая совместно со многими другими процессорными элементами образует нейронную вычислительную сеть.

Аналогом такого узла в физиологической нервной системе является нервная клетка мозга. В общем случае искусственная нейронная сеть представляет собой адаптивную нелинейную динамическую систему. Посредством равновесных состояний такой сети можно решать математические или вычислительные задачи. Процесс их решения получил название нейросетевых вычислений.

Нейронные сети представляют собой совокупность математических методов, которые могут быть использованы для обработки информации, прогнозирования и кластеризации. Математически их можно представить как нелинейные, многослойные и параллельные методы регрессии. Иначе говоря, нейросетевое моделирование подобно проведению линии, плоскости или гиперплоскости через определенный набор информационных точек. Такой набор (в данном случае набор финансово-экономических параметров эмитента) тождественен входному набору нейросети. Рассчитанная сетью гиперплоскость тождественна выходным данным нейросети. Линию, плоскость или гиперплоскость можно с наилучшим приближением провести через любой набор данных и по выбору исследователя определить взаимосвязи, которые могут существовать между входами и выходами нейросети. Сеть можно также подстроить для представления многомерных данных в меньшей размерности.

Существует два класса нейронных сетей:

 сети, обучаемые с учителем;

 сети, обучаемые без учителя.

Принципы функционирования АНС


Раскроем основные положения и подходы метода АНС, отталкиваясь от общеизвестных математических понятий.

В основе алгоритма АНС лежат принципы регрессии. Существует два типа регрессии, использующие различные подходы: среднеквадратическая регрессия и среднеквадратическая ортогональная регрессия. Поясним их на примере простой аппроксимации.

При обычной среднеквадратической регрессии одна из переменных, например x , является независимой, и ее значения известны или могут быть точно выбраны.

Предполагается, что другая переменная y зависит от x .

Данные наблюдений переменных x и y можно представить в виде совокупности точек на плоскости с координатами X и Y . Каждая такая точка будет иметь координаты ( , )i i x y , где i 1, 2, ... N . В данном случае N . Общее число наблюдений. Для привязки к практической ситуации можно представить, что наблюдается группа предприятий. Каждое из этих предприятий характеризуется двумя основными балансовыми показателями: суммой активов ( x ) и размерами полученной прибыли ( y ). Очевидно, что абсолютный размер полученной прибыли в определенной степени зависит от суммы активов. Чем больше активов имеет предприятие, тем больше прибыли оно может получить. Но эта зависимость в обще случае нелинейна, так как она зависит от эффективности работы каждого предприятия. В математическом понимании свойство нелинейности (nonlinearity) относится к отображению (связи между переменными x и y ), которое нелинейно или при котором выходной сигнал ( y ) не пропорционален входному ( x ). Иначе говоря, график зависимости y  f (x) нельзя представить на плоскости XY в виде прямой линии.

Чтобы все же получить эмпирическую формулу зависимости y  f (x) можно попытаться аппроксимировать группу точек, полученных в результате наблюдения, с помощью простой функциональной зависимости (например, полиномиальной, экспоненциальной, логарифмической, гауссовой и т.д.), подбирая значения небольшого числа параметров, входящих в эту зависимость. В результате будет определенынесколько функций аппроксимации, каждая из которых описывается своей функциональной зависимостью y  f (x) . Считается, что при заданных ограничениях (которые в данном случае представлены ограниченным набором функций аппроксимации) функция аппроксимации при среднеквадратической регрессии оптимальна в том случае, если сумма квадратов вертикальных расстояний до точек исходных данных является минимальной. Иначе говоря, необходимо найти каждую функцию аппроксимации, нанести ее на плоскость XY , провести от каждой точки наблюдений ( , )i i x y вертикальную линию до пересечения с функцией аппроксимации, измерить полученные отрезки и сложить квадраты их длины по всей совокупности наблюдений i 1, 2, ... N . Далее необходимо сравнить полученные суммы для всех линий аппроксимации между собой и найти минимальную по величине. Соответствующая этой минимальной сумме кривая аппроксимации и будет считаться оптимальной при среднеквадратической регрессии.

Предположим теперь, что ни x , ни y не известны точно, а представляют собой случайные величины. Это как раз соответствует описанному выше практическому примеру, так как при наблюдении (в процессе выборки значений сумм активов и балансовой прибыли предприятий из базы данных по произвольной группе компаний) конкретные значения этих показателей заранее не известны. В этом случае оптимальная кривая аппроксимации проводится таким образом, чтобы сумма квадратов ортогональных расстояний от этой линии до точек, изображающих исходные данные, была минимальной. В отличие от рассмотренной выше среднеквадратической регрессии эти расстояния соответствуют длине перпендикуляра, проведенного к аппроксимирующей линии из соответствующей точки. Данный метод носит название среднеквадратической ортогональной регрессии.

Как правило, среднеквадратическая регрессия применяется при оценке параметров, а среднеквадратическая ортогональная регрессия чаще используется для сглаживания, особенно графического.

Данная функция часто именуется также


Данная функция часто именуется также функцией соседства (membership function). Данная функция определяет возможность принадлежности корректируемого узла нечеткому множеству окрестности узла-победителя. Такие функции всегда выпуклые и принимают значение в диапазоне от 0 до 1. Если осуществлять коррекцию узлов, расположенных вдоль аппроксимирующей линии в направлениях от узла-победителя к границам области коррекции, не с помощью описанного выше фактора скорости обучения (t) , а с использованием функции соседства, коррекция будет более плавной. В качестве функции соседства для осуществления «интеллектуальной» аппроксимации можно выбрать, например, гауссову функцию:




Рассмотрим теперь регулярную двумерную решетку


Рассмотрим теперь регулярную двумерную решетку плоскости выходных параметров, состоящую из вычислительных элементов, именуемых нейронами. Для улучшения визуального восприятия удобнее представить данную решетку гексагональной. С каждым нейроном, таким образом, связывается модельный вектор k m , т.е. координаты узла в пространстве сигналов представляются теперь в виде соответствующего нейрону множества вещественных чисел. В обычных нейросетевых моделях модельный вектор соответствовал бы синаптическим весам, которые будут рассматриваться ниже, однако в АНС конкретизировать природу k m нет необходимости. Представим, что последовательность примеров наблюдений r (t)  каким-то образом передается каждому нейрону, по одному примеру поочередно. Вычислительный алгоритм сети (в простейшем случае это запрограммированное последовательное сравнение r (t)  с k m по всем элементам входного множества) сначала будет выбирать нейрон-победитель, чей вектор k m наилучшим образом соответствует r (t)  . Этот нейрон будет иметь индекс k=П . Если задать положение нейрона k в этой сети с помощью двумерного вектора локализации k l , то функция соседства может быть приведена к виду: В общем случае для этого можно воспользоваться и более простой формой функции соседства. Как было отмечено выше, что алгоритм АНС определяет, каким образом m (t) k  подстраиваются под значения r (t)  . Предположим, что имеется достаточно примеров r (t)  , а если это не так, то следует выполнить несколько итераций с имеющимися примерами повторно, с тем чтобы число «этапов обучения» оказалось достаточным для обеспечения сходимости m (t) k  к приемлемым стационарным значениям * k m . Таким образом, любой вектор r (t)  выбирает один нейрон, а именно тот, модельный вектор которого имеет наибольшее сходство с r (t)  .

Часто более предпочтительным методом предварительной


Часто более предпочтительным методом предварительной обработки входных данных АНС, чем выравнивание по дисперсии, является метод выравнивания по гистограмме. Этот метод позволяет преобразовать произвольное исходное распределение значений показателей в почти равномерное. Выравнивание по гистограмме выполняется для каждого показателя в отдельности следующим образом. Если имеется гистограмма, построенная на 100 интервалах N финансовых отчетов, из которых берется N значений показателя x , то N /100 наименьших значений x , заменяются на 1, следующие N /100 наименьших значений заменяются на 2 и т.д. Наконец, N /100 наибольших значений x заменяются на 100. Если в исходных данных присутствуют равные значения финансовых показателей, длина соответствующего интервала должна быть скорректирована таким образом, чтобы равные значения попадали в один и тот же интервал, приобретая, таким образом, равные значения и после выравнивания. Еще одним способом предварительной обработки входных данных является нормализация отклонений значений компонент. Однако следует иметь в виду, что данный способ чувствителен к исключительно высоким значениям. В результате при обучении АНС предпочтение отдается незначительному числу случаев. В ряде случаев (например, при сравнении эффективности работы различных предприятий) исследователя интересуют относительные, а не абсолютные показатели. В таких обстоятельствах финансовые данные по каждому предприятию должны нормализоваться в соответствии с величиной валюты баланса предприятия. При отсутствии предварительных соображений, обуславливающих осмысленный выбор способа нормирования, как и в случае подбора обучающих параметров АНС, целесообразно определить наилучший метод путем тестирования разных способов нормирования. Нормиро-вание входных данных является весьма существенной частью их предварительной обработки. Результат обучения АНС в значительной степени зависит от того, насколько правильно были определены соотношения между параметрами, иными словами, от масштабирования. Изменяя факторы масштабирования, можно исследовать различные характеристики массива входных данных. В некоторых случаях, когда требуется выявить закономерности в структуре отдельных параметров или отдельных групп параметров, эксперименты с различными масштабами дают возможность повысить чувствительность АНС к выбранным параметрам. Часто различие в масштабе показателей тесно связано с выбором наиболее важных входных переменных. При этом АНС как бы разбивает пространство входных данных на области, в которых группируются сходные по выбранным признакам объекты. Топология плоскости выходных параметров упорядочивается согласно доминирующим компонентам, остальные же компоненты усредняются. АНС представляет собой удобный интерфейс для исследования данных, организованных в соответствии со значениями главных компонент. Масштабирование изменяет топологическую структуру плоскости. Компоненты, подвергшиеся масштабированию в наибольшей степени, представляют собой топологически компактные области, особенно в случае, когда речь идет об основных компонентах множества данных. Слабо масштабированные компоненты образуют подобласти внутри основных областей.

В нейрокомпьютинге используется также другое


В нейрокомпьютинге используется также другое толкование понятия синаптических весов, тесно связанное с координатами модельных векторов. В этом смысле синаптические веса играют ту же роль, что и коммуникационные связи, образующие ассоциативную память сети. Порядок, согласно которому происходит обновление синаптических весов при численной реализации функций обучения, определяется так называемой стратегией управления (control strategy). Для исследования динамики развития предприятий на продолжительных интервалах времени может быть использован метод скользящих временных окон, перемещаемых вдоль исторического ряда наблюдений (аналогично принципу скользящих средних на фондовом рынке . moving average). Этот метод наиболее эффективен при наличии тренда в последовательности наблюдений. Скользящее среднее сглаживает случайные колебания показателей предприятия, однако работает с задержкой по времени. Можно использовать любое число скользящих средних с различными временными интервалами усреднения. Кроме этого целесообразно поэкспериментировать с разновидностями этого алгоритма: простой, взвешенной и экспоненциальной скользящей средней. При расчете простого среднего (simple average) все данные берутся с одинаковым весом. Для получения взвешенного среднего (weighted average) больший вес приписывается последним данным в выбранном временном промежутке усреднения. Экспоненциальная разновидность характерна соответствующей процедурой взвешивания. Исследование данных финансовой отчетности за несколько последовательных лет возможно посредством простой конкатенации векторов данных в один более длинный вектор. Однако данный подход имеет большой недостаток: АНС, обученная при помощи подобных векторов данных, дает картину, интерпретация которой затруднительна. В частности, у плоскости выходных данных, построенной по данным за несколько лет, отсутствует естественная система координат, причем даже в том случае, если таковая может быть выявлена у плоскости, построенной по данным за один период отчетности. Эту проблему можно разрешить путем использования АНС с многоуровневой иерархией. АНС первого уровня обучается на данных финансовой отчетности за один год, так что положение каждой компании на плоскости выходных параметров первого уровня может быть определено по данным ее финансовой отчетности только за этот год. Плоскость второго уровня обучается на данных о положении компании в плоскости первого уровня с помощью информации из финансовых отчетов второго года и т.д. Таким образом, например, каждый нейрон плоскости выходных параметров второго уровня соответствует траектории на плоскости первого уровня, отражая одну и ту же динамику изменения финансового состояния компании из года в год. При построении новых плоскостей выходных параметров как бы наследуются свойства предшественников. Плоскости такого вида называют картами траекторий. Практика показывает, что на плоскости выходных параметров, состоящей из 400 нейронов, среднее смещение положения предприятия для двух последовательных годов составляет около 7 ячеек при максимуме в 20. Столь бурная динамика предостерегает от использования одного и того же изображения для визуального представления данных за несколько лет.

Процедуры использования АНС


Рассмотрим шаг за шагом процедуры использования методики АНС для решения задач, связанных с оценкой финансово-экономического состояния предприятий.

Процесс кластеризации и визуального представления входных массивов данных с использованием данного алгоритма можно разбить на 12 основных этапов:

1. Определение цели анализа.

2. Выбор источников данных и определение требований к ним.

3. Определение необходимых объемов данных и используемых переменных.

4. Определение алгоритмов предварительной обработки каждой переменной.

5. Выявление данных, наиболее типичных для входного набора.

6. Выбор дополнительных методов кластеризации и визуализации.

7. Определение желаемого размера изображения, отношения высоты к ширине и степень детализации.

8. Настройка АНС на оптимальную кластеризацию и визуализацию.

9. Интерпретация результатов, выявление кластеров и нетипичных объектов.

10. Расстановка на плоскости выходных параметров соответствующих меток.

11. Формулировка полученных результатов на основе различия между кластерами.

12. Оценка результатов, полученных с помощью АНС.

Определение цели анализа


Без надлежащего определения целей разработки нейросетевой модели оценить эффективность полученных на выходе результатов будет невозможно. Возможными целями моделирования могут служить:

 классификация, кластеризация или сжатие данных;

 визуализация данных;

 информационная поддержка принятия решений;

 проверка гипотез;

 наблюдение за параметрами эффективности;

 поиск пропущенных значений;

 прогнозирование.

Как правило, основными целями анализа с помощью АНС являются кластеризация и визуализация входных данных. При этом дополнительное использование традиционных статистических методов и различных альтернативных подходов к визуализации и кластеризации может значительно улучшить результаты АНС.

Если основной целью является информационная поддержка при принятии решений, большое значение приобретает точное определение круга самих решений, сферы их действия и сроков осуществления.

Если целью является отработка и проверка гипотез, необходимо заранее определить круг проверяемых гипотез, а также правила, согласно которым они будут приниматься либо отвергаться.

Если основная задача состоит в отслеживании эффективности некоторой системы, необходимо, в первую очередь, определить цели процесса, которыми, к примеру, могут быть оценка качества инвестиций в ценные бумаги или обнаружение «некоммерческих» предприятий среди списка эмитентов, а также проверка деятельности эмитентов на соответствие определенным критериям и т.д.

Если же конечной целью является прогнозирование, важно определить границы периода прогнозирования и способ оценки его эффективности. Например, уточнить необходимую продолжительность прогнозируемого периода в зависимости от типа прогноза, а также критерии оценки прогноза: процент правильных предсказаний или общий финансовый результат от применения прогноза изданный период.

Иногда цель может быть комплексной, например, проверка гипотез (аналитических выводов в отношении входных данных), а также глубокая интерпретация группировки и визуального представления соответствующих данных. Дополнительными целями при этом могут быть получение обобщающих данных по каждой группе входных данных, а также демонстрация возможности нахождения отсутствующих значений некоторых показателей.

Выбор источников данных и определение требований к ним


Важность использования высококачественной информации является очевидной. Поэтому данные должны поступать из одного или нескольких авторитетных источников. Качество данных, которые свободно доступны в сети Интернет, может существенно варьироваться. Поэтому необходимо критически относиться к информации, публикуемой на страницах сайтов. В общем случае следует использовать источники данных, наиболее надежные по всеобщему признанию.

Некоторые информационные и рейтинговые агентства имеют стабильную репутацию, и можно без всякого риска утверждать, что предоставляемые ими данные являются весьма надежными (с точки зрения отсутствия ошибок при копировании и опубликовании).

Определение необходимых объемов данных и используемых переменных


Выбор или определение оптимального объема данных в связи с целями исследования является важным этапом любого анализа. Такие преимущества алгоритма АНС, как конкурентное обучение и высокая способность к выявлению структурных особенностей данных, могут подвести исследователя к решению использовать все имеющиеся данные вместо того, чтобы произвести их тщательный отбор, исходя из целей исследования. Однако такой подход повышает уровень информационных помех. Чтобы выделить только необходимые данные, важно понять смысл имеющейся информации. С этой целью может быть использованы заключения экспертов в соответствующих областях. После определения общего круга и объема необходимых данных следует провести отбор переменных, которые будут использоваться в ходе анализа. При этом должны оставляться лишь те переменные, которые имеют смысл с точки зрения целей исследования. При отборе показателей необходимо иметь в виду, что невозможно извлечь из данных то, чего в них не содержится.

При большом числе возможных переменных должны отбираться только те, которые с наибольшей вероятностью могут повлиять на результат. В ряде случаев целесообразно рассмотреть возможность использования различных типов переменных, таких как отношения, временные инварианты, комбинации различных переменных и т.д. Часто добавление одной или нескольких переменных, несущественных с точки зрения технологии анализа, может сильно повлиять на формирование кластеров. В то же время, если не принять во внимание хотя бы одну или несколько существенных переменных, результаты могут значительно исказиться.

Допустимым приемом для построения промежуточной АНС является начальный выбор лишь самых существенных параметров, например основных балансовых показателей для предприятий-эмитентов. Впоследствии круг используемых данных должен последовательно расширяться за счет включения менее важных показателей.

Это процесс необходимо завершить добавлением рыночных показателям по ценным бумагам эмитентов.

Как правило, входная информация содержится в текстовых файлах или электронных таблицах Excel. При построении АНС эти входные данные представляются в виде строк и столбцов, например, строки содержат данные по отдельным компаниям, а столбцы . по перечисленным выше показателям. В первой строке таблицы входных данных содержатся также сокращенные обозначения показателей, а в последнем столбце . метки или сокращенные названия компаний. Если название показателя не определено, компоненты можно именовать следующим образом: «Компонента 1», «Компонента 2» и т.д.

Пропущенные данные следует отметить знаками «..» или «х».

Определение алгоритмов предварительной обработки каждой переменной


Предобработка данных является важным этапом любого анализа, который актуален и для алгоритма АНС.

Масштабирование и преобразование данных, а также определение приоритетов здесь играют важную роль. Основными вариантами предобработки входных данных являются:

 нормирование (масштабирование) данных;

 определение приоритетов переменных;

 модификация данных;

 преобразование данных.

В процессе создания АНС на компьютере всегда используется внутреннее представление данных. Такое представление определяет топологию распределения данных и, таким образом, структуру плоскости выходных параметров. Как правило, программные пакеты, реализующие алгоритм АНС, дают исследователю возможность задать основные параметры внутреннего представления, определяющие процедуры предобработки данных.

После задания этих параметров определять больше ничего не требуется. Компьютерная программа сама производит расчет всех масштабных факторов, приоритетов и преобразований, общаясь с пользователем на языке исходных единиц измерения данных.

Основной целью нормирования данных является приведение всех данных к сопоставимому виду. Зачастую диапазон изменения данных варьируется от одного столбца к другому. Отсутствие предобработки может повлиять на кластеризацию и окончательный вид плоскости выходных параметров. Существует множество способов нормирования. Чаще других применяется нормирование всех данных по величине стандартного отклонения (variance).

Другой метод заключается в нормировании по диапазону изменения (range), т.е. значение нормированного параметра y определяется из ненормированного x по формуле:

Некоторые исследования показывают, что нормирование по диапазону изменения может быть в ряде случаев предпочтительнее (например, если дисперсия значительно меньше диапазона изменения). Если программа предлагает нормирование по дисперсии, а исследователь вручную выбирает нормирование по диапазону, то таким образом устанавливается более высокий приоритет соответствующей переменной. Относительное влияние этой переменной на процесс формирования плоскости выходных параметров, как правило, возрастает.

Выявление данных, наиболее типичных для входного набора


Обучение нейронных сетей на множестве примеров дает наилучший результат в случае использования типичных входных данных. Выбирая наиболее типичные входные векторы, можно уменьшить уровень информационных помех, что позволит получить более четкое изображение на плоскости выходных параметров. Это изображение может затем использоваться для проверки на всей оставшейся части множества данных. Кроме того, использование входных векторов, соответствующих выбросам, может иметь решающее значение для обучения АНС в зависимости от их положения. При условии, что упомянутые векторы являются прототипами, выбросы делают изображение на плоскости выходных параметров более контрастным, что может подчеркнуть различия между кластерами. Однако за счет этого может произойти уменьшение чувствительности остальных участков плоскости. Если выбросы не являются характерными, их целесообразно все же исключить.

На практике обучение АНС, как правило, производится в два этапа. На первом этапе обучения используются наиболее типичные данные, и рассчитывается приблизительная структура плоскости выходных параметров. На втором этапе используется весь входной массив данных, и устанавливаются более тонкие различия между входными векторами.

Подобный двухэтапный цикл обучения можно также реализовать, выбирая для разных циклов различные скорости обучения и радиусы взаимодействия нейронов.

В первом цикле начальная скорость обучения соответствует чаще всего 0,5 и уменьшается с течением времени.

Во втором цикле скорость обучения может первоначально быть гораздо меньше, например 0,02, и также уменьшаться со временем. Радиус взаимодействия нейронов составляет сначала обычно половину диаметра сети и затем уменьшается до нуля. В некоторых программных пакетах определять скорость обучения не требуется. Вместо этого формируется пакет приращений скорости обучения для каждого этапа.

Выбор дополнительных методов кластеризации и визуализации


Применительно к финансам и экономике совмещение АНС с другими статистическими методами очень распространено. Зачастую результаты, полученные при помощи АНС, требуют последующей обработки. Отдельно используемый метод АНС дает топологическое представление данных. Это представление нуждается в приведении к удобному для интерпретации виду, руководствуясь которым можно было бы принимать решения о дальнейших действиях. Исследователь должен иметь представление об основных характерных особенностях представленных на плоскости выходных параметров АНС кластеров, а также о том, чем они отличаются друг от друга, и как их можно было бы использовать для прогнозирования или принятия решений. Таким образом, АНС чаще всего не является сама по себе окончательным результатом.

Часто совмещение АНС с другими методами возможно даже на уровне алгоритмов. Например, гибридная система, включающая в себя АНС и генетические алгоритмы оптимизации, может значительно повысить эффективность моделей, используемых для анализа данных о динамике развития компаний.

Определение желаемого размера изображения, отношения высоты к ширине и степень детализации.


Под размером изображения обычно понимается общее число узлов (нейронов) на плоскости выходных параметров. На плоскости большего размера можно различить больше подробностей, так как входные векторы распределяются по большему числу узлов. При большом числе узлов картина получается, как правило, более ясной, однако при этом она не допускает последующих интерпретаций (кластеры плохо видны). Плоскости меньшего размера, распределяющие большее число примеров на менее обширное множество узлов, могут содержать более крупные кластеры. Меньшее число узлов означает большую универсальность, что также может оказаться полезным, если в данных присутствует много помех. Исследователь должен решить, что ему предпочесть.

Обычно ответ на вопрос об оптимальном размере изображения зависит от конкретных данных и предназначения АНС. При определении размера плоскости выходных параметров ключевым моментом является способ дальнейшего использования результатов АНС. Если этот алгоритм используется для получения общей информации об обширных множествах данных, для этого может подойти плоскость большей размерности. Однако при использовании АНС для выбора эмитентов с целью инвестирования в их ценные бумаги оптимальной может ока-аться плоскость меньшего размера, на которой соответствующие предприятия кластеризуются по 5-7 категориям.

В наиболее часто используемых методах выбора формы плоскости выходных параметров используется либо соотношение осей главной плоскости, либо отношение, полученное при помощи проекции Сэммона. Некоторые программные средства позволяют определять форму плоскости автоматически.

Под форматом (отношением ширины сети к ее высоте) понимается входная размерность АНС. Как правило, эти параметры определяются, исходя из размерности входных данных. При соблюдении соответствия числа строк и столбцов на входе сети формату данных АНС будет наилучшим образом соответствовать множеству входных данных. В случае использования модификации данных, сокращающей число входных параметров, формат АНС может соответствующим образом корректироваться. Однако такая коррекция не обязательна . Многие программные пакеты допускают использование пустых столбцов и строк во входных данных.

Параметр «натяжения» сети соответствует ширине функции соседства по окончании процесса обучения.

Данная величина является мерой способности АНС подстраиваться к входным данным. Обычно специализированные программы предлагают по умолчанию значение 0,5, которое почти всегда является вполне приемлемым.

Для получения более подробных изображений на плоскости выходных параметров целесообразно снизить это значение до 0,2. Выбор более высоких значений, чем предлагаемое по умолчанию, приводит к формированию более грубых изображений.

Точность формирования АНС определяется предопределенными графиками обучения, включающими в себя определенные значения внутренних параметров, влияющих на формирование сети. Как правило, программные пакеты позволяют установить следующие значения точности: «fast» (быстро), «normal» (нормально), «thorough» (тщательно) или «slow» (медленно).

Еще один параметр этого ряда . режим адаптации.

Он показывает, как размерность промежуточных АНС определяется в процессе адаптации, исходя из заданных значений формата, натяжения и точности.

Настройка АНС на оптимальную кластеризацию и визуализацию


После того как АНС обучена, ее можно проверить путем просмотра числа узлов, содержащих входные данные, средних значений этих узлов и кластеров, числа образованных кластеров и числа входных векторов, содержащихся в каждом кластере. Можно также выполнить более тонкую настройку АНС, увеличивая или уменьшая порог кластеризации или минимальный размер кластера.

При большем пороге кластеризации или минимальном размере кластера число кластеров будет меньше, т.е. кластеризация будет более грубой. При снижении порога кластеризации на плоскости выходных параметров появится больше подробностей.

Как правило, программные пакеты, реализующие алгоритмы АНС, позволяют исследовать результаты обучения несколькими способами:

 вывести отдельные аспекты (компонентные плоскости) АНС в новых окнах;

 рассмотреть детали плоскости выходных изображений в каждом из окон по частям;

 исследовать значения отдельных узлов и кластеров;

 идентифицировать метки отдельных узлов и кластеров либо задать их принудительно.

Обычно изначально плоскость выходных изображений состоит из слабо связанных друг с другом светлых участков или кластеров, которые часто бывают разделены темно-серыми областями (разделяющими областями).

Данное разделение (кластеризация) на плоскости может быть изменено посредством изменения параметров (настройка кластеризации), являющимся частью меню любого программного пакета АНС. Программы позволяют задавать различные значения порога кластеризации и минимального размера кластеров, а также выделять сходные данные при помощи изолиний. В специальном окне может быть также получено изображение плоскости выходных параметров в виде ортогональной матрицы.

Отдельные окна в программных пакетах открываются для выделенных компонент. Исследователь обычно сам может выбирать их для отображения в окнах. В каждом окне отображается величина отдельно взятой компоненты, т.е. проекция соответствующей компоненты на плоскость выходных параметров. Цветная шкала в нижней части экрана позволяет соотнести используемые цвета с численными значениями компонент.

Интерпретация результатов, выявление кластеров и нетипичных объектов


После того как топологическое представление данных создано, необходимо провести проверку полученного на плоскости выходных параметрах изображения на достоверность. Это можно сделать несколькими способами. Ключевой составляющей в этом является экспертная оценка. С целью простой проверки можно распечатать перечень входных векторов, рассортированных по узлам или кластерам плоскости выходных параметров. В качестве другого способа может быть использован расчет итоговой статистики для каждого кластера. Обычно программы показывают среднее значение, стандартное отклонение, минимальное и максимальное значения, а также сумму значений для одного или нескольких узлов.

Возможность анализа характеристик отдельных узлов дает эффективное средство исследования результатов конкретного визуального представления, а также настройки АНС путем изменения порога или минимального размера кластеров.

В зависимости от используемого программного обеспечения, соответствующие кластерам средние значения могут быть даже отображены на экране. В этом случае исследователь может в интерактивном режиме проанализировать каждый кластер и удостовериться, имеют ли итоговые данные смысл. Программы дают возможность идентифицировать кластеры по характерным значениям компонент в интерактивном режиме. Сравнение значений в различных узлах и кластерах дает исследователю возможность определить оптимальную детализацию плоскости выходных параметров, необходимость преобразования данных и более тонкой настройки приоритетов некоторых компонент и, наконец, оценить универсальность выходного изображения. Иными словами, возможность проверки значений каждого узла и кластера в интерактивном режиме имеет большое значение для реализации динамичного процесса обработки данных, а также для включения в него экспертных оценок и информации о природе исходных данных.

Расстановка на плоскости выходных параметров соответствующих меток


Часто выбор используемых меток очевиден: каждому вектору входных данных можно соотнести полное или краткое название класса исходных данных (например, названия компаний), которым он соответствует. При использовании АНС для мониторинга процесса метки целесообразно расставить лишь на немногих входных векторах, соответствующих проблемным ситуациям или оптимальным состояниям.

Иногда может возникнуть необходимость использования множественных меток для обозначения регионов, отраслей и т.д. Каждый нейрон может иметь метки, состоящие из одной или нескольких строк. Метки можно наносить на нейроны, выбирая их из исходного файла данных (т.е. его последнего столбца), либо по отдельности, выбирая нужную область на плоскости выходных параметров и вводя название вручную. Метки сохраняются вместе с плоскостью и могут быть отредактированы.

Многие программные пакеты позволяют определять и наносить на плоскость выходных параметров метки автоматически. Гибкость автоматического выбора меток для узлов и кластеров по векторам входных данных имеет очень большое значение. Возможность автоматического нанесения меток особенно важна при использовании АНС применительно в финансах и экономике.

В то время как нанесение на плоскость выходных параметров соответствующих меток может внести ясность в разбиение данных по группам и кластерам, полученным с помощью АНС, обнаруживать нелинейные связи и зависимости между различными показателями удобнее всего с помощью окон отдельных компонент, которые также генерируются программными пакетами. Расположив эти окна рядом с основной плоскостью выходных параметров, можно непосредственно исследовать зависимости между компонентами. Сравнивая значения компонент в выбранных областях, исследователь может выявить нелинейные зависимости и, таким образом, визуально определить смысл кластеризации. Некоторые программные пакеты дают возможность просмотра численных значений входных параметров на плоскости выходных изображений.

Для того чтобы связать отдельную компоненту с набором других параметров, в процессе обучения АНС выбранной компоненте следует приписать приоритет, равный нулю. Например, можно «отключить» приоритет показателя чистой прибыли, определив его равным нулю.

Это означает, что данный показатель не будет приниматься в расчет в процессе формирования плоскости выходных параметров, будучи, таким образом, связанной величиной. Компонентное окно, соответствующее показателю чистой прибыли, в дальнейшем следует сравнить с другими окнами, чтобы выявить, например, величины, определяющие высокий уровень чистой прибыли. Если для связанного параметра чистой прибыли имеются четко выделенные области высоких и низких значений, это означает, что данный параметр может быть определен по остальным величинам с достаточно высокой достоверностью. Если высокие и низкие значения распределятся по компонентной плоскости хаотично, можно сделать вывод об отсутствии связи между чистой прибылью и другими переменными. Этот прием позволяет очень точно выявить минимальный набор параметров, характеризующий с высокой информативностью финансово-экономическое положение предприятий.

Если связать какую-либо величину с наборами входных данных, представляющими собой временные ряды, можно получить прогноз ее изменения. Таким образом, метод АНС может быть использован еще и для предсказания значений отдельных параметров в будущем.

Интересной особенность ИНС является тот факт, что один и тот же объект может быть обнаружен в более или менее различных топологических областях плоскости выходных параметров в зависимости от степени значимости, приданной выбранным компонентам. Если это происходит в процессе анализа финансово-экономического состояния предприятий, то очевидным следствием является противоречие: один и тот же эмитент попадает в различные группы предприятий. В целом это свидетельствует об относительной схожести групп при данном сочетании степени значимости компонент. Сопоставимые оценки при этом могут быть выбраны многими способами, и некоторая объективная истина может быть найдена как комбинация двух субъективных истин.

Формулировка полученных результатов на основе различия между кластерами


С целью правильной формулировки полученных результатов необходимо последовательно повторять процессы моделирования АНС, меняя при этом исходные условия предварительной обработки входных данных (используя различные методы преобразования и нормирования) и наборы ключевых параметров. При этом следует стремиться выявить тенденции в поведении АНС, убедиться в ее хорошей сходимости и способности противостоять меняющимся раз от раза условиям обучения и наборам тестовых значений.

В результате будет выявлен набор устойчивых кластеров, каждый из которых должен поддаваться осмысленному описанию в категориях входных данных.

Итоговую статистику по кластерам можно получить автоматически или «вручную» в зависимости от того, какое программное обеспечение используется для формирования АНС. Новейшие программные пакеты позволяют рассчитывать итоговую статистику автоматически. Это дает им очевидные преимущества по сравнению с программными средствами, не предоставляющими возможностей для окончательной обработки результатов. В финансах и экономике обработка результатов, представленных на АНС, как и извлечение информации о выявленных особенностях и дальнейшем использовании полученных результатов, представляет большую важность.

Большим достоинством АНС является возможность последующей обработки, позволяющей получить итоговую статистику для каждого узла и каждого кластера, включающую в себя, как минимум, средние значения, стандартные отклонения, минимальные и максимальные значения и сумму входных векторов.

Оценка результатов, полученных с помощью АНС


Для эффективного использования АНС в области финансов и экономики важно продемонстрировать высокую информативность получаемых результатов. В частном случае решения задачи оптимального инвестирования информативность моделей АНС можно измерить путем оценки эффективности (прибыли) и риска инвестирования в ценные бумаги эмитентов. Полученные результаты следует сравнить с результатами применения эталонных методов (например, с эффективностью работы моделей, основанных на более традиционных подходах). Прибыль обычно сопоставляется с риском, неразрывно связанным с процессом извлечения прибыли. Соотношение риск . прибыль можно также сравнивать с общепринятыми стандартами (например, со средними рыночными показателями или с показателями лучших инвестиционных компаний). Соотношение между скорректированной по риску прибылью и затратами на инвестирование дает представление об эффективности инвестиционной стратегии.

Методология оценки результатов, полученных с помощью АНС, представляется очень важной с точки зрения более конкретного применения этого алгоритма в области финансов и экономики. В общем случае оценка результатов может производиться следующим образом:

1. Конечным результатом кластеризации является количество полученных кластеров. Максимум может равняться числу наблюдений, если размер плоскости выходных изображений слишком велик, минимум . единице, если в данных отсутствует тенденция к кластеризации.

Если одной из целей использования АНС является сжатие данных, то желаемый итог будет, по-видимому, располагаться ближе к последнему пределу. Оптимальное число кластеров зависит, однако, от исходных данных, целей исследования и предназначения АНС. Число образовавшихся на плоскости выходных параметров кластеров можно рассматривать как своеобразный «эффект» кластеризации.

2. Другим результатом кластеризации является степень различий между кластерами. Кластеров может быть много или мало, они могут быть похожими друг на друга и в значительной степени отличаться. Качество кластеризации зависит от этого нечетко формулируемого результата. Предположим, что качество кластеризации измеряется по шкале от 0 до 100. Оно будет низким, если наблюдается слабая тенденция к кластеризации, число кластеров мало, а различия между ними незначительны.

Качество кластеризации будет высоким, если в результате процесса кластеризации получается множество кластеров или кластеры, которые очень сильно отличаются друг от друга (конкретный результат зависит от целей исследования). Низкое качество кластеризации указывает, что значительной разницы между кластерами, полученными с помощью АНС, не существует. Высокое качество кластеризации может указывать на множество различий. Результат кластеризации с помощью АНС следует сравнить с результатами (эталонами), полученными при использовании других способов кластеризации.

3. Устойчивость результатов кластеризации представляет собой еще один результат анализа. Важно оценить, насколько будут сходны результаты, полученные на разных подмножествах данных из одного входного множества. Кроме этого важна устойчивость результатов к информационным помехам и выбросам. Немаловажна также такая характеристика, как устойчивость числа кластеров по отношению к изменению порога кластеризации.

Под эмитентом во всех случаях


Под эмитентом во всех случаях будет подразумеваться открытое акционерное общество (компания, корпорация), основные ценные бумаги которого (акции и облигации) свободно продаются и покупаются на фондовом рынке. Предполагается, что под влиянием информации об эмитенте инвестор принимает управленческое решение. Категория управленческого решения в данной книге будет рассматриваться на двух уровнях. На первом уровне . это решение инвестора относительно ценных бумаг эмитента. Закрепленные в российском законодательстве права владеть, пользоваться и распоряжаться собственными инвестициями дают инвестору возможность предпринять одно из следующих действий относительно эмитента:  приобрести по подписке или на рынке долю уставного капитала эмитента или его долговые обязательства;  удерживать долю контролируемого уставного капитала на постоянном уровне;  увеличить долю контролируемого капитала до определенной величины;  уменьшить долю контролируемого капитала до определенной величины;  продать на рынке весь пакет акций;  продать на рынке часть или все принадлежащие инвестору облигации эмитента. На втором уровне . это решения на общем собрании акционеров. Из всего многообразия возможных решений будем рассматривать только наиболее часто встречающиеся:  решение о размерах выплачиваемых дивидендов;  требование о замене высшего менеджмента компании;  требование о замене внешних элементов корпоративного управления: реестродержателя, аудитора, внешней управляющей компании и т.п.;  требование о включении представителей инвестора в выборные органы управления компанией.

Это знание может оказаться полезным


Это знание может оказаться полезным также для компаний, намеревающихся проникнуть в тот или иной сектор экономики, с точки зрения оценки его привлекательности, возможностей для извлечения прибыли, а также происходящих в нем структурных изменений, которыми они могли бы воспользоваться в своих интересах. Поэтому самостоятельной задачей, решаемой в данной монографии, является разработка методики выявления стратегических групп. Специфическим порождением современной российской экономики являются так называемые «квазикоммерческие» компании-эмитенты. Их функция состоит не в увеличении прибыли, а в том, чтобы обеспечивать деятельность других, аффилированных к ним экономических субъектов. Обычно такие эмитенты накапливают задолженности и практически не развиваются. Однако выявить их на фоне других эмитентов, также находящихся в сложном экономическом положении, не всегда просто. Одной из задач данного исследования является выявление квазикоммерческих компаний, реклама ценных бумаг которых способна вводить в заблуждение инвесторов. Особенность российских стандартов отчетности и уникальное экономическое положение России ограничивают применение западного опыта для анализа проблем, стоящих перед российскими предприятиями-эмитентами. До сих пор никому еще не удалось получить набор значимых финансовых показателей, который характеризовал бы текущее финансовое состояние предприятий в условиях быстро развивающейся российской экономики. Определение минимального набора таких показателей, который легко бы воспринимался инвесторами и был полезен для принятия ими управленческих решений, также является задачей данного исследования. Актуальность этой задачи особенно велика в связи с тем, что доступная инвесторам отчетность предприятий часто характеризуется неполнотой и неточностью. Получение отсутствующих показателей и проверка показателей на достоверность требует от инвесторов определенных затрат. Поэтому очень важно, чтобы такие затраты были обоснованными и обеспечивали максимальную рентабельность в смысле принятия правильных управленческих решений. Сложность определения минимального репрезентативного состава показателей не всегда очевидна. Например, с точки зрения здравого смысла среди них не должно быть показателей с высокой корреляцией, так как информационная ценность их снижается пропорционально степени корреляции. Однако на практике нередко наблюдается дивергенция (divergence) таких показателей . ситуация, при которой два показателя не подтверждают друг друга. Часто это свидетельствует об ошибках их определения или недостоверности исходной информации. Но иногда дивергенция также сигнализирует об изменении тенденций, что крайне важно для инвесторов. Учет рыночных условий вынуждает также эмитентов прикладывать определенные усилия, чтобы обеспечить удовлетворительный уровень контролируемых показателей. Иногда усилия, направленные на улучшение тех параметров, которые являются общепринятыми на данный момент рыночными индикаторами финансового состояния компаний, могут наносить ущерб другим экономическим показателям. В результате возникает задача объективной оценки важности контролируемых показателей для повышения эффективности экономической деятельности эмитентов в будущем. Отдельного внимания требует крайне важная для инвесторов задача выявления возможности банкротства эмитентов. Для исследования банкротства существует несколько способов. Подход, который наиболее тщательно разрабатывался в течение трех последних десятилетий, рассматривает банкротство как необратимый процесс, признаки которого могут быть обнаружены в финансовой отчетности компании за два или три года до ее фактического банкротства. По мере приближения банкротства финансовые показатели компании ухудшаются все сильнее. Считается, что все компании-банкроты ведут себя более или менее сходным образом, поэтому основанные на данном подходе методы предсказания банкротств используют простой линейный дискриминантный анализ, например, предложенный Альтманом, а также широко применяемый Z-анализ. Однако в российских условиях более актуальна альтернативная гипотеза о предсказании банкротств, согласно которой тенденции в развитии предприятия, приводящие в конечном итоге к банкротству, имеют хронический характер, усиливаясь время от времени. Для российских эмитентовкрайне важной является способность адаптироваться к изменениям среды, в которой они действуют. Если руководство предприятия не способно достаточно быстро реагировать на изменения внешней среды, компания будет испытывать постоянные трудности, пребывая в состоянии нестабильности, которое ведет к увеличению риска банкротства. Этот процесс может протекать скрыто на протяжении ряда лет, и даже при исчезновении общеизвестных симптомов высокая вероятность банкротства сохраняется в течение длительного периода.

Анализируя финансовые показатели российских эмитентов


Анализируя финансовые показатели российских эмитентов с целью прогнозирования возможного банкротства, следует иметь в виду, что повышенный риск банкротства может проявлять себя несколькими различными способами, не предусмотренными классической теорией. Процесс, ведущий к банкротству, не обязательно развивается линейно на фоне последовательного ухудшения финансового состояния компании из года в год. В течение ряда лет нестабильность экономического положения, ведущая к несостоятельности, может быть скрыта за внешне благополучными контролируемыми экономическими показателями. Поэтому симптомы надвигающегося финансового краха следует искать, в том числе, за несколько лет до фактического банкротства, поскольку свежая финансовая отчетность может и не содержать признаков увеличения его вероятности. Результаты деятельности любого предприятия можно улучшить путем управления со стороны крупных акционеров . оказания соответствующих воздействий на менеджмент в рамках существующего законодательства. Подготовка таких воздействий требует формирования у акционеров новых знаний об организации управления. Существует различие между явным знанием, т.е. той информацией, которую можно найти в отчетности предприятий и информационных базах данных, и скрытым знанием, т.е. знанием, получаемым акционерами из опыта и передаваемым косвенным путем. Общая методологическая задача данного исследования состоит в том, чтобы дать крупным акционерам инструментпреобразования скрытого знания в явное. Разработка правильных управленческих решений в современных условиях требует использования эффективных методов выявления скрытых знаний, а также усовершенствованных способов обобщения и визуального представления больших объемов информации. Для этого необходимо использовать автоматизированные методы извлечения, обобщения и представления информации, выявления новых структур в массивах данных, а также извлечения новых знаний из имеющейся информации или опыта. Практика показывает, что часто вместо этого пытаются создавать лишь новые информационные системы, многие из которых просто переводят выявленную ранее информацию в новые форматы представления. Решение общей методологической задачи потребовало введения некоторых описанных в предыдущем разделе ограничений в следующих вопросах:  какова целевая аудитория потребителей знаний;  какими главными мотивами они руководствуются;  какими ресурсами располагают потребители знаний. На основе этого ниже будет описан процесс и процедуры организации знаний. В данной монографии не рассматриваются прикладные аспекты управления пакетами ценных бумаг, касающиеся стратегических инвесторов (захват управления, способы и методы получения ими прибыли от контролируемых предприятий), а также вопросы организации (с помощью перекрестного владения акциями) холдинговых компаний и финансово-промышленных групп. Кроме этого здесь не анализируются специфические аспекты международного инвестирования (методики минимизации странового риска, международные рейтинги и т.д.). В монографии не рассматриваются общая теория формирования оптимального портфеля и вопросы применения технического анализа с целью получения прибылей от краткосрочных колебаний котировок корпоративных ценных бумаг. Все эти аспекты требуют несколько иных подходов в управлении, чем рассматриваемые в данной книге.

Развитием метода временного анализа отдельных


Развитием метода временного анализа отдельных показателей является анализ коэффициентных параметров. В этом случае вместо отдельных показателей финансовой отчетности анализируются различные коэффициенты, получаемые по определенным алгебраическим формулам из простых показателей, нередко с использованием весовых коэффициентов, определяемых экспертным путем. Известно большое количество различных методик расчета таких коэффициентов, часть из которых построена на предположении о существовании одного комплексного показателя, наилучшим образом отражающего финансовое состояние предприятия. Обычно такие подходы используются с целью одномерного упорядочивания различных предприятий по величине комплексного показателя, призванного служить мерой сравнения предприятий. Однако все они не свободны от субъективизма авторов методик. Не смотря на то, что такие подходы разрабатываются уже более ста лет, гипотеза о существовании единой универсальной методики до сих пор не доказана. В целом метод одномерного упорядочивания имеет два существенных недостатка. Во-первых, будучи интуитивно привлекательными, однопараметрические описания являются слишком приблизительными для того, чтобы, основываясь на них, можно было принимать оптимальные решения. Во-вторых, алгоритм, позволяющий объективно ранжировать предприятия в различных экономических условиях, не известен никому. Для преодоления первого недостатка одномерного порядкового ранжирования можно использовать двумерное упорядочивание. Подобное ранжирование позволяет получить больше полезной информации, чем при помощи более простых и интуитивно понятных методов визуального представления данных. Однако двумерное упорядочивание может потребовать введения объективных координат, подобных тем же одномерным рейтингам. Традиционному подходу, основанному на двух «ведущих» финансовых коэффициентах (например, капитал/активы и прибыль/активы), недостает необходимой в данном случае объективности. В идеале картина финансового состояния предприятий должна определяться при помощи всех финансовых показателей. Большие группы переменных требуют применения многомерных методов анализа, которые включают в себя кластерный анализ и проекционные методы. Рассмотрим их более подробно. Совокупности финансовых показателей предприятия состоит из множества величин. Величины в таком выборочном наборе данных соответствуют некоторому набору статистических показателей. Набор показателей может быть выражен вектором, что означает просто упорядоченный набор числовых величин. В любой момент вектор, состоящий из n финансовых показателей предприятий, представляет собой точку в n -мерном пространстве. В том случае, когда существует только два или три измерения, достаточно легко бывает построить простые двумерные и трехмерные графики. Однако, если размерность данных больше, изобразить вектор или взаимосвязи между различными векторами графически весьма непросто. Именно поэтому необходимы другие методы визуального представления. Существует несколько методов обобщения наборов данных или статистических таблиц финансовых показателей предприятия. Простейшие из них представляют собой наборы основных статистических формул, позволяющие получить основные статистические характеристики данных. Например, наименьшее и наибольшее значения в наборе данных, медиану, первый и третий квартили. Такие простые методы очень полезны при обобщении наборов данных небольшой размерности. В графических методах визуального представления каждое измерение (компонента) многомерного набора данных влияет на некоторый аспект визуализации, а затем результаты объединяются воедино. Эти методы можно использовать для визуального представления разного рода многомерных данных. Главным недостатком большинства таких методов является то, что они не позволяют сократить количество данных. Если набор данных велик, то изображение, содержащее все элементы этих данных, не будет наглядным. Эти методы могут, однако, быть полезными для иллюстрации сокращенных обобщающих представлений наборов данных. Сокращение количества данных путем категоризации или группировки их сходных элементов называется кластеризацией данных. Группировка данных путем кластеризации является наиболее универсальной, поскольку людям свойственно упорядочивать информацию аналогичным образом. Одним из побудительных мотивов для использования кластеризации является стремление автоматизировать построение категорий. Кластеризация может также использоваться в целях минимизации влияния человеческой предвзятости и ошибок в процессе группировки данных. Кластерный анализ можно использовать в случаях, когда необходима группировка тех или иных образов (изображений предприятий в виде наборов финансово-экономических показателей), о взаимосвязях между которыми заранее не существует ясного представления. С помощью кластерного анализа исходные данные можно объединять в различные группы и подгруппы, представляемые графически в виде диаграммы, именуемой за ее форму дендрограммой (от греческого dendron . дерево).

Основные методы кластеризации можно разделить


Основные методы кластеризации можно разделить на два основных типа: иерархические и неиерархические. Внутри каждого из них существует огромное количество различных подходов и алгоритмов. Иерархическая кластеризация происходит последовательно либо путем объединения меньших кластеров в большие, либо путем разделения больших кластеров на меньшие. Методы кластеризации различаются правилами, которые используются для того, чтобы решить, какие из меньших кластеров будут объединены или какие из больших кластеров будут разделены. Конечным результатом этого алгоритма является дерево кластеров . дендрограмма, показывающая, каким образом кластеры соотносятся друг с другом. Когда два меньших кластера объединяются, в дендрограмме образуется более высокий уровень, и изображение объединенного кластера на новом уровне соединяется с изображениями кластеров на более низком уровне. Обрезав дендрограмму на нужном уровне, можно получить кластеризацию элементов данных по различным группам. Иерархические методы кластеризации являются наиболее наглядными и в примерах не нуждаются. Неиерархическая кластеризация состоит в непосредственном разделении набора данных на множество отдельных кластеров. Цель этого алгоритма состоит в том, чтобы определить границы кластеров как самых плотных областей в пространстве данных, т.е. определить кластер там, где имеется большое количество сходных элементов данных. Другой возможный подход включает в себя минимизацию некоторой меры различия выборок внутри каждого кластера при максимизации различия выборок из разных кластеров. В качестве примера неиерархической кластеризации рассмотрим наиболее распространенный метод K—средних. Чтобы выразить плотность входных векторов высокой размерности, используя меньшее число отобранных эталонных (reference) или модельных (model) векторов либо векторов «кодовой книжки» (code book vectors), производится минимизация средней ошибки квантования. Разница между входными выборочными векторами и эталонными векторами определяется как ошибка. Сравнивая все входные векторы со всеми эталонными векторами, можно указать те эталонные векторы, для которых эта разница (ошибка) является наименьшей. Соответствующий вектор может быть назван вектором-победителем. На практике каждый кластер может быть представлен одним или несколькими эталонными векторами. Основная проблема кластеризации методом K -средних состоит в исключительной важности выбора числа кластеров K , так как вид кластеров в большой степени зависит от значения K . Хорошее начальное приближение модельных векторов также является здесь важным, так как некоторые кластеры могут оказаться пустыми, если начальные значения лежат далеко от области распределения данных. Общей проблемой всех методов кластеризации является сложность интерпретации кластеров. В большинстве алгоритмов кластеризации предпочтение отдается определенной форме кластеров, причем алгоритмы стремятся поставить данные в соответствие кластерам именно выбранной формы, даже если в рассматриваемом массиве данных кластеров нет. Если целью исследования является не только сжатие размерности таблицы финансовых показателей, но и формирование суждения об их структуре, важно провести предварительный анализ на предмет того, имеют ли эти показатели в принципе тенденцию к кластеризации. Поэтому в общем случае использование кластерного анализа нуждаются в обосновании. На практике существуют и иные методы, которые могут быть использованы для сокращения размерности векторов данных. Некоторые из них носят название проекционных. Цель применения проекционных методов состоит в том, чтобы отобразить входные данные в пространстве меньшей размерности таким образом, чтобы определенные свойства структуры этих данных были сохранены с максимальной возможной точностью. Проекции можно также использовать для визуального представления данных в пространстве меньшей размерности.

Проекционные методы можно разделить на


Проекционные методы можно разделить на два основных типа: линейные и нелинейные. Линейные проекционные методы построены на том, что если n -мерный набор данных можно представить как n -мерное пространство, то двумерное пространство (т.е. плоскость) или одномерное пространство (т.е. прямая) будут представлять собой его подпространства. Множество данных может быть представлено в виде подмножества векторов, которые образуют линейное подпространство меньшей размерности. Каждый вектор m—мерного линейного подпространства (где m  n ) есть линейная комбинация m независимых базисных векторов. В качестве примера линейного проекционного метода рассмотрим метод анализа главных компонент (РСА . principal component analysis), являющийся стандартным методом изображения векторов данных большой размерности в виде линейной проекции на подпространство меньшей размерности. В соответствии с ним каждая компонента проецируемого вектора представляется как линейная комбинация компонент исходного элемента данных. Проекция получается посредством умножения каждой компоненты на определенный фиксированный скалярный коэффициент и сложения всех результатов. Существуют математические методы для нахождения оптимальных коэффициентов, таких, что дисперсия данных после проецирования сохраняется. Данный метод содержит наиболее интуитивно понятные и эффективные алгоритмы для вычисления проекций. Если данные в наборе имеют большую размерность, а их распределение отличается значительной асимметрией, то визуальное представление структур распределения такого набора данных с использованием линейных проекций на изображение малой размерности может оказаться затруднительным. Существует несколько подходов для отображения нелинейных структур данных большой размерности в пространствах малой размерности. Самые популярные из них воспринимают каждый элемент данных как точку в пространстве меньшей размерности, пытаясь затем оптимизировать отображение таким образом, чтобы расстояния между образами точек были бы сходны настолько, насколько это возможно при имеющихся исходных расстояниях между соответствующими исходными элементами данных. Разные методы отличаются лишь способом взвешивания различных расстояний и оптимизации отображения. В качестве примера нелинейного проекционного метода рассмотрим многомерное масштабирование (MDS . multi-dimensional scaling). Целью MDS является геометрическое представление набора данных. При помощи многомерного масштабирования формируется графическое представление, состоящее из точек, нанесенных на несколько плоскостей, которые, в свою очередь, позволяют обобщить основные признаки данных, будучи очень простыми в интерпретации. MDS относится к группе методов, которые широко используются в эконометрике для анализа субъективных оценок попарно сходных признаков объектов. Метод MDS начинается с рассмотрения матрицы, состоящей из попарных неоднородностей (различий) объектов. Здесь рассматриваются только ясно выраженные расстояния между элементами данных. Однако в MDS различия не являются расстояниями в чисто математическом смысле слова. MDS наиболее часто используется для создания пространств, объекты в которых могут быть представлены в виде векторов даже тогда, когда в наличии имеются лишь некоторые оценки различий между объектами. Он не только позволяет создать пространство, в котором были бы достоверно представлены соотношения данных, но дает возможность сократить размерность набора данных до достаточно малой величины, которая допускала бы визуальную оценку этого набора.

Другой нелинейный проекционный метод, тесно


Другой нелинейный проекционный метод, тесно связанный с многомерным масштабированием представляется с помощью отображения Сэммона (Sammon’s mapping). Данный алгоритм также пытается подогнать попарные расстояния в отображении малой размерности элементов данных к их исходным расстояниям. Разница между отображением Сэммона и метрическим MDS состоит в том, что при отображении Сэммона малые расстояния сохраняются в большей степени. В метрическом MDS большим расстояниям придается относительно больший вес при вычислении проекции, в то время как в отображении Сэммона все вклады нормируются. Как указывалось в предыдущем разделе, обычно анализ финансового состояния компаний на предмет прогнозирования банкротства проводится на основании коэффициентов, получаемых из финансовых данных, публикуемых самими компаниями. К этим данным применяются традиционные методы, основанные на одномерном или многомерном статистическом анализе. Наиболее популярными среди них являются такие многомерные статистические методы, как дискриминантный анализ и логистическая регрессия. Общим в этих методах является то, что все они имеют целью получение некоторой оценки, которую можно было бы легко интерпретировать как показатель платежеспособности компании. Хотя такие оценки и показатели часто полезны, они не свободны от недостатков, причиной которых является информация, на которой они основываются. Разные компании могут обладать различной финансовой структурой и одновременно иметь при этом одинаковые значения показателя платежеспособности. Поэтому однозначно определить финансовые признаки, характеризующие компанию или стоящие перед ней проблемы, на основании одного только показателя платежеспособности нельзя. С математической точки зрения все методы визуального представления сложных многомерных данных призваны снизить их размерность, т.е. сжать массивы финансово-экономических параметров предприятий с минимальной потерей информации. Иными словами, нужно определить наименьшее число переменных, которые являлись бы функциями исходных данных, с целью повышения их содержательности. При наличии ограничения, согласно которому новые переменные должны представлять собой линейные комбинации старых, для решения подобной задачи часто используется метод главных компонент (МГК), реализуемый с помощью компьютерных программ. Геометрически МГК имеет целью нахождение гиперплоскости, которая наилучшим образом описывала бы входные данные. МГК аналогичен максимизации содержания информации в рассмотренных выше алгоритмах, осуществляющих разделение на классы с помощью гиперплоскостей. Преимущество МГК перед обычной статистической процедурой состоит в отсутствии необходимости производить расчет полной корреляционной матрицы. В данном методе первые собственные вектора этой матрицы вычисляются с помощью электронного алгоритма адаптивно и исходя непосредственно из входных данных. Это дает существенную экономию вычислительных ресурсов при значительном сжатии данных. Данный метод позволяет находить комбинации первых собственных векторов без поиска этих векторов как таковых. Линейный МГК дает возможность ясно судить о качестве сжатия данных. Ошибка, минимизированная с помощью МГК, представляет собой сумму расстояний между точками входных данных и их проекциями на некоторую гиперплоскость. Будучи выровненной по дисперсии, данная величина указывает на относительное несоответствие данных, образовавшееся в результате сжатия. Дополнительная величина . отношение дисперсии данных, спроецированных на гиперплоскость, к исходной дисперсии входных данных . максимизируется посредством МГК.

Еще одним результатом МГК является


Еще одним результатом МГК является возможность оценки относительной значимости отдельных финансово-экономических показателей предприятия. МГК дает четкий показатель качества представления данных определенным числом главных компонент (первых собственных векторов). Это дает возможность графически представить значения относительной точности реконструкции входных данных на примере небольшого числа первых компонент. Чем выше порог каждого показател(процентная доля в общей дисперсии), тем выше значимость этого показателя в главных компонентах, т.е., в конечном итоге, значимость этого показателя в общем анализе финансовой деятельности предприятия. Такая техника позволяет осуществить объективное извлечение наиболее ценных финансовых коэффициентов без вмешательства человека. Однако на практике суммарная дисперсия для двух главных компонент обычно невелика (значительно меньше 0,5). Это свидетельствует о том, что МГК не в состоянии привести данные к двумерному виду, что является необходимым для наглядного визуального представления. Кроме этого данный метод имеет ряд слабых мест, влияющих на надежность получаемых результатов. Во-первых, это касается допущения линейности. Во-вторых, существует проблема коррелированных друг с другом показателей во входных данных. Поэтому МГК нельзя рекомендовать в качестве приемлемого метода сжатия массивов финансово-экономических параметров предприятий. Попытки точного описания модели стоимости пакетов ценных бумаг ведут к получению системы нелинейных уравнений большой размерности, в которых отдельные компоненты стоимости сложным образом зависят от большого числа переменных. Среди них имеются как внутренние (финансово-экономические показатели предприятия), так и внешние (главным образом, макроэкономические и конъюнктурные показатели). Такого рода системы явным образом, как правило, не решаются. В этих случаях для прогноза стоимости пакетов ценных бумаг часто используется численное моделирование методом Монте-Карло. Метод состоит в формировании большого числа путей с дискретными шагами. Продвижение вперед во времени зависит от заранее заданных значений смещения и скорости изменения. Процедуру оценки стоимости пакета можно описать следующим образом. В первую очередь моделируется большое число путей для объясняющей случайной переменной, представляющей собой вектор показателей, влияющих на стоимость. Затем рассчитываются финансовые параметры, соответствующие состоянию этой переменной, и, наконец, вычисляется рассчитанная таким образом текущая цена пакета. Теоретически ошибка оценки среднего значения может устанавливаться произвольно. Но так как уровень точности пропорционален квадратному корню из числа путей, увеличение точности быстро приводит к значительному возрастанию объема вычислений. Чтобы решить эту проблему, используются различные методики, сокращающие время вычислений. Однако любая из них нуждается в обосновании, так как в каждом конкретном случае способна резко увеличить ошибку вычислений. Главным же недостатком данного подхода является неизбежный субъективизм в определении и математическом описании факторов, влияющих на стоимость пакета. Классический подход к моделированию инвестиционного риска инвестора исходит из нормального распределения доходности принадлежащих ему ценных бумаг. Взаимосвязь между риском и доходностью представляется в двумерном пространстве: среднее значение (доход) и дисперсия (риск). Если показатели дохода дают нормальное многомерное распределение, то степень рискованности всего принадлежащего инвестору портфеля определяется лишь матрицей ковариации показателей дохода. Стоимость риска . это оценка максимального убытка, ожидаемого на протяжении заданного периода. Как правило, эта величина оценивается с помощью моделирования по методу Монте-Карло или исторического моделирования. Проблемы, связанные с моделированием по методу Монте-Карло, имеют природу, аналогичную описанной в предыдущем абзаце, и в данном случае связаны, главным образом, со сделанным допущением о нормальности распределения. Ограниченность исторического подхода состоит в том, что его результаты в значительной мере зависят от поведения дохода на протяжении рассматриваемого периода (например, в случае периода понижения котировок риск может быть недооценен). Имеются сведения [1], что результаты применения этих методов к одному и тому же портфелю могут расходиться между собой в 14 раз.

основанные на использовании микроимитационных моделей,


Методы, основанные на использовании микроимитационных моделей, настолько хорошо применимы к решению задач прогнозирования финансово экономического состояния предприятий, что заслуживают отдельного рассмотрения. Такие модели значительно эффективнее обычных графических моделей (price patterns), которые проявляют предсказательную способность на одномерных данных с высокой однородностью и позволяют выявить ситуации продолжения и смены тенденций. Микроимитационные модели относятся к группе аналитических вычислительных моделей, которые могут оперировать с отчетными данными по предприятиям (данными микроуровня). Модели этого класса получили в последнее время широкое распространение в качестве инструмента анализа возможных последствий решений по управлению предприятиями. Растущая популярность этих моделей наблюдается не только в развитых странах, но и во всем мире. В ряде случаев они являются лучшим средством для анализа возможных последствий управленческих решений. Эти модели позволяют оценивать не только суммарный экономический эффект в результате принятия того или иного управленческого решения, но и то, как изменятся отдельные финансовые параметры предприятия-эмитента. С помощью этих моделей можно рассчитать ожидаемые дивиденды и показать, какой будет доходность для акционеров при разных вариантах управленческих решений. В частности, микроимитационные модели также позволяют:  получить оценки ожидаемых недивидендных доходов от предприятия государством;  примерно оценить «недобор» доходов от предприятия;  будучи дополненными макроэкономической моделью и обратными связями между предприятием и экономикой, дают возможность анализировать влияние внешних факторов на предприятие. Возможность проведения перечисленных выше типов исследований делает микроимитационные модели незаменимым инструментом для подготовки управленческих решений крупных акционеров. Использование микроимитационных моделей предъявляет высокие требования к информационному обеспечению. Поэтому в России они пока не получили широкого распространения. В значительной мере это объясняется высокими требованиями микроимитационного моделирования к качеству и количеству исходных данных, которые для отечественных эмитентов собрать достаточно сложно. Именно поэтому в настоящее время для решения задач прогнозирования следует отдать предпочтение алгоритмам АНС, менее критичным к качеству исходных данных. Однако по мере того, как растет информационная прозрачность эмитентов, и данные о предприятиях становятся более доступными, а также по мере развития компьютеризации, эффективное использование подобных моделей в России может стать более реальной задачей.

Единых научно обоснованных правил построения


Единых научно обоснованных правил построения такой выборки не существует. Если множество, из которого делается выборка, относительно однородно, то можно ограничиться построением обычной случайной выборки. Однако если в периоде наблюдений имеются существенные изменения экономической ситуации, или если изучаемая совокупность предприятий неоднородна, то прежде, чем строить выборку, необходимо кластеризовать данные. Использование конкретных методов кластеризации зависит в каждом конкретном случае от свойств генеральной совокупности изучаемых объектов. Для разбиения генеральной совокупности предприятий на предприятия можно использовать такие признаки, как размер предприятия, его отраслевая принадлежность, уровень получаемых доходов и выплачиваемых налогов и т.д. Такая кластеризация может быть эффективно проведена с использованием АНС. Для выявления неоднородности временных рядов и нахождения границ однородных интервалов чаще используются методы классической статистики. Использование вместо сплошного ряда данных по случайной выборке позволяет существенно снизить требования к емкости постоянной памяти и быстродействию компьютеров. При этом если выборка репрезентативна, полученные результаты по своей надежности приближаются к тем, которые могли бы быть получены при работе с данными по генеральной совокупности. Данные из балансовых отчетов желательно дополнить сведениями, полученными из других источников. Например, данными налоговых, лицензирующих и регистрирующих органов. На практике добавление к записям данных дополнительной информации может быть осуществлено двумя способами. Во-первых, можно каждой записи из основной базы данных поставить в соответствие запись из другой базы данных, которая содержит другие данные. Поскольку заранее не известно, к какому объекту конкретно относятся записи в обеих базах данных, привязка одних записей к другим должна производиться с использованием характеристик, данные по которым имеются как в одной, и в другой базе данных, например название эмитента, ИНН и т.д. В результате будет получена база данных по предприятиям, которая содержит не только основную информацию, но и дополнительную, позволяющую обнаруживать и удалять ошибочные данные. Во-вторых, можно установить зависимость между переменными, включаемыми в балансовые отчеты (например, размер полученной прибыли, налоги и т.д.), и иными данными с помощью регрессионного анализа. Для всех основных финансово-экономических показателей можно построить уравнения регрессии, отражающие их связь. Коэффициенты этих уравнений можно найти по временным рядам из баз данных.

в прошлом. При решении задачи


Данные микроуровня всегда относятся к какому-то конкретному временному срезу в прошлом. При решении задачи прогнозирования и определения будущих тенденций эти данные необходимо экстраполировать на будущее. Один из самых простых способов экстраполяции данных заключается в экстраполяции по отдельным кластерам. При этом целесообразно максимально подробно учитывать сложившиеся тенденции и прогнозы макроэкономических показателей (инфляция, курс рубля, рост промышленного производства и др.), полученные из других источников и регрессионного анализа. Следует оценить, какие регрессии носят стабильный характер. Если зависимость между двумя параметрами носит статистически устойчивый характер, один параметр (о котором известно больше, например, официальные прогнозы ВВП, инфляция и т.д.) можно использовать для прогноза другого, например, объемов продаж или балансовой прибыли предприятий. Имея экстраполяцию выборочных данных микроуровня на нужный период, можно рассчитать по этим данным искомые показателя и доумножить полученные результаты на весовые коэффициенты, чтобы перейти от выборочных данных к данным по генеральной совокупности предприятий. Программа экономических расчетов при этом, как правило, должна выполнять вычисления в нескольких вариантах: в зависимости от управленческих решений акционеров. В общем случае программа экономических расчетов представляет собой компьютерную программу, которая по некоторым заданным правилам рассчитывает предполагаемые дивидендные выплаты и другие интересующие акционеров показатели работы предприятия. По существу эта программа является некоторой совокупностью формул расчета, эмитирующих порядок экономических расчетов на предприятии, а также расчетов, которые делаются при обосновании инвестиционных проектов. Заменяя одни формулы расчета другими, отражающими предлагаемые управленческие решения, можно рассчитать их вероятные последствия. Программу расчетов можно построить с учетом и более сложных взаимосвязей, таких как ответная реакция предприятий на управленческие решения акционеров. Например, если имеющиеся данные свидетельствуют о том, что при существенном увеличении выплачиваемых дивидендов реальные активы предприятия вследствие эффекта деинвестирования могут резко сократиться, подобную закономерность (эластичность) можно «встроить» в программу расчетов. При попытках увеличить размер дивидендов сверх критического в модели будет снижаться балансовая прибыль предприятия. Другим примером поведенческих реакций предприятий на управленческие решения может быть изменение уровня капиталовложений, объема выпуска или объема расходов на персонал. Трудность с учетом подобных ответных реакций состоит в том, что даже в странах, экономика которых достаточно стабильна и временные ряды по предприятиям данных накоплены за достаточно длинный период, специалистам бывает нелегкоприйти к единому мнению о том, в каком направлении и с какой силой действуют эти факторы, поскольку действуют они одновременно и в разных направлениях. В России, где данных, необходимых для оценки подобных ответных реакций, практически не существует, включить подобные взаимосвязи в микроимитационные модели пока невозможно, а если это будет сделано, полученные выводы могут оказаться ошибочными. Это резко снижает эффективность использования таких моделей. Со временем, когда удастся накопить более длинные временные ряды, в модель можно будет включить и ответные реакции предприятий на управленческие решения. В принципе возможно также использование коэффициентов эластичности, характеризующих подобные взаимосвязи в других странах, однако в этом случае необходимо провести дополнительное исследование, чтобы установить применимость подобной «внешней» информации к России.

Поскольку главная идея микроимитационного моделирования


Поскольку главная идея микроимитационного моделирования заключается в том, чтобы, используя одни и те же исходные данные, рассчитать, какой финансовый эффект будет при различных управленческих решениях, программа экономических расчетов на практике будет иметь очень сложную структуру. В результате модели, в которых пользователь имеет возможность вводить необходимые изменения в диалоговом режиме, и которые позволяют оперативно менять основные выходные параметры предприятия, получаются достаточно громоздкими. Требования к структуре и программному обеспечению микроимитационных моделей во многом зависят от задач исследования и от возможностей программистов. Модель должна быть написана на таком языке программирования, с которым знакомо большинство программистов, и должна быть построена так, чтобы при передаче ее в эксплуатацию другим пользователям у новых программистов не возникало трудностей. Если же в будущем возникнут новые потребности, ни база данных, ни программный код не должны меняться радикальным образом. Модель должна быть достаточно гибкой, чтобы с ее помощью можно было анализировать не только те предполагаемые в ближайшем будущем изменения, но и проблемы, которые могут представлять интерес в будущем. Поскольку все расчеты по микроимитационной модели производятся на уровне отдельных предприятий, группировать полученные результаты расчетов для их последующего представления можно по любому принципу. Чаще всего используются группировки предприятий по выявленным во входном массиве данных кластерам. В таблицу сводных результатов целесообразно включить следующие показатели: суммарное изменение доходов акционера при различных сценариях экономического роста, прогноз бюджетных доходов и их приростов в различных условиях и суммарные показатели по доходным группам. Как правило, программа, формирующая отчеты по результатам расчетов, пишется на том же языке программирования, что и программа экономических расчетов. Одно из последних достижений в области микроимитационного моделирования заключается в более широком использовании обратных связей между экономическим поведением предприятий и управленческими решениями акционеров. Оно может быть полезно, главным образом, для такого акционера как государство. Предположим, например, что предлагаемое увеличение дивидендов приведет к снижению прибыльности предприятия на 10%. Поскольку это снижение, по сути, означает удорожание капитала, можно ожидать падения инвестиций и объемов выпуска продукции. Если подобные обратные связи действительно сработают, произойдет сокращение масштабов экономической деятельности, и в результате общие поступления в бюджет за счет налоговых платежей могут снизиться. Этот цикл может продолжаться и дальше: падение экономической активности, падение налоговых поступлений и так далее. Если подобные обратные связи включены в микроимитационную модель, расчеты по ней производятся так: вначале оценивается падение производства в качестве прямого результата предлагаемого управленческого решения, затем вводятся изменения в показатели производства и рассчитывается сокращение доходов, получаемых государством-акционером в результате такого решения. Для моделей этого типа необходимо иметь очень хорошие, детальные исходные данные, которые позволили бы оценить реакцию предприятий на управленческие решения крупных акционеров. Получить подобные оценки поведенческих реакций очень непросто, особенно если речь идет о странах с переходной экономикой, к числу которых относится Россия. В принципе, модель подобного типа можно построить и здесь, однако, скорее всего при этом окажется, что выдаваемые ею результаты будут слишком сильно зависеть от используемых предположений относительно ответной реакции предприятий от управленческих решений. В заключение данного раздела следует отметить, что наиболее общие методы, используемые в мире для анализа финансового состояния предприятий, связаны с применением эконометрических моделей, за каждой переменной которых стоит определенный статистический индикатор, с той или иной точностью измеряющий какую-то сторону хозяйственной деятельности предприятия. В ряде случаев они позволяют выявить конкретные количественные взаимосвязи экономических процессов, протекающих на предприятиях-эмитентах, с индикативными показателями, доступными для инвесторов. Однако в современных российских условиях использование разработанных на основе западной практики моделей по очевидным причинам затруднено. Отечественная эконометрика пока не создала широко известных моделей, о достоинствах и недостатках которых можно было бы судить с учетом опыта их использования. В целом результаты применения традиционных технологий оценки и прогнозирования финансового состояния эмитентов, а также реальной стоимости пакетов их ценных бумаг можно назвать ограниченными. Ограниченность этих методов состоит в их зависимости от исходных условий и отсутствии гибкости. Они не способны учитывать то, что относительная значимость отдельных показателей финансовой отчетности и определяющих их факторов на практике меняются со временем, подчас очень резко и непредсказуемо. Кроме этого традиционные подходы характеризуются ограниченной информативностью, так как предназначены для описания качественных факторов или закономерностей в количественных терминах. Таким образом, на смену традиционным технологиям должны придти новые подходы . более эффективные в условиях структурной нестабильности российской экономики.

с учителем, представляют собой средства


Нейронные сети, обучаемые с учителем, представляют собой средства для извлечения из набора данных информации о взаимосвязях между входами и выходами нейросети. Эти взаимосвязи могут быть переведены в математические уравнения, которые можно использовать для прогнозирования или выработки управленческих решений. «Учителем» в данном случае является набор параметров, который исследователь помещает на выходе сети. На вход сети при этом подается соответствующий данному выходу входной набор данных. Сеть обучается устанавливать взаимоотношения между заданной исходной информацией и результатами в ходе адаптивного итерационного процесса. Иначе говоря, структура сети по определенным алгоритмам подстраивается таким образом, чтобы минимизировать критерии расхождения входных и выходных параметров. Данный процесс повторяется многократно с использованием новых пар наборов входных и выходных данных. В результате структура сети «запоминает» сходные признаки всех этих наборов. Сеть, которую однажды уже обучили таким образом, может быть использована для обработки входных данных, которые ей ранее никогда не предъявлялись. Когда такие данные подаются на вход обученной сети, на ее выходе появляются параметры, сформированные с использованием всех сходных признаков обработанных ранее сетью данных. Таким образом, в нейросетевых методиках, предполагающих обучение с учителем, для нахождения образа или соотношения между данными требуется, чтобы один или более выходов были точно заданы вместе с одним или более входами. Алгоритм работы сети, обучаемые без учителя, основывается на соревновательном обучении. В этом случае тестовые выходные данные не используются. Алгоритм предполагает такое поведение нейронов сети, что при каждой подаче очередного набора данных на вход они как бы «соревнуются» друг с другом на наилучшее соответствие входному набору по выбранным критериям. В результате соревнования определяется нейрон-победитель, после чего структура сети подвергается коррекции. Коррекция начинается с нейрона-победителя и производится в направлении увеличения его соответствия входному сигналу. После этого коррекция переходит на нейроны, непосредственно примыкающие к нейрону-победителю и далее. При этом по мере удаления от нейрона-победителя интенсивность коррекции постепенно снижается до нуля. Нейроны сети, обучаемой без учителя, как правило, образуют двумерную решетку. Алгоритм обеспечивает сохранение топологии отображения из пространства большой размерности (представленного совокупностью наборов входных данных) в элементы данной двумерной решетки. Таким образом, это отображение является отображением пространства большой размерности на плоскость. Свойство сохранения топологии означает, что алгоритм распределяет сходные векторы входных данных по одним и тем же нейронам, т.е. точки, расположенные в пространстве входов близко друг к другу, будут отображаться на близко расположенные выходные элементы-нейроны. Данный алгоритм анализирует входные данные и показывает выходную информацию как бы на плоской индикаторной панели с помощью активизируемых нейронов. Это позволяет обучить нейронную сеть узнавать или находить взаимосвязи между входами и выходами, либо организовывать входные данные таким образом, чтобы выявлять в них ранее неизвестные образы или структуры. Обозначим класс самоорганизующихся нейронных сетей, обучаемых без учителя, термином адаптивные нейронные сети (АНС). Рассмотрим подробнее основные свойства таких сетей и покажем, что они наилучшим образом позволяют решать задачи, сформулированные в соответствующем разделе монографии. Важным достоинством метода АНС является то, что он представляет собой численный, а не символьный метод обработки данных. В процессе вычислений многие расчеты обрабатываются соревновательно. Это дает возможность широко использовать параллельную обработку данных в компьютерах (parallel processing). Одной из уникальных особенностей АНС является то, что она предоставляет внутренне присущие ей точные и простые механизмы для разделения вычислительной задачи на субъединицы. Такая внутренне присущая параллельность позволяет проводить вычисления с помощью высокопроизводительной архитектуры с высокой степенью параллельности.

Немаловажно то, что АНС относится


Немаловажно то, что АНС относится к классу методов, предполагающих обучение без внешнего вмешательства, что обеспечивает повышение объективности результатов. Обучение без учителя дает возможность обнаруживать во входных наборах данных неизвестные ранее структуры или закономерности, что отражает способность АНС к обобщению (generalization) на основе входных примеров. Это свойство позволяют обобщать большие наборы многомерных данных, которыми являются финансово-экономические показатели предприятий, выявлять и демонстрировать содержащиеся в них структуры, а также обнаруживать новые образы и взаимосвязи в таких наборах данных. Свойство обобщения можно также интерпретировать как способность вычислительной нейросистемы производить обработку входных данных таким образом, чтобы получить ощутимый отклик на не встречавшийся ранее воздействие. Это означает, что подобные нейронные сети могут узнавать или характеризовать входные данные, с которыми они никогда прежде не имели дело. Новый вектор входных данных соотносится с теми выходными элементами, на которые он отображается. При этом в формировании отклика принимает участие вся та информация, которая была внесена в сетевую структуру в ходе предшествующего обучения. Достоинством метода АНС служит также то, что данный метод является непараметрическим, т.е. не требует априорных предположений о форме распределения данных. В частности, он не требует априорных предположений о виде функционала процесса, формирующего структуру входных данных, и распределения, характеризующего динамику изменения во времени финансово экономических показателей предприятий. Алгоритм АНС может быть использован для того, чтобы получить картину распределения структуры входных данных и ее изменения с течением времени на материале набора исторических данных. Прибегнув затем к численному моделированию (например, методом Монте-Карло), можно получить прогноз изменения структуры входных параметров в долгосрочной перспективе. В сущности, все нейронные сети являются мощным инструментом прогнозирования. Заложенные в них генетические алгоритмы, эволюционируя естественным путем, позволяют выявить правила и стратегии, преследующие множественные цели. Таким образом, при введении одного или большего числа ограничений можно оптимизировать систему в любом направлении ее развития, что позволяет осуществить направленный прогноз. Поэтому АНС могут служить хорошим инструментом для изучения динамики процессов, характеризуемых потоками входных данных. Причина этого кроется в том, что АНС основаны на нейросетевой технологии, позволяющей анализировать нелинейности, сохраняя топологию и распределение данных, что представляет существенную важность для прогнозирования. Экономическая деятельность предприятий основана на планировании (если не стратегическом, то хотя бы краткосрочном). Поэтому исторические данные по финансово-экономическим показателям обладают свойством персистентности (persistence), математически трактуемым как свойство временного ряда следовать тенденции. Если определенная тенденция увеличивалась за предыдущий период, имеется ненулевая вероятность того, что она продолжит увеличение в течение последующего периода. Предварительный анализ показывает, что показатель Хурста (Hurst exponent, H) для основных параметров финансовой отчетности большинства российских предприятий в поквартальном измерении соответствует требованиям для персистентных рядов или рядов с тенденцией к усилению (0,5 < H < 1,0).

Среди положительных качеств метода АНС


Среди положительных качеств метода АНС следует отметить то, что он обеспечивает высокую наглядность результатов. Алгоритм АНС одновременно выполняет две задачи: проецирование и кластеризацию, обеспечивая наглядное представление многомерных входных данных на плоскости выходных данных в виде кластеров. Различные нейроны с помощью метода АНС автоматически окрашиваются в соответствии с активностью воздействия на них входных сигналов. Сходные сигналы вызывают активность одних и тех же нейронов. Таким образом, нейроны группируются в компактные кластеры, характеризующейся близкой интенсивностью окраски. Это изображение четко проступает на плоскости выходных данных АНС. Особую важность представляют топологические свойства результирующей картины, так как они позволяют находить в непосредственной окрестности нейрона, соответствующего тому или иному набору входных данных, другие наборы, близкие ему по своим характеристикам. Алгоритм АНС обеспечивает также возможность визуализации различных входных показателей из всех обработанных наборов. В общем случае каждый балансовый показатель на плоскости выходных данных выделяется отдельным цветом, а различия в его значениях передаются оттенками этого цвета. Ячейки плоскости с высокими значениями того или иного показателя оказываются окрашенными более интенсивно. Организованная подобным образом АНС обладает свойством интерактивности. На плоскости выходных данных можно получить распределение любого признака входного массива данных. Она может проиллюстрировать даже динамику сложного процесса путем демонстрации траектории любого балансового показателя на плоскости. Такие возможности реализованы в программных продуктах, основанных на методе самоорганизующихся сетей. Применение этих продуктов не требует специальной математической подготовки. Наконец, метод АНС демонстрирует высокую работоспособность в условиях неполноты данных, что резко выделяет его из остальных известных методов анализа структурированных наборов данных. Иначе говоря, на вход АНС могут подаваться наборы финансово-экономических показателей предприятий с существенными пропусками данных внутри набора. Алгоритм АНС не только позволяет успешно обрабатывать такие данные, но и восстанавливать некоторые отсутствующие значения на основе информации, полученной ранее при обучении АНС. Объяснением этого является присущая нейронным сетям «стойкость к неисправностям» (fault tolerance) . свойство, позволяющее системе функционировать и ухудшать работу плавно при отключении малого числа обрабатывающих элементов. В совокупности с описанным выше свойством обобщения эта особенность АНС обеспечивает ее повышенную устойчивость к информационным помехам. Иначе говоря, ошибки операторов при заполнении матриц финансово-экономических показателей предприятий не приводят в каждом таком случае к получению резко искаженных результатов, а в значительной мере элиминируются обученной сетью. Все эти свойства делают АНС наиболее приемлемым инструментом для анализа финансовой отчетности предприятий-эмитентов и весьма полезным элементом системы информационного обеспечения принятия решений акционеров. С помощью АНС можно выявить более тонкие особенности поведения компаний, чем при использовании некоторых более традиционных аналитических средств, подобных, например, линейному дискриминантному анализу. Новые образы и связи могут быть использованы для прогнозирования деятельности эмитентов, определения рыночных цен пакетов акций, принятия управленческих решений об инвестициях в ценные бумаги, управления рисками и инвестиционным портфелем, выявления перспективных эмитентов и решения многих других задач. Финансовые и экономические приложения с использованием самоорганизующихся сетей показывают, что конкретных процедур либо оптимальных методов их применения, которые годились бы для всех областей применения, не существует. Подобно разработке других нейросетевых моделей, создание самоорганизующихся сетей является пока еще, скорее, искусством, чем наукой.

Поэтому их можно использовать только


Поэтому их можно использовать только тогда, когда анализируемые данные хорошо понятны для исследователя. Профессиональная экспертная оценка выходных результатов является довольно существенным элементом анализа при помощи самоорганизующихся сетей и играет в нем важнейшую роль. Использование АНС для анализа финансовых отчетов и другой информации об эмитентах позволяет обнаруживать структуры в больших наборах данных и представлять данные большой размерности в виде двумерных изображений. Это дает возможность с высокой эффективностью решать задачу выявления важных закономерностей в экономической деятельности эмитентов и интерпретировать их с точки зрения интересов инвесторов. С помощью АНС многомерные данные, публикуемые эмитентами, могут быть преобразованы в наглядные плоские картины, доступные восприятию людей, принимающих решения. Исследование паттерн (образов) в структуре входных данных позволяет анализировать особенности экономической стратегии эмитентов. Диагностика финансового положения компаний на основании визуального исследования становится более объективной и оперативной. Кроме этого использование АНС позволяет значительно повысить качество традиционно публикуемой эмитентами информации, предоставляя лучшую основу для выбора, сравнения и ранжирования данных. Методы АНС можно использовать для демонстрации четких различий и структурных особенностей данных по лучшим предприятиям. При этом в качестве входных данных следует использовать балансовые показатели предприятий, коэффициенты эффективности, оценки рисков, опыт экспертов в области финансового анализа деятельности компаний, а также данные о котировках ценных бумаг на организованных рынках. АНС позволяют упростить классификацию предприятий и создать таблицы для обеспечения принятия решений, более информативные по сравнению с простыми ранжированными списками, построенными исходя из единичных и множественных критериев. Двумерное представление финансовой информации является более мощным средством, чем обычное ранжирование, оно дает гораздо больше информации для инвесторов и облегчает выявление неравномерностей в больших массивах сложных финансовых данных. АНС позволяют провести дифференциацию между близкими по характеристикам предприятиями и определить основные признаки каждого кластера или группы кластеров. Метод АНС повышает эффективность принятия управленческих решений. Доказано [1], что благодаря возможности кластеризации эмитентов с похожими характеристиками, доходность портфеля акций, составленного на основе этого метода, выше, чем у портфеля, сформированного исходя из единственного критерия максимизации доходности при приемлемом риске или с помощью других классических стратегий. Таким образом, использование АНС открывает новые возможности для формирования оптимальной стратегии управления большими портфелями ценных бумаг. Методика АНС позволяет финансовым и экономическим данным говорить самим за себя. Например, когда на вход сети подаются финансовые данные о группе компаний, на плоскости выходных параметров они размещаются таким образом, что компании со сходными финансовыми характеристиками оказываются расположенными близко друг к другу. Группировка компаний согласно сходству финансово-экономической структуры позволяет решать задачу выявления стратегических групп. Упорядочивание выборочных входных данных по таким группам дает возможность определить правила или описать групповые характеристики. При этом возникают новые данные . параметры порядка (order parameter) . переменные, которые в нелинейных динамических системах интегрируют индивидуальные переменные, влияющие на систему. При определении границ групп в дополнениек АНС полезно использовать кластерный анализ. Он позволяет подтвердить и детализировать результаты, полученные методом АНС. АНС можно использовать для диагностики финансового состояния компаний, принадлежащих к одному и тому же сектору экономики с тем, чтобы определить стратегию каждой конкретной компании по отношению к сектору экономики, в котором она действует. Кроме этого можно сравнивать финансовые и экономические показатели различных стратегических групп компаний.

Выходная информация АНС способна хорошо


Выходная информация АНС способна хорошо иллюстрировать процесс эволюции тенденций в деятельности корпоративных предприятий с течением времени. Кроме того, с помощью АНС можно провести сравнение различных компаний по отдельным отраслям. Распределение выходных данных наглядно отображает сходства и различия между компаниями, что позволяет сравнивать финансовое положение выбранной компании с положением конкурентов и создавать секториальные карты. Благодаря методу АНС, использующему многомерные множества входных данных, можно проследить относительную изменчивость показателей отдельных компаний по отношению к изменчивости групп. Это позволяет решать задачу выявления квазикоммерческих компаний и определять их отличительные признаки. В общем случае распределение различных компаний в пространстве признаков характеризуется нерегулярностью, наличием нелинейностей и неоднородностей. Однако АНС позволяет сделать более наглядными сложные ситуации с помощью соответствующих друг другу компонент, выделяя при этом множество нестандартных случаев. Таким образом, сетью выявляются нетипичные компании и компоненты. Метод АНС позволяет значительно усовершенствовать процесс создания оценочных критериев и снизить затраты на их поддержание и обновление. Это дает возможность использовать его при решении задачи определения минимального набора показателей, с достаточной надежностью характеризующих финансово-экономическое состояние предприятий. Данный подход целесообразно иллюстрировать визуальным представлением информации по отдельным компаниям, построением эталонных тестов и выведением наиболее приемлемых показателей для сравнения эффективности инвестирования в ценные бумаги различных эмитентов. В ходе анализа инвестиций в ценные бумаги предприятий с помощью АНС особого внимания заслуживает процесс масштабирования компонент для выделения отдельных аспектов информации. Для изменения отдельных компонент либо акцентирования внимания на оцениваемых свойствах можно использовать анализ чувствительности. Данный анализ позволяет решать задачу оценки относительной важности контролируемых показателей. Важность каждого показателя тем выше, чем сильнее меняется выходная картина при проведении эталонного масштабирования. Информацию о том, каким образом различные входные переменные вносят вклад в отображение предприятий на плоскости выходных параметров, можно получить также, представив Преимущество графического представления АНС состоит в том, что оно дает наглядное разделение компаний на два класса: потенциальных банкротов и платежеспособных. Подавая на вход обученной сети набор данных новой компании, необходимо лишь посмотреть на плоскость выходных параметров и определить, в какой зоне оказались наиболее активные нейроны. Если они располагаются в зоне кризиса . то компания находится в критической ситуации, а если в платежеспособной области . то она платежеспособна. Использование АНС в системе информационного обеспечения принятия решений позволяет с легкостью оценивать платежеспособность предприятия, вводя лишь значения финансовых показателей. Модель АНС может показать, к какому кластеру относится компания и для каких еще компаний характерны подобные показатели. Это позволяет выявить наиболее яркие финансовые признаки потенциальных банкротов.

Однако практика показывает, что массив


Однако практика показывает, что массив данных за один год не позволяет определить признаки банкротства с высокой надежностью. Поэтому с помощью карты платежеспособности необходимо пронаблюдать динамику развития анализируемой компании, вводя финансовую информацию за разные годы. Если некая компания в какой-то период времени оказывается в зоне банкротства, ее необходимо рассмотреть более тщательно, поскольку финансовая структура этой компании не отличается от финансовой структуры других компаний, разорившихся в прошлом. Если же она стабильно находится в области благополучных компаний, дополнительное рассмотрение не требуется. Особое внимание необходимо уделять компаниям, находящимся в пограничной области с зонами банкротства и платежеспособности. Преимуществом представления информации с помощью АНС является то, что в этом случае данная область совершенно очевидна. Однако, учитывая важность этих зон, границы их должны определяться с максимально возможной точностью. Проводимый с помощью АНС исследовательский анализ и извлечение данных (data mining) могут быть использованы для обнаружения скрытых знаний (knowledge discovery) в больших базах данных, что позволяет решать задачу преобразования скрытого знания в явное. В общем случае это представляет собой целый интерактивный процесс выявления в данных неизвестных ранее паттернов или структур. В этом контексте под знаниями понимаются взаимосвязи между элементами данных и паттернами в наборах данных, а извлечение знаний определяется как нетривиальное обнаружение в данных первоначально неизвестных и потенциально полезных знаний. На практике под этим подразумевается поиск структурных паттернов в данных по внешне похожим предприятиям. Основной процесс исследовательского анализа данных и извлечения знаний состоит из множества шагов, начиная с формулировки целей и заканчивая оценкой результатов. Он может включать в себя петлю обратной связи, что означает переформулирование целей на основе полученных результатов. В зависимости от целей этого процесса наряду с АНС широко используются алгоритмы распознавания образов, машинное обучение и многомерный статистический анализ. В целом же обнаружение знаний является междисциплинарный процессом, в ходе которого могут также использоваться классическая статистика, программирование, технологии баз данных и экспертные системы.

к взятому практическому примеру, среднеквадратическую


Возвращаясь к взятому практическому примеру, среднеквадратическую регрессию целесообразно использовать, чтобы оценить, каким образом любой выбранный параметр, например прибыль предприятия, зависит от времени (независимой в данной случае величины). Она позволяет получить математически определенную функцию, параметры которой, даже не глядя на график исторических данных, дают возможность судить: растет эта прибыль или падает. Например, если оптимальная функция аппроксимации . степенная y  f(t)  ta, то показатель дает полную информацию о тенденции. Если a  1, прибыль растет (тем в большей степени, чем больше a ). Если a  1, прибыль падает. Среднеквадратическая ортогональная регрессия, как уже было показано выше, дает возможность представить зависимость случайных значений выборки сумм активов и балансовой прибыли по группе предприятий в виде математической функции y  f (x) . Иначе говоря, от хаотического набора точек на плоскости XY можно перейти к сглаженной линии. Метод АНС можно рассматривать как некую специальную разновидность регрессии, причем более близкую к ее ортогональной разновидности. Строго математически его можно определить как анализ главных кривых при непараметрической регрессии, который является обобщением среднеквадратической ортогональной регрессии. Он реализуется с помощью нелинейной двумерной регрессионной модели. Регрессия в данном случае относится к классу непараметрических методов, так как не требует априорных предположений о форме распределения данных (в рассмотренном примере . не требуется задавать явным образом законы распределения случайных величин . суммы активов и балансовой прибыли компаний). Понятие главных кривых будет рассмотрено ниже, оно тесно связано со специфической разновидностью аппроксимации . «интеллектуальной» криволинейной аппроксимацией. Рассмотрим простейшую операцию, которая напоминает регрессию и хорошо иллюстрирует принципы простейшей . одномерной АНС. При обычном регрессионном анализе аналитический вид функциональной зависимости должен быть заранее выбран исследователем из фиксированного набора функций аппроксимации. В ходе вычислений с помощью известных алгоритмов подбираются лишь значения входящих в функцию аппроксимации параметров. Например, если выбрана степенная функция аппроксимации y  f(x)  xa, то в ходе вычислений исследователем задается начальное значение единственного параметра 0 a , далее оно последовательно меняется на величину некоторого приращения a . На каждом шаге вычисляется сумма квадратов расстояний от каждой точки наблюдения до функции аппроксимации и заносится в память машины. После достижения определенного исследователем конечного значения a a n a k     0 , где n . число шагов вычислений анализируется ряд занесенных в память данных и определяется наименьшая сумма квадратов. Значение параметра j a , которое соответствует наименьшей сумме квадратов, принимается в качестве оптимального значения параметра функции аппроксимации: a j опт y  f (x)  x. Если функция аппроксимации полиномиальная, например y  b  cx2 , то последовательными шагами b и c определяются оптимальные значения двух параметров ij b и ij c , которые соответствую ячейке матрицы значений параметров, в которой записана минимальная для этой матрицы сумма квадратов. Строки такой матрицы формируются изменением параметра b , т.е. ( b b i b i     0 ), а столбцы . параметра c , т.е. ( c c j c j     0 ). Оптимальная функция аппроксимации в данном случае имеет вид: y f (x) b c x2 опт ij ij    . Подобным образом вычисляются параметры любой функции аппроксимации. Матрица параметров при этом имеет размерность, равную числу независимых параметров функции аппроксимации. Очевидно, что при сложных многопараметрических функциях и большом числе точек наблюдения объемы вычислений оказываются очень велики. Дополнительная проблема связана с тем, что наилучший вид функциональной зависимости, которую следует использовать при аппроксимации, исследователь не всегда может легко определить заранее. Поэтому ему приходится каждый раз визуально оценивать распределение точек на плоскости XY и экспериментировать с несколькими функциями. Если же входные данные не двумерны, как это принято в рассмотренном выше примере, а многомерны, то простая визуальная оценка распределения входных данных вообще невозможна. В этом случае вид аппроксимирующей функции исследователь вынужден определять простым перебором, что дополнительно усложняет анализ и многократно увеличивает время вычислений.

В некоторых случаях расчетная кривая


В некоторых случаях расчетная кривая может очень хорошо аппроксимировать некоторую часть данных и в то же время значительно отклоняться от некоторых из них. Попытки использовать более «гибкие» кривые, задаваемые, например, полиномами большой степени, могут привести к переаппроксимации. В такой ситуации аппроксимирующая функция неверно характеризует тенденции исследуемого процесса, так как не учитывается тот факт, что случайные выбросы в данных не содержат никакой полезной информации, а лишь вносят информационные помехи в результаты анализа. Классические методы обеспечивают возможность эффективной фильтрации случайных выбросов входных данных только при небольшой размерности входного массива. Если же, например, используются данные такой размерности, как массив балансовых показателей предприятия, эффективная фильтрация стандартными методами неосуществима. На практике возможности фильтрации ограничены лишь одномерными рядами (или, в лучшем случае, двумерными матрицами) отдельных входных параметров. Например, можно отфильтровать в потоке информации показатели, свидетельствующие об отрицательном значении активов предприятия, или показатели высокой чистой прибыли при отрицательной ликвидности. При использовании метода «интеллектуальной» аппроксимации вид функциональной зависимости не считается заданным a priori. Он автоматически определяется входными данными и некоторыми заранее заданными ограничениями. Чтобы описать сущность «интеллектуальной» аппроксимации, необходимо от аппроксимации данных наблюдений с помощью некоторой непрерывной кривой перейти к аппроксимации с помощью линии, образованной дискретным множеством соединенных друг с другом точек, именуемых узлами. Такой подход не меняет основной сути представленных выше рассуждений и алгоритмов. Все аппроксимирующие узлы по-прежнему лежат на аппроксимирующей линии в той последовательности, в какой эта линия проходит через пространство входных данных. Необходимо иметь в виду лишь то, что отрезки, используемые для вычисления суммы квадратов расстояний от аппроксимирующей линии до точек входных данных, будут не вертикальными, как в случае среднеквадратической регрессии, и не перпендикулярными аппроксимирующей линии, как в случае среднеквадратической ортогональной регрессии, а просто будут соединять точки входных данных с ближайшими узлами. Кроме этого сама аппроксимирующая линия будет выглядеть как набор направленных прямых отрезков, соединяющих соседние узлы. Рассматриваемые узлы, как и входные данные, представляются множествами вещественных чисел. Они также могут быть описаны координатами в пространстве входных параметров. Любая точка с известными координатами может быть представлена как вектор, проведенный из начала координат (точки, где все входные параметры принимают нулевое значение) к данной точке с известными координатами в пространстве входных параметров. Упорядоченные (вдоль условной аппроксимирующей линии) множества узлов принято именовать модельными векторами. Рассмотрим снова двумерное пространство наблюдений (т.е. отражающее только две величины: x и y ).

Конкретный смысл этих величин также


Конкретный смысл этих величин также может быть сохранен: сумма активов ( x ) и балансовая прибыль ( y ) некоторого предприятия. Набор таких показателей для некоторой группы предприятий из базы данных, в общем случае, случаен по каждому из показателей. Обозначим символом r  (x, y)  соответствующий случайный вектор данных наблюдений. В данном случае он представляет собой некоторое множество совокупностей, так как наблюдений (предприятий), которые характеризует данный вектор, много. Каждое дискретное значение этого вектора ( , ) i i i r  x y  , где i  1, 2, ... N , представляет собой одно предприятие из выборки. Значение N по-прежнему характеризует общее число предприятий в выборке. Введем некоторое множество модельных векторов или узлов, которые будут представлены аналогично входным данным в виде двумерных векторов: Индексы x и y в нижней части модельных векторов означаю их проекции соответственно на оси координат входных показателей X и Y . Значение K характеризует общее число используемых в данном случае модельных векторов. Далее определим фиксированные коммуникационные связи между заданными парами узлов. В целом задача состоит в том, чтобы аппроксимировать точки вектора r  (x, y)  , изображающие данные, к узлам ( , ) x y m  m m  регулярным образом, как если бы они были расположены на гибкой аппроксимирующей кривой. Применительно к данному методу понятие «регрессия» означает, что для каждого наблюдения ( , )i i i r  x y  необходимо определить, в первую очередь, ближайший узел ( , ) k xk yk m  m m  , называемый «победителем». Как и в случае среднеквадратической регрессии, «расстояние» между двумя значениями векторов этих вычисляется как норма их векторной разности, где норма или длина N—мерного вектора ( , )x y d  d d  обозначается, как d и определяется соотношением: В данном случае используется норма векторной разности в наиболее простой и очевидной аксиоматической трактовке геометрии (Euclidean geometry), т.е. как скалярное значение отрезка, соединяющего концы векторов. Для подобных случаев часто используется термин «евклидова норма».

в данном случае индекс евклидовой


Пусть ближайший узел-победитель i m , который будем обозначать как П m , определяется условием: Следует обратить внимание, что в данном случае индекс евклидовой нормы обозначается не индексом узла k , а индексом единичного значения входного вектора i . Это обстоятельство весьма существенно, так как означает, что узел-победитель соотносится с конкретным вектором входных данных ( , )i i i r  x y  , к которому он является ближайшим по сравнению с остальными узлами. В дальнейшем будет показано, что данное обстоятельство имеет большое значение для всего вычислительного алгоритма, так как некоторые из K узлов могут оказаться ближайшими, возможно, не к одному вектору входных данных. Другие узлы, напротив, могут оказаться не связанными ни с одним вектором. При определении же евклидовой нормы для каждого единичного значения входного вектора (соответствующего в данном случае связанной паре показателей одного предприятия) перебираются все значения модельного вектора. После этого определяется минимальное значение, которое по аналогии с соответствующим ему узлом-победителем можно обозначить как Далее в соответствии с алгоритмом АНС необходимо скорректировать положение узла П m , а также его соседей по цепи (в обе стороны вдоль аппроксимирующей линии) в направлении точки ( , )i i i r  x y  в соответствие со значением i П r m   . Процедура нахождения узла-победителя, а также коррекции положения этого узла и его соседей должна повторяться заново для всех N наблюдений переменной r  (x, y)  . Начальные значения модельных векторов Если идентифицировать как данные наблюдений, так и модельные вектора с помощью индекса

в том, что на любой


Математическое объяснение этому состоит в том, что на любой финансово-экономический показатель деятельности предприятия всегда воздействует множество внешних по отношению к нему случайных факторов. Поэтому в соответствии с предельной теоремой распределение такого показателя можно считать гауссовым (gaussian). Вероятности появления различных значений такого показателя хорошо описываются нормальным распределением или колоколообразной кривой со смещением относительно нулевого среднего значения в сторону наиболее вероятного (в соответствии с величиной других балансовых показателей и историей изменения выбранного показателя) значением. В данном случае процедуру аппроксимации можно описать математически как последовательность шагов, которая строится на последовательном переборе всех значений вектора r (t)  . При этом на каждом шаге определяются поправки для узлов m (t) k  , расстояние которых от узла-победителя П m не превосходит некоторой определенной величины. Новые значения модельных векторов для таких узлов находятся из следующего уравнения: Для остальных узлов значение модельных векторов не меняется, т.е. для них: Если «победителем» окажется, например, узел 7 m , и расстояние, на которое передается влияние соседних узлов, будет равно 2, поправки внесутся в положения узлов m5 , m6 , m7 , m8 и m9 . Значение коэффициента коррекции (t) , который называется фактором скорости обучения, всегда должна удовлетворять условию: 0 (t) 1

должно быть постоянно для каждого


Значение (t) должно быть постоянно для каждого узла-победителя в процессе однократного перебора всех значений вектора r (t)  . Однако в ходе осуществления коррекции узлов, соседних с узлом победителем, эта величина должна плавно убывать в направлении границ области коррекции. Для случая, описанного в предыдущем абзаце, значения (t) могут быть, например, такими: После первого перебора всех значений входных параметров и первого цикла коррекции модельных узлов производится последующий перебор и коррекция и т.д. При этом при переходе от цикла к циклу величина (t) также должна убывать. Точнее, при переходе от цикла к циклу должна плавно убывать максимальная величина (t) , соответствующая коррекции координат узловпобедителей. При этом, разумеется, должно пропорционально убывать и значение коэффициентов коррекции в направлении от узла-победителя к границам области коррекции. Очевидно, что, в конечном счете, это должно привести к уменьшению области коррекции и сокращению ее амплитуды. Таким образом, в конечном цикле должны корректироваться лишь координаты трех узлов: узлапобедителя и двух соседних с ним узлов, а амплитуда такой коррекции должна быть минимальной. Практика показывает, что в результате такого подхода процесс корректировки значений модельных векторов протекает относительно гладко. Иногда (при неудачном выборе начальных модельных векторов) отмечается некоторая неустойчивость процесса в самом начале. Однако со временем процесс сам собой всегда стабилизируется и дает хорошие конечные результаты. Выбор закона или алгоритма, по которому (t) уменьшается до нуля, не является для данного метода принципиальным. Можно, например, определить, что (t) приближается к нулю по линейному закону за M циклов, где значение M превосходит количество узлов K , по меньшей мере, в 100, а еще лучше . в большее число раз (что ограничивается только общим временем вычислений).

Однако важно, чтобы расстояние вдоль


Однако важно, чтобы расстояние вдоль цепи, на которое передается влияние узла-победителя, вызывающее изменения в положении его соседей, изначально было большим. Интуитивно понятно, что в предельном случае это расстояние должно равняться половине протяженности цепи. При этом если победителем оказывается узел, расположенный в середине цепи, то он будет влиять на всю цепь. Если подобный узел находится вблизи одного из концов цепи, влияние его будет ощущаться только на половине ее протяженности. По мере того как от цикла к циклу (t) приближается к нулю, расстояние, на которое передается влияние узла-победителя, вызывающее изменения в положении его соседей, также может уменьшаться дискретными шагами по линейному закону. Интуиция подсказывает, что последовательность подобных операций рано или поздно приведет к образованию цепи, имеющей гладкую форму. Однако обосновать этот феномен математически чрезвычайно сложно. Описанный выше процесс более всего соответствует определению кусочной регрессии. Аппроксимирующий входные данные участок цепи определяется в ходе процесса самоорганизации, посредством которого определяется модельный вектор с наименьшим отклонением от данных. Совокупность компонент модельного вектора в методе АНС часто называют главными кривыми. Вместо фиксированных связей между узлами в общем случае также можно определять силу взаимного влияния ij h для любой пары узлов в сети как функцию индексов, соответствующих этим узлам:

Рассмотрим теперь более общий многомерный


Рассмотрим теперь более общий многомерный случай. Допустим, что множества примеров данных представляют собой n -мерные вещественные векторы данных: где t рассматривается как индекс данных: t 1, 2, ... n . Иными словами, одно наблюдение представляет собой n показателей, а пространство данных n -мерно. На практике это соответствует выборке из базы данных по одному предприятию n исторических наборов данных. Причем каждый набор представляет собой n различных финансово-экономических показателей предприятия (что уже в целом соответствует реальной ситуации обработки). Аналогично каждому узлу поставим в соответствие n -мерный модельный вектор. Поскольку модельные векторы изменяются в результате отклика на данные r (t)  , t 1, 2, ... n , последовательно используемые в алгоритме, можно записать следующее: Основной целью алгоритма АНС визуальное представление пространства входных данных на двумерной плоскости выходных параметров. Поэтому определим взаимосвязи между модельными векторами так, как если бы они были направлены вдоль некоторой гибкой двумерной сети. На каждом шаге определения фиксированных коммуникационных связей между парами узлов, в первую очередь, как и в рассмотренном выше случае, всегда определяется индекс узла-победителя. Им является тот узел, который в смысле евклидовой нормы оказывается ближе всех к текущему вектору входных данных: Затем производится корректировка положения узла-победителя и всех узлов из его окрестности: Фактор скорости обучения (t) (0 (t) 1) уменьшается с ростом значений t . В общем случае он может быть объединен со скалярной функцией соседства h (t) ijс .

Несмотря на то что, на


Несмотря на то что, на первый взгляд, уравнения (1) и (2) выглядят просто, необходимо обратить внимание на присутствующий в символической записи функции соседства h (t) ijс индекс с . Это . переменный индекс, и его значение зависит от всех r (t)  и всех m (t) k  , причем такая зависимость не является непрерывной. Это обстоятельство усложняет программную реализацию данного алгоритма. Метод АНС определяет подгонку «интеллектуальной» сети к зависящей от r (t)  функции плотности распределения p(r )  вектора входных данных в n -мерном пространстве. Его основой является так называемая программа вызова (recall schedule), в которой задается, каким образом в процессе вызовов изменяются параметры, связанные с откликом сети. Алгоритмы этой программы были описаны выше. Асимптотические свойства алгоритма АНС в общем случае пока строго математически не доказаны. Кроме этого, не определена аналитическая форма предела сходимости и не доказано, что он является единственным. Положительные ответы получены только для частных случаев. Однако двадцатилетняя практика использования самоорганизующихся сетей показывает, что при условии осмысленного выбора значений (t) и h (t) ij , а также начальных значений модельных векторов * k m , сходимость действительно всегда наблюдается. Чтобы понять математическую основу данного утверждения, высказанную здесь в форме постулата, рассмотрим некоторые общетеоретические понятия. АНС относится к общему классу динамических систем (dynamic system), под которыми понимаются системы, состояние которых изменяется с течением времени. Простой разновидностью динамической системы является система линейных уравнений. Система нелинейных уравнений определяет нелинейную динамическую систему. В математике система, описываемая дифференциальным или разностным уравнением, . это система, изменение состояния которой является функцией времени или параметров системы. Состояния узлов, а значит . Состояние рассмотренной выше АНС . как раз является функцией и времени, и входных параметров системы (хотя в виде дифференциальных или разностных уравнений она здесь не описывалась). Поэтому АНС полностью подпадает под определение нелинейной динамической системы. Начальная точка динамической системы называется начальным состоянием. Конечная точка или точки определяются термином состояния равновесия. В промежутке между ними находятся переходные состояния. Динамическая система может иметь два типа состояний равновесия . периодические и апериодические. Апериодическими состояниями равновесия являются так называемые хаотические или странные аттракторы. Для того чтобы пояснить значение термина «аттрактор», рассмотрим сначала понятие фазового пространства.

phase space) имеет форму графика


Фазовое пространство ( phase space) имеет форму графика (в общем случае многомерного), на котором показаны все возможные состояния системы. В фазовом пространстве значение каждой переменной показано в зависимости от всех остальных переменных в тот же момент времени. Если система описывается n переменными, фазовое пространство имеет n измерений, причем каждой переменной соответствует одно измерение. Аттрактор (attractor) представляет собой точку, соответствующую устойчивому состоянию нелинейного динамического процесса. Мерой динамики на аттракторе является показатель Ляпунова (Lyapunov exponent). Каждое измерение фазового пространства характеризуется показателем Ляпунова. Положительное значение этого показателя является мерой чувствительности к начальным условиям или мерой расхождения предсказания, основанное на различных начальных условиях. Для систем, которые не имеют устойчивого состояния, характерно наличие, по меньшей мере, одного положительного показателя. Хаотический аттрактор (chaos attractor) соответствует детерминированной нелинейной динамической системе, бесконечная последовательность состояний которой выглядит случайной. Он характеризует апериодическое равновесное состояние динамической системы. Однако, не смотря на то, что система в состоянии хаотического равновесия как бы «случайно» блуждает по различным состояниям, ее поведение является детерминированным, так как математическое уравнение его точно определяет. Если точно известны это уравнение и состояние системы в данный момент, можно предсказать любую точку на ее хаотическом пути или траектории. Хаос обладает следующим свойством: если выбрать любые две начальные точки для хаотической системы, независимо от того, насколько они близки, начинающиеся в них пути будут расходиться со временем. Хаотическая система должна иметь фрактальную размерность и обладать чувствительностью к начальным условиям. Странным аттрактором (strange attractor) является такое состояние равновесия в фазовом пространстве, в котором точки никогда не повторяются и орбиты никогда не пересекают друг друга. Однако как точки состояния системы, так и орбиты всегда остаются внутри некоторой области в фазовом пространстве. Если система оказывается в одной из таких областей, она будет двигаться вокруг нее все время или пока внешние воздействия не переведут ее новое состояние, причем в этом движении не наблюдается структуры или периодичности. Так как странные аттракторы являются непериодическими, они, как и хаотические, в общем случае, имеют фрактальную размерность. Странные аттракторы являются частной конфигурацией нелинейной хаотической системы. Отрицательное значение показателя Ляпунова в каком либо измерении фазового пространства является мерой того, насколько точки сходятся друг к другу. При наличии определенного числа отрицательных значений показателя Ляпунова в фазовом пространстве возникают периодические аттракторы. В общем случае такие аттракторы существуют в виде предельного цикла, когда система повторяет один и тот же путь. Аттрактор, для которого все траектории в фазовом пространстве сходятся к одной точке или величине, в нелинейной динамике называется точечным аттрактором (point attractor). Точечный аттрактор является предельным случаем периодического равновесия. Любая система, которая стремится к одному устойчивому состоянию равновесия, будет иметь точечный аттрактор. В этом случае фазовое пространство стягивается в точку, где скорость изменения состояний системы равны нулю. Нередко точечный аттрактор принимается также за нулевые координаты системы (центр системы координат многомерного фазового пространства). Все показатели Ляпунова точечных аттракторов отрицательны. Для любого частного случая АНС (при заданных параметрах системы, которые в данном случае характеризуются совокупностью векторов входных данных r (t)  и модельных векторов {m (t)} k  ) можно определить показатели Ляпунова по всему n -мерному фазовому пространству. Для этого динамическую систему первоначально необходимо описать с помощью дифференциальных или разностных уравнений (которые здесь не рассматриваются ввиду ограниченности объема монографии). Практика анализа самоорганизующихся сетей показывает, что все показатели Ляпунова в подобных случаях оказываются отрицательными. Именно это и дает основание полностью принять здесь гипотезу о сходимости АНС к одному устойчивому состоянию, которое является точечным аттрактором данной динамический смысл.

Интересным свойством алгоритма АНС является


Интересным свойством алгоритма АНС является то, что в результате подгонки «интеллектуальной» сети к данным может быть получена любая из ряда конфигураций, связанных друг с другом преобразованиями симметрии. Однако на практике направления могут быть изменены впоследствии на дисплее компьютера любым желаемым способом. В случае неудачного выбора начальных значений модельных векторов * k m возможно появление локально устойчивых конфигураций сети, не соответствующих наилучшему результату. Однако в большинстве случаев АНС, образованная такими векторами {m (t)} k  , в процессе вычислений все же упорядочивается и принимает желаемую форму. На практике, если нет возможности заранее определить наилучшие начальные значения модельных векторов * k m , оптимальная конфигурация выбирается в результате нескольких испытаний с разными наборами * k m . С учетом подробно рассмотренных выше алгоритмов непараметрической среднеквадратической регрессии и «интеллектуальной» криволинейной аппроксимации рассмотрим нейросетевую модель АНС. Сначала определимся с математической проблемной областью, в рамках которой рассматриваются адаптивные сети. В целом она относится к теории множеств (set theory), используемой для исследования множеств или классов объектов. Множество является основным понятием в математике точно так же, как символ является основным понятием логики. Логика и теория множеств составляют фундамент данного раздела математики. В теории все символы алгоритма АНС являются только стенографической записью множеств и логики. Здесь необходимо рассмотреть также понятие подмножественности (subsethood), которое означает степень принадлежности одного множества другому. В классической теории множеств не допускается существования нечетких или многозначных множеств, элементы которых принадлежат множеству в некоторой степени. Каждое множество содержит элементы целиком или не содержит ни одного элемента. Аналогично в классической теории некоторое множество содержит подмножество полностью или не содержит никаких подмножеств. В нечеткой логике существуют градации этого понятия. Это означает, что подмножественность, или величина включения (containment value), может принимать любые значения от 0 до 100%. Мера подмножественности дается теоремой подмножественности. Эта теорема предлагает новый подход к понятию вероятности события. В данном случае используем понятие нечеткого множества (fauzzy set), элементы которого принадлежат ему в той или иной степени. В этом понимании события (в данном случае они ассоциируются с поступлением на вход АНС конкретных наборов финансово-экономических показателей предприятий), в конечном счете, аппроксимируются на нечеткие множества кластеров на плоскости выходных параметром. Иначе говоря, на один кластер могут проецироваться несколько событий. В данном случае это является фундаментальным принципом классификации входных данных с помощью образов (кластеров), выявляемых на выходе адаптивной сети. АНС представляет собой адаптивную нечеткую систему (adaptive fuzzy system), которая по входным данным вырабатывает свои правила, или систему, которой человек-эксперт не сообщает, каковы эти правила. Нечеткие правила выводятся из соотношений между входными и выходными данными. Основное свойство такой системы . адаптивность (adaptability) . проявляется в способности нейросетевой вычислительной системы настраиваться в соответствии с данными. Синонимом этого понятия является способность к обучению.

В построении АНС используется нечеткая


В построении АНС используется нечеткая логика (fuzzy logic), которая также часто называется многозначной или «неясной» логикой. В соответствии с постулатами этой логики, все имеет градации, включая истину и факт принадлежности некоторому множеству. Она позволяет делать умозаключения с использованием нечетких множеств или множеств нечетких правил. Нечеткое правило (fuzzy rule) в простейшем случае выглядит как условное высказывание вида «если X есть A , то Y есть B », где A и B . нечеткие множества, а X и Y . определенные входные и выходные множества (например, в рассматриваемых выше случаях . входные наборы данных и ячейки плоскости выходных параметров соответственно). На математическом языке правило представляется связью (relation) между нечеткими множествами. Каждое правило определяет «нечеткое» пятно (произведение A B ) в «пространстве состояний» системы. Чем обширнее нечеткие множества A и B , тем обширнее и более неопределенное нечеткое «пятно». Нечеткие правила нечетких систем являются блоками для построения знаний в алгоритме АНС. Выражаясь математическим языком, можно сказать, что каждое нечеткое правило действует как ассоциативная память, которая связывает нечеткий отклик B с нечетким стимулом A . В структуре АНС используется так называемая автоассоциативная память (autoassociative memory), которая сконструированная таким образом, чтобы, кроме прочего, преобразовывать входные примеры в самих себя. Если входной пример содержит шум, разрушен и неполон, такая память способна восстановить оригинал или изученный пример. В терминах нечеткой логики АНС является частным случаем нечеткой системы (fuzzy system), объединяющей множество нечетких правил, преобразующих входные данные в выходные. В наиболее простых системах такого вида исследователь сам устанавливает эти правила словами или символами. В модели АНС нейросетевая система самостоятельно обучается правилам по входным наблюдениям. На каждый пример входных данных в некоторой степени откликаются все правила в массивной ассоциативнойпамяти. Чем ближе сходство входного примера с частью «если» нечеткого правила, тем сильнее получается отклик в части «то». Далее в нечеткой системе все эти отклики или множества «то» складываются, и вычисляется их среднее или центроидное значение. Этот центроид является выходным результатом нечеткой системы. Каждое отображение входа на выход определяет одно нечетко-логическое заключение (fuzzy logical inferences). Теорема о нечеткой аппроксимации (fuzzy approximation theorem, FAT) утверждает, что нечеткая система может моделировать любую непрерывную систему. Каждое правило нечеткой системы действует как нечеткое «пятно», которое система ставит таким образом, чтобы имитировать отклик непрерывной системы на все возможные стимулы. Обучение (learning) адаптивной сети в простейшей форме означает самонастройку на уровне процессорных элементов. Взвешенные связи между процессорными элементами или веса подстраиваются таким образом, чтобы получить конкретные результаты, исключая необходимость написания специального алгоритма для каждой задачи. В алгоритме АНС используется и другая трактовка термина обучение (training), которая означает предъявление нейросетевой вычислительной системе множества примеров-стимулов с целью достижения конкретной цели, определяемой исследователем. В исследовательских целях допускается также изменение правил или поведения системы с определенной целью. Под термином «процессорный элемент» (processing element) здесь понимается вычислительная абстракция нейрона, т.е. нейроноподобная ячейка, которая совместно со многими другими процессорными элементами образует нейронную вычислительную сеть. Все вычислительные операции в АНС выполняются большим числом сравнительно простых адаптивных процессорных элементов. Часть процессорного элемента, через которую проходит сумма входных сигналов для получения суммарного отклика, называется функцией передачи (transfer function). Обычно это нелинейная функция. Другой компонент процессорного элемента, в котором складываются получаемые элементом сигналы, называется функцией суммирования (summation function). Суммарный сигнал в нейроне сравнивается с порогом (threshold), который представляет собой константу, которая используется в качестве уровня сравнения. Если значение суммы превышает порог, выполняется некоторое действие (например, нейрон возбуждается). В том случае, когда значение суммы ниже порога, никаких действий не происходит.

в нейросетевой вычислительной системе подается


Каналы, по которым информация в нейросетевой вычислительной системе подается процессорным элементам, называются взвешенными связями (weighted connections) или взаимными связями (interconnects). Совокупность взвешенных связей образует ассоциативную память сети. Основная архитектурная компонента нейронной сети, состоящая из множества процессорных элементов с одинаковыми функциональными возможностями и занимающая в сети положение, соответствующее определенной стадии обработки, обозначается термином «слой» (layer). Большинство нейросетевых методов являются многослойными нелинейно-регрессионными методами, в которых определенное число входных данных (входов) соотносится с одним или большим числом выходов. АНС имеет двухслойную архитектуру: входной слой с размерность, равной размерности входных данных, и выходной . двумерный слой, образующий плоскость выходных параметров. Существуют более сложные многослойные адаптивные сети (например, перцептрон), в которых между входными и выходными слоями располагаются так называемые скрытые слои. Критические скрытые слои, которые содержат меньше нейронов, чем входной и выходной слои в отдельности, вынуждены пропускать через каждый из своих нейронов тем больше информации, чем меньше размер такого слоя. За счет этого достигается большее сжатие информации, чем в АНС. Однако определение размерности скрытых слоев связано с большими сложностями, поэтому в рамках данной монографии эти виды сетей рассматриваться не будут. В алгоритме АНС используется так называемое обучение без учителя (unsupervised learning), при котором для получения правильного отклика на заданный входной стимул учитель не используется. Часто этот термин является синонимом кластеризации. Система должна организоваться сама только на основе полученных ею входных стимулов. Самоорганизация (self-organization) представляет собой адаптивное изменение структуры нейронной сети или соответствующих ей взвешенных связей в результате отклика на обучающие стимулы. В алгоритмах, использующих обучение с учителем (supervised learning) «учитель» используется, для того чтобы показать системе желаемые отклики на входные стимулы, обычно в виде желаемых выходных сигналов. Модель АНС использует так называемое «соревновательное обучение» (competitive learning), представляющее собой набор правилобучения, при котором процессорные элементы соревнуются между собой по отклику на заданный входной стимул. Нейрон-победитель и окружающие его элементы затем адаптируются таким образом, чтобы больше походить на входной вектор. Различные элементы адаптируются к различным входным стимулам. При этом в большинстве случаев, АНС можно отнести к группе сетей с прямыми связями (feed forward network), в которых информация передается только в одном направлении (от входа к выходу). В подобных сетях отсутствуют петли обратных связей от обрабатывающих к предыдущим элементам. Обратное распространение (back propagation), под которым понимается передача информации от выхода к входу сети, как правило, используется лишь в многослойных нейронных сетях. Однако в ряде случаев обратное распространение применимо и в сетях типа АНС. В частности, при распознавании образов или классификации с учителем распространение по обратной связи используется для передачи информации об ошибке. Вместо обратного распространения при распознавании образов может использоваться также дельтаправило обучения (delta rule learning). Этот алгоритм представляет собой разновидность обучения, при которой веса нейронов изменяются таким образом, чтобы уменьшить различие между наблюдаемым и желаемым выходом обрабатываемого элемента. Синонимом этого понятия является метод обучения Роббинса-Монро (RobbinsMonro). Расширив понятийный аппарат, вернемся к описанию нейросетевой модели АНС. Все векторы наблюдений r (t)  , для которых модельный вектор появляется ближайшим, также выбирают П m в качестве победителя, и могут рассматриваться как «отображаемые» на него. Таким образом, каждый модельный вектор аппроксимирует в пространстве наблюдений целую область входных наблюдений. Сеть, образованная векторами П m , сначала принимает форму, которая наилучшим образом соответствует примерам данных, а затем уравнения (1) и (2) задают нелинейное отображение пространства векторов r (t)  на эту сеть. При этом используются нелинейные функции передачи и конкуренция между нейронами сети.

Нейронная сеть позволяет получить изображение


Нейронная сеть позволяет получить изображение всего пространства наблюдений, т.е. различные нейроны оказываются чувствительными к различным областям плоскости выходных параметров. Еще раз конкретизируем: процесс создания АНС требует двух слоев нейронов: первый . входной слой, содержащий нейроны для каждого элемента входного вектора, второй . выходной слой, или решетка нейронов, связанных со всеми нейронами входного слоя. Число нейронов в выходном слое определяется исследователем на основании изначальной формы или размера плоскости выходных параметров, которую он хочет получить. В отличие от других нейронных сетей здесь нет ни одного скрытого слоя или скрытых нейронов. Когда каждый новый образ входных данных подается на вход нейронной сети, нейроны выходного слоя соревнуются друг с другом за право быть победителем. Победителем становится тот выходной нейрон, веса связей которого оказываются ближайшими к входному образу в смысле евклидова расстояния. Итак, когда образ предъявлен на вход нейронной сети, каждый нейрон стремится достичь наибольшего соответствия с входным образом. Выходной нейрон, ближайший к входному образу, признается победителем. Веса связей нейронапобедителя затем корректируются, т.е. сдвигаются в направлении входного образа с помощью множителя, определяемого темпом обучения. В этом состоит сущность соревновательногоалгоритма нейронных сетей, в том числе и АНС. Когда АНС осуществляет топологическое отображение входного образа на плоскость выходных параметров, происходит регулирование не только веса нейронапобедителя, но также весов смежных выходных нейронов, ближайших соседей победителя. Таким образом, подвижка весов происходит не только у нейронапобедителя: целая окрестность выходных нейронов становится сдвинутой ближе к входному образу. Когда процесс начинается с рандомизированных (случайных) значений весов, выходные нейроны медленно выравниваются, поскольку при предъявлении входного образа на него реагирует не только отдельный нейрон, но также и очень широкая окрестность этого нейрона. По мере того как обучение продолжается, размер этой окрестности вокруг нейрона-победителя постепенно уменьшается. Сначала одновременно корректируются веса многих нейронов в окрестности победителя, но по мере обучения на входные сигналы реагирует все меньшее и меньшее число нейронов. В конце обучения корректируются только веса нейрона-победителя непосредственно примыкающих к нему нейронов. Аналогично темп обучения (интенсивность коррекции) уменьшается по мере обучения, а в некоторых алгоритмах АНС темп обучения снижается по мере уменьшения расстояния от нейрона-победителя. Результатом вычислений являются веса связей между входными векторами и выходными нейронами, каждому из которых соответствует типичный входной образ для некоторого подмножества входных данных, которое попадает в отдельный кластер. Кластеры образуются из нейронов плоскости выходных параметров со сходными реакциями на входные сигналы. Процесс сжатия данных большой размерности до некоторого набора кластеров называется сегментацией. Исходное пространство большой размерности сжимается в двумерную плоскость, состоящую из нейронов. Индекс выходного нейронапобедителя, по существу, разделяет также и входные образы на множество категорий или кластеров. После обучения каждый нейрон плоскостивыходных параметров соответствует группе входных объектов, обладающих сходными признаками. Соответствие между объектами и нейронами, в большей или меньшей степени, сохраняет топологию пространства входных данных: объекты со сходными признаками соответствуют либо одному и тому же нейрону, либо соседствующим нейронам выходного слоя. Окончательный результат самоорганизации АНС представляет собой плоскость выходных параметров, сохраняющую топологию пространства входных данных.

Особый интерес представляет свойство аппроксимации


Особый интерес представляет свойство аппроксимации плотности, которым обладает АНС. Оно показывает, что алгоритм АНС, завершающийся полным отсутствием соседей у нейрона-победителя в конце обучения, сходится, что соответствует сходимости классического метода многопараметрического квантования или, иными словами, соревновательного обучения. После квантования нейроны представляют собой дискретный каркас для реконструкции начальной плотности при условии, что каждый нейрон взвешивается вероятностью, оцениваемой по частоте его области Вороного. При условии адекватного взвешивания нейронов полученный результат показывает, что начальные данные могут быть восстановлены, причем сам результат является точным, если число нейронов стремится к бесконечности. Для того чтобы создать хорошую модель АНС, необходимо уделить внимание следующим наиболее важным аспектам: инициализации модельных векторов, выбору функции соседства и скорости обучения, выбору размерности и формы плоскости выходных параметров, а также масштабированию входных переменных. Помимо этого необходимо учесть процедуры автоматического цветового кодирования АНС. Рассмотрим подробнее эти и другие аспекты алгоритма АНС, на которые выше делались многочисленные ссылки. При инициализации алгоритма АНС следует иметь в виду, что процесс самоорганизации будет протекать на несколько порядков быстрее, а окончательные результаты получатся гораздо более устойчивыми, если перед запуском алгоритма модельные векторы будут упорядочены, хотя бы очень приблизительно. Например, можно выбрать две главные компоненты данных, после чего можно построить регулярную решетку из точек, расположенных вдоль гиперплоскости, задаваемой исходными данными. Если взять в качестве значений модельных векторов в такой решетке главные компоненты, это позволит сузить функцию соседства и уменьшить значение коэффициента скорости обучения. Многочисленные расчеты показали, что алгоритм АНС допускает различные варианты выбора функции соседства и фактора скорости обучения. Тем не менее, всегда необходимо учитывать следующее:  функция соседства должна быть шире в начале процесса обучения, и ее ширина должна уменьшаться со временем таким образом, чтобы к концу этого процесса осуществлялась подгонка только непосредственных соседей нейрона-победителя;  процесс самоорганизации должен включать достаточно большое число шагов обучения. Поскольку использовать наиболее приемлемую для большинства случаев гауссову функцию соседства иногда может оказаться затруднительно, в некоторых случаях можно прибегнуть и к более простой функции, которая также достаточно хорошо работает, особенно если модельные вектора инициализированы таким образом, как описано выше. Более простые уравнения обучения АНС имеют следующий вид: Если начать вычисления с предварительно упорядоченных начальных значений k m , то выбор точных значений (t) и (t) не является критическим. Можно, например, уменьшать (t) линейно (дискретными шагами) в промежутке от 5 до 1, уменьшая одновременно скорость обучения (t) от 0,05 до 0. Чтобы добиться лучшей сходимости, исходя из теоретических соображений, можно выбрать закон вида: где: G . параметр, значение которого должно превышать число нейронов в 100 или более раз.

Если для инициализации модельных векторов


Если для инициализации модельных векторов используются случайные числа, то приведенные выше рекомендации относительно выбора значений (t) и (t) непригодны. В этом случае начальный радиус (t) должен составлять половину размера сети, и скорость обучения в начале процесса должна быть близкой к единице. Для получения хорошего визуального представления данных рекомендуется гексагональное расположение нейронов. Множество нейронов должно иметь продолговатую форму, поскольку очертания распределения данных на практике обычно продолговатые, а набор модельных векторов должен им соответствовать. Квадратные массивы нейронов не ориентируются по отношению к таким распределениям нужным образом. Размерность плоскости выходных параметров АНС в общем случае определяется исследователем произвольно. Чаще всего она прямоугольная, а не квадратная. При этом следует иметь в виду следующее:  чем больше размерность плоскости выходных параметров, тем выше вероятность того, что каждый отдельный вектор входных данных будет отображаться в отдельном нейроне. Большие плоскости позволяют организовать новые данные в легко читаемые таблицы, но обобщающая способность таких изображений недостаточна;  плоскости меньшей размерности обеспечивают большую степень сжатия данных. Однако слишком малое число нейронов приводит к уменьшению разрешения, поэтому соответствующие плоскости способны обеспечить лишь очень грубую дифференциацию, не позволяя увидеть разницу между предприятиями, действующими в определенных секторах экономики или в отдельных регионах. Размерность плоскости выходных параметров определяет степень обобщения входных данных. Помимо большого объема вычислений обучение АНС с использованием большого количества нейронов может привести к отображению на плоскости множества лишних подробностей. С другой стороны, используя слишком малое количество нейронов можно упустить существенные различия в изучаемой совокупности. Поэтому определение оптимального размера (числа нейронов) АНС сводится к выбору «гранулярности» или степени обобщенности данных, оптимальной с точки зрения поставленной цели. Как правило, даже при относительно равномерном выходном распределении, когда среднее число предприятий, попавших в каждую ячейку, составляет от 4 до 6, вследствие случайных флуктуаций входных данных, на плоскости выходных параметров может образоваться несколько пустых ячеек, в которые не попало ни одно предприятие. Увеличение количества выходных нейронов в этом случае представляется нежелательным, так как оно ведет к возрастанию числа нейронов, на которые ничего не отображается. Универсальных рекомендаций по выбору количества нейронов в сети не существует, так как оптимальная размерность плоскости выходных параметров зависит как от сферы применения АНС, так и от объема имеющихся данных. Например, если имеется относительно однородное множество примеров, то нейронов целесообразно выбрать в несколько раз меньше, чем записей. В ином случае: если векторы данных представляют собой случайные переменные и распадаются на более или менее размытые кластеры, а с помощью АНС необходимо выявить кластерную структуру, число нейронов лучше выбрать кратным числу кластеров. Если с помощью АНС изучается кластеризация, а количество кластеров заранее неизвестно, число нейронов не должно быть больше, чем 10% от общего числа записей. Иногда объем имеющихся данных ограничен вследствие высокой стоимости или трудности их получения. В таком случае статистическая точность их представления может оказаться проблематичной, поскольку нельзя использовать несколько узлов для представления одного образа. Возможны также иные ситуации, поэтому осознать характер проблемы и специфику имеющихся данных важно еще до того как будет определяться размерность плоскости выходных параметров. Как правило, выбор «наилучшей» размерности плоскости выходных параметров производится в каждом случае на основе множественного моделирования (расчета различных вариантов) с использованием различных методов инициализации АНС, функции соседства нейронов, топологии выходной плоскости и обучающих процедур.

Для обработки очень больших наборов


Для обработки очень больших наборов данных используется иерархическое решение. Например, сначала весь массив входных данных отображается на небольшую по размерности плоскость выходных параметров. При этом каждый нейрон может содержать тысячи объектов. Затем из общего массива данных делаются выборки, соответствующие каждому из таких нейронов, и для них с помощью АНС строятся новые плоскости выходных изображении, каждый нейрон которых содержит в среднем уже десятки объектов. Затем проводится построение с более высоким разрешением и т.д. Как правило, используется от 2 до 5 уровней иерархии. Иногда более детальные изображения строятся не для каждого нейрона плоскости с низким разрешением, а для совокупностей нейронов, образующих кластеры. Это вносит осмысленность в иерархическую кластеризацию. Таким образом, любая типичная область более высокого уровня может быть (по аналогии с картографированием) увеличена для уточнения дополнительных подробностей. В ходе анализа финансово-экономических показателей предприятий необходимо использовать переменные, характеризующие весь спектр финансовых данных. Такие показатели должны давать представление об экономических результатах промышленных компаний в отношении к используемым ресурсам (валовая прибыль, чистая прибыль, платежеспособность, производительность и рентабельность), их относительным затратам (промежуточное потребление, расходы на персонал и финансовые обязательства), а также их финансовой структуре (размер и структура капитала компании, сумма и структура задолженности, резервные фонды) и структуре рисков. Целесообразно задействовать все имеющиеся в наличии переменные и варианты, не исключая предварительно каких-либо реализаций или паттернов на том основании, что они могут иметь атипические значения. Как правило, берется от 16 до 32 основных финансовых показателей из балансов и из отчетов о прибылях и убытках предприятий. Слишком малое число показателей не позволяет обосновать кластеризацию. Необходимым предварительным условием является наличие однородной финансовой информации о разных компаниях. Необходимо контролировать сбор данных и выверку балансов и отчетов о прибылях и убытках компаний, действующих в различных секторах экономики, так как каждый сектор имеет свои особенности, отражающиеся в структуре данных. Кроме этого, если целью анализа является не кластеризация, а определение какихлибо обобщенных характеристик компаний, предприятия в одну выборку должны подбираться с учетом их специализации и размера. Компании, занимающиеся реализацией крупных долгосрочных проектов, должны составлять отдельную выборку на том основании, что их финансовая отчетность имеет тенденцию варьироваться на различных стадиях осуществления этих проектов. В отдельные группы должны попадать очень мелкие предприятия, деятельность которых не может рассматриваться как устойчивый бизнес, и предприятия, масштабы деятельности которых значительно превосходят средний уровень.

В частных случаях анализа состав


В частных случаях анализа состав показателей может определяться в соответствии с известными методиками. Например, при проведении анализа возможности банкротства, показателя могут совпадать с выбранными Альтманом в его работе по предсказанию банкротств (Altman, 1968): Интересной разновидностью АНС является сеть с «гибридным обучением». В этом случае структура плоскости выходных параметров может определяться основными данными, содержащимися в финансовых отчетах, а дополнительные данные могут вводиться при помощи векторов весовых коэффициентов так, чтобы их можно было использовать впоследствии для визуального представления данных.

При анализе возможности банкротства дополнительные


При анализе возможности банкротства дополнительные данные могут содержать информацию, которая становится доступной позднее, например, о том, стала ли компания банкротом в течение некоторого времени после представления отчетных данных. Тогда вектора весовых коэффициентов каждой ячейки плоскости выходных параметров будут содержать в себе соответственно финансовую информацию и информацию о статусе компании. Исходя из этого, поиск нейрона-победителя будет осуществляться с использованием только той части вектора, которая содержит основные финансовые показатели, взятые из финансовых отчетов, в то время как для обновления весов элементов плоскости выходных параметров будет использоваться весь вектор целиком (т.е. как основная, так и дополнительная информация). Для обновления весов в данном случае целесообразно использовать гауссово распределение меры соседства, так как в сравнении с другими известными методами оно дает более гладкое отображение . так называемое «пузырьковое» распределение меры соседства (bubble neighborhood), облегчающее визуальное представление. В качестве альтернативы методу АНС с «гибридным обучением» можно окрасить нейроны плоскости выходных параметров таким образом, чтобы цвет каждого элемента плоскости определялся свойствами отображаемых на него векторов дополнительных данных. Однако этот путь может привести к возникновению случайных цветовых вариаций по причине статистических помех. При использовании подхода с «гибридным обучением» этого не происходит, поскольку функция гауссова распределения позволяет сгладить эти случайные вариации. При использовании АНС с «гибридным обучением» в процессе общего финансового анализа компанийэмитентов наряду с основной информацией из финансовых отчетов целесообразно использовать дополнительную информацию, отражающую рыночные характеристики ценных бумаг эмитента, например, количество выпущенных акций, рыночная капитализация, количество акций, торгуемых на бирже, отношение цены к номиналу, к доходу и сумма выплаченных дивидендов. Оценивая ценные бумаги с позиции инвесторов, можно ввести такие показателя, как общая доходность, уровень риска или доходность, взвешенная по уровню риска. Каждый параметр из входного набора переменных, как правило, имеет свою предметную область (universe of discourse) . диапазон, в котором он определен. Кроме того, единицы измерения некоторых нефинансовых показателей могут не совпадать. Вследствие этого различные показатели будут иметь разные веса в АНС, что может существенно исказить ее структуру. Распространенным приемом предварительного анализа является нормирование или выравнивание входных данных. Как правило, все отдельные параметры приводятся к нулевому среднему и единичной дисперсии. Для выполнения первой операции необходимо каждый член ряда уменьшить на математическое ожидание, полученное путем статистической обработки исходного ряда. Выравнивание по дисперсии осуществляется путем деления элементов каждого ряда данных (отражающего один параметр) на квадратный корень из дисперсии, соответствующей данному ряду. Таким образом, все значения одного параметра, отличающиеся по абсолютной величине от соответствующих значений другого параметра, будут вносить равный вклад в суммарное расстояние между векторами входных данных.

с незначительно отличающимися для различных


Формирование АНС с незначительно отличающимися для различных компонент константами масштабирования позволяет рассматривать входные данные об одних и тех же наблюдениях под разным углом зрения. Чем больше значения констант масштабирования, тем выше разрешение или число нейронов для того илииного параметра. Соответственно меньшие константы масштабирования дают более усредненные значения по нейронам, т.е. менее отчетливую картину соответствующих компонент. В общем случае всегда необходимо соотносить процесс масштабирования и цели обработки данных. Изначальная идея АНС состоит в поиске наилучшего представления пространства входных данных. Поэтому, если значения некоторых компонент будут слишком завышены, то остальные компоненты станут менее различимыми, что может привести к утрате или искажению той или иной ценной информации. Для того чтобы сделать визуальное представление данных при помощи АНС более интуитивно понятным, различные кластеры, т.е. различные типы данных могут быть обозначены различными цветами. Однако выделить четко очерченные кластеры оказывается зачастую практически невозможно, поскольку кластеры могут перекрываться, да и попросту отсутствовать. Поэтому данные следует окрашивать таким образом, чтобы оттенки цвета изменялись плавно в зависимости от изменения плотности данных. Относительно более однородные кластеры будут соответственно окрашены более равномерно, в то время как участки плоскости выходных параметров, не содержащие кластеров, будут отличаться более неравномерной окраской. Процедура автоматического цветового кодирования для адаптивных сетей типа АНС состоит из трех последовательных этапов:  выбор цветовых центров . подходящих участков плоскости выходных параметров, на которых будут наблюдаться известные цвета;  выбор подходящих оттенков для цветовых центров;  окрашивания оставшейся части плоскости выходных параметров. Для выбора цветовых центров можно использовать одномерную адаптивную нейронную сеть с линейной формой выходного изображения. Каждый узел одномерной (кольцеобразной) сети будет соответствовать одному цветовому центру, в результате чего по завершении обучения такой АНС центры цвета оказываются преимущественно в области кластеров. Технически кольцеобразную АНС можно обучать, используя обычный алгоритм самоорганизации, но со специально сформированными входными данными. Можно выбрать двумерные данные, в которых первая компонента соответствует горизонтальной оси АНС обычного двумерного типа, а вторая компонента соответствует ее вертикальной оси. Из светлых областей можно выбрать больше данных, а из более темных меньше. Данные должны подбираться таким образом, чтобы различные оттенки использовались для того, чтобы показать распределение плотности вероятности. Известно, что модельные векторы АНС отражают распределение данных, поэтому они окажутся преимущественно в области кластеров (на светлых участках).

Выбор подходящих оттенков для обозначения


Выбор подходящих оттенков для обозначения цветовых центров производится следующим образом. Если бы каждый цветовой центр был принудительно помещен в отдельную область, соответствующую кластеру, было бы разумно просто соотнести каждый из них с определенным цветом. Если представить себе круговой спектр, в котором каждому цвету соответствует определенный угол, то любой возможный цвет может быть сопоставлен с определенным углом. Тогда цвета выбранных принудительно цветовых центров можно определить таким образом, чтобы на диаграмме спектра между ними были одинаковые промежутки. Если это возможно, соседним центрам цвета следует соотнести цвета, близкие по положению в спектре. Когда центры цвета помещаются на плоскость выходных изображений автоматически, несколько центров могут оказаться в одной и той же обширной области, соответствующей одному кластеру. Поэтому цвета, соответствующие этим центрам, нельзя выбирать «равноудаленными» друг от друга, поскольку в этом случае в области кластера будут наблюдаться резкие цветовые переходы. Предположим, что цвета центров внутри каждого кластера в отдельности выбраны сравнительно близкими. Тогда каждый кластер приобрел бы отличительный цветовой оттенок, который медленно изменялся бы по мере приближения к окружению этого кластера. В промежутках между кластерами наблюдались бы более резкие цветовые переходы. Подобный способ раскраски в точности соответствует тому, который получается путем использования цепочки одномерной АНС для размещения центров цвета. Кольцеобразную АНС можно рассматривать как круговой спектр, подстроенный под заданное представление. Узлам на кольцеобразной АНС можно приписать цвета, расстояние между которыми приблизительно обратно пропорционально «степени кластеризации» или плотности входных данных. Таким образом, цветовые центры, лежащие внутри одного и того же кластера, приобретут близкую по спектру окраску. Для пояснения технических деталей данной процедуры стоит заметить, что каждый цветовой центр прикреплен к единственному узлу двумерной плоскости выходных параметров, представляющей собой основу для визуального представления данных. Тенденцию к кластеризации вокруг каждого центра можно оценить по расстояниям между соседними модельными векторами на этой двумерной плоскости, поскольку плотность распределения модельных векторов отражает плотность распределения данных. В частности, расстояние между цветами может быть определено по расстояниям между модельными векторами, которые соответствуют этим центрам на двумерной плоскости выходных параметров АНС. Расстояние между центрами вычисляется вдоль пути, который начинается в одном из цветовых центров, переходит к модельному вектору в соседнем узле на каждом из шагов алгоритма и, наконец, завершается в другом цветовом центре. Из всех возможных путей подобного рода необходимо выбрать самый короткий. Хотя эта процедура может показаться несколько усложненной, она необходима для того, чтобы остальная часть плоскости выходных изображений была окрашена должным образом. Большой кластер может быть окрашен неоднородно, что на самом деле вполне объяснимо. Если бы вся плоскость выходных изображений в частном случае содержала лишь один большой кластер, показать структуру, существующую внутри этого кластера, было бы более целесообразно, чем окрасить всю плоскость в один и тот же цвет. Окрашивание оставшейся части плоскости выходных изображений производится после того, как центры кластеров выбраны и окрашены. Каждому участку плоскости приписывается цвет, отражающий сходство данного участка с цветовыми центрами. В результате окраска каждого участка вне кластеров будет представлять собой смешение цветов цветовых центров. Величина каждого из коэффициентов смешивания цветов будет тем больше, чем более выражено будет сходство данного участка с соответствующим цветовым центром.

каждый коэффициент смешивания будет функцией


Точнее, каждый коэффициент смешивания будет функцией расстояния между модельным вектором, соответствующим раскрашиваемому участку плоскости выходных параметров, и одним из цветовых центров. Это расстояние должно вновь вычисляться по кратчайшему пути, каждый шаг которого представляет собой переход от одного модельного вектора к другому, соседнему. Зависимость коэффициента смешивания от этого расстояния лучше всего сделать гауссовой. Можно также использовать обратно пропорциональную зависимость, но гауссова функция позволяет избежать значительного «перетекания» краски от центров цвета к удаленным участкам плоскости выходных параметров. Каждый коэффициент смешивания умножается на весовой фактор, обратно пропорциональный плотности цветовых центров, расположенных в окрестности рассматриваемого. Эта плотность оценивается по расстоянию между соседними цветовыми центрами. Если данной процедурой не воспользоваться, то цвет области большого кластера, содержащей несколько цветовых центров, будет влиять на цвет окружения сильнее, чем цвета меньших по размеру кластеров. Для упрощения интерпретации полученной цветовой картины следует отметить, что, как правило, количество цветовых градаций в окрестности кластеров является наибольшим. Количество градаций зависит от плотности цветовых центров, которые расположатся вокруг кластеров, чтобы обеспечить яркость и четкость их окраски. В связи с этим участки плоскости выходных параметров, расположенные вдали от кластеров, вероятно, будут иметь окраску, соответствующую цвету ближайшего кластера. При этом по мере удаления от кластера количество цветовых градаций на единицу площади плоскости выходных изображений будет уменьшаться. Рассмотрим некоторые специфические задачи, решаемые при помощи АНС, а также анализ релевантностмодели. Все они связаны либо с усеченным способом использования основного алгоритма АНС, либо с использованием дополнительных математических методов, построенных на иных алгоритмах. Специальные варианты плоскостей выходных параметров АНС, на которых с помощью масштабирования усилено влияние отдельных компонент, называются компонентными плоскостями (component plane representations). Они позволяют проводить более глубокий анализ каждой из входных переменных. С помощью визуального изучения топологии распределения признаков по поверхности компонентных плоскостей можно наглядно представить взаимное влияние входных данных друг на друга. Представление в виде компонентных плоскостей является своего рода урезанной версией АНС. Каждая компонентная плоскость отражает относительное распределение одной из компонент входного вектора данных. В этом представлении более светлые области на плоскости выходных параметров соответствуют сравнительно малым величинам выбранного параметра, в то время как более темные . Сравнительно большим. При сравнении компонентных плоскостей можно визуально определить взаимную корреляцию двух компонент: чем в большей степени рисунок компонентной плоскости одного показателя сходен с рисунком плоскости другого, тем сильнее корреляция между этими показателями. Компонентные плоскости могут быть также использованы для обнаружения корреляции между входными данными, значения которой различны в различных областях пространства входных данных. Если графическое представление топологии распределения признаков в одних и тех же областях нескольких плоскостей (две и более компонентные плоскости) похоже по расположению одинаково окрашенных областей, это означает, что соответствующие входные данные в высокой степени коррелируют между собой. Представление в виде компонентных плоскостей дает четкое визуальное представление о корреляции между компонентами входного вектора. Выбирая одни и те же нейроны в каждой из компонентных плоскостей (в одном и том же месте), можно собрать вместе относительные значения вектора нейросети.

Часто для изучения компонент используются


Часто для изучения компонент используются также дополнительные математические инструменты, например, ортогональной матрицы и проекции Сэммона. Они дают грубое визуальное представление о расстояниях между отдельными компонентами входных данных попарно. Это особенно полезно для предварительного анализа, так как дает возможность получить приблизительное визуальное представление распределения классов и степени их перекрытия. Ортогональная матрица представляет собой двумерную диаграмму, на которой геометрические отношения данных в пределах выборки представляются цветом разной насыщенности: чем больше расстояние между векторами, тем интенсивнее окрашивается соответствующий элемент на ортогональной матрице. Представление с помощью ортогональной матрицы позволяет судить об относительных расстояниях между элементами плоскости выходных параметров: векторы весовых коэффициентов элементов плоскости отстоят друг от друга тем дальше, чем интенсивнее окраска соответствующих элементов. Таким образом, отдельные кластеры данных будут выглядеть в виде светлых пятен, разделенных более темными областями. Отображение Сэммона визуализирует ту же информацию, что ортогональная матрица, но только в форме образованной из прямых отрезков сети, построенной в трехмерном пространстве. Дополнительное третье измерение служит для визуального отображения расстояний между векторами. После завершения процесса самоорганизации сети целесообразно расставить индикативные метки для нейронов плоскости выходных параметров. При этом за основу принимается то, что узлы «интеллектуальной» сети тяготеют в пространстве данных к областям концентрации примеров данных. Иными словами, плоскость выходных параметров или «нейросетевой дисплей», отображает координаты узлов (т.е. модельных векторов), соответствующих различным нейронам. Это дает право пометить все или некоторые нейроны, для того чтобы стало непосредственно ясно, что они означают. Обычно в статистических таблицах каждая запись, соответствующая, например, одной компании, описывается единственным множеством данных. Названия этих записей можно, таким образом, использовать в качестве меток. Предположим, что модельные векторы сходятся к приемлемым * k m . Если r (t)  . вектор входных данных, имеющих символьное обозначение s(t) , и если выполняется условие: то на нейроне-победителе можно поставить метку s(t) . С другой стороны, если данные в записи стохастические, как, например, данные, описывающие исторические состояния производственного процесса, то различные измерения данных в одной и той же записи дадут в целом разные векторы данных r (t)  . Как правило, существует возможность давать названия некоторым, четко определенным состояниям процесса (например, состояние банкротства).

При нанесении названий на плоскость


При нанесении названий на плоскость выходных параметров в качестве меток необходимо исходить из принципа мажоритарного голосования, поскольку, если ввести все входные векторы r (t)  , они пометят различные нейроны, и каждый нейрон будет, таким образом, иметь множество меток. Поэтому в качестве наиболее характерной может быть выбрана метка, чаще других относимая к соответствующему нейрону. Для выбора маркеров, идентифицирующих нейроны на плоскости выходных параметров, также могут быть использованы традиционные картографические приемы. Графические переменные могут быть использованы для каждого из компонент входных данных. Местоположение ( x, y ), цвет (оттенок, насыщенность, интенсивность), размер, форма, структура и ориентация могут быть использованы для соответствующей комбинации компонент. Для больших значений тех или иных компонент могут использоваться фигуры большего размера. Местоположение, размер, интенсивность, насыщенность, строение и ориентация могут представлять структуру и пропорции входных данных, оттенками целесообразно представить взаимосвязи в структуре входной информации, а кроме этого, и тип связей. Как наиболее наглядный элемент, форма должна использоваться для представления типа входных параметров. В целях более ясного разграничения областей на плоскости выходных параметров и интерпретации результатов целесообразно исследовать синаптические веса нейронов. В простейшем случае синаптический вес выбранного нейрона по определенному показателю находится по результатам одномерного статистического анализа значений этого показателя в подмножестве входных данных, вызвавших активизацию данного нейрона. В более общем случае синаптические веса находятся по результатам кластерного анализа. В соответствии с тремя наиболее распространенными критериями на плоскости выходных параметров можно получить три распределения: одно . максимальных синаптических весов, одно . минимальных и одно . наибольших по абсолютному значению. На каждый нейрон плоскости выходных параметров наносится номер соответствующего синаптического веса. Технически карта синаптических весов получается путем присвоения каждому нейрону номера того показателя из набора входных данных, который для данного нейрона в максимальной степени соответствует избранному критерию относительно других показателей. На нейронах плоскости выходных параметров, наибольших по абсолютному значению синаптических весов, как правило, указывается также направление отклонения скалярного значения (плюс для максимальных значений и минус для минимальных).

Это дает возможность учесть как


Это дает возможность учесть как положительные, так и отрицательные признаки, влияющие на нейроны в наибольшей степени, поскольку принять во внимание слабые стороны каждой группы компаний наряду с ее сильными сторонами представляется крайне полезным. В результате получается матрица номеров синаптических весов, спроецированная на плоскость выходных параметров. При этом каждой группе компаний (кластеру на плоскости выходных параметров) будут соответствовать некоторые группы синаптических весов. Например, одна группа может характеризоваться в целом высокой общей задолженность, другая . высокой балансовой прибылью, третья . низким оборотным капиталомв совокупности с повышенными расходами на персонал и т.д. Это позволит выявить наиболее характерные признаки отдельных групп компаний, что, в свою очередь, даст возможность описать их экономическую стратегию. При анализе возможности банкротства исследования синаптических весов помогают определить, какие переменные доминируют в той или иной области карты банкротств. На итоговой карте для каждого нейрона синаптические веса покажут, какая переменная особенно важна при распознавании, т.е., иными словами, какой положительный или отрицательный признак в наибольшей степени отражает данный нейрон. Путем изучения синаптических весов на плоскости выходных параметров можно будет выделить не только зону банкротств и платежеспособности, но и области высокой прибыли, низкой ликвидности и т.д. Это позволит понять, как происходила группировка предприятий, и какие переменные являются наиболее важными для диагностики возможности банкротства. Выделив с помощью синаптических весов как наибольшие, так и наименьшие значения ключевых показателей массива входных данных и сведя их в одну плоскость выходных параметров, можно получить так называемую таблицу для принятия решений об инвестициях в ценные бумаги эмитентов, или маркированную карту инвестиций, напоминающую карту платежеспособности. На такой таблице можно увидеть, что различные группы эмитентов кластеризуются в различных ее частях или зонах. Иногда резких различий между этими зонами нет, однако, таблица принятия решений позволяет упростить инвестору выбор ценных бумаг эмитентов с определенными характеристиками.

Существует интересный способ анализа плоскостей


Существует интересный способ анализа плоскостей выходных параметров высокого уровня. На выбранные нейроны наносятся траектории их движения по плоскостям более низкого уровня. При этом рассматриваются несколько плоскостей, построенных по информации следующих друг за другом годов. При наличии достаточного места для изображения всех элементов изображения изменение траекторий, как правило, происходит плавно. Интересная особенность при этом проявляется на картах платежеспособности, отражающих различия в уровне платежеспособности и рентабельности. Платежеспособность на правильно сориентированной карте возрастает сверху вниз, а рентабельность . слева направо. При этом зона наибольшей концентрации данных о банкротстве занимает различное положение в зависимости от времени его наступления. Сначала возрастание риска банкротства связано, главным образом, с низкой стабильностью, а затем . также и с понижением рентабельности. Траектории состояния компаний обычно стремятся вращаться по часовой стрелке. Снижение рентабельности (смещение влево) приводит обычно к уменьшению платежеспособности (смещение вверх). Исключения из этого правила указывают на некоторые отклонения от нормы, такие как изменения в структуре капитала компании. Карта платежеспособности получается путем самоорганизации данных. Можно прямо на карте показать образы (компании), которые в наибольшей степени повлияли на каждый из нейронов (не только местоположение каждой компании на карте). С точки зрения нейронных сетей, близкими друг к другу считаются те фирмы, которые имеют сходные паттерны показателей. Путем исследования синаптических весов можно обозначить на карте определенные области. Однако этого может оказаться недостаточно для того, чтобы определить границы между отдельными фирмами. Самоорганизующуюся карту платежеспособности полезно дополнить кластерным анализом. В результате на карте платежеспособности будут очерчены границы кластеров. Некоторые из групп будут находиться в зоне банкротства, а некоторые . в зоне платежеспособности. Часть пограничных групп могут включать разные компании, что призывает оперировать с ними осторожно. В целях избежания путаницы, конкретизируем используемые здесь понятия из теории множеств. Паттерны . компактные группы, образованные в массиве входных данных параметрами со сходным поведением. На проекции Сэммона такие параметры образуют плоские участки. Кластеры образуются в массиве входных данных из близких по характеристикам объектов (в данном случае . компаний). На плоскости выходных параметров АНС кластеры определяются визуально как области с относительно однородной интенсивностью окраски. Понятие «образ» в данной монографии используется в двух контекстах. Чаще всего образ представляет собой предъявляемый на вход сети единичный вектор входных параметров (синонимом является единичная реализация последовательности входных данных или набор финансово экономических показателей по одному предприятию). Иногда (в понимании теории распознавания образов) образом называется определенная путем введения ограничений категория входных объектов, используемая с целью придания осмысленности классификации или кластеризации. Распознавание образов (pattern recognition) предполагает в качестве образа вектор измеренных величин. Для выявления концептуальных категорий в пространстве входных данных чрезвычайно полезным представляется изучение соответствующим образом упорядоченной АНС. Категории формируются на основе наблюдений за счет рассмотренных в начале данного раздела свойств самоорганизации АНС. Будучи близкими по содержанию в пространстве входных данных, они оказываются рядом и на плоскости выходных параметров. Таким образом, концептуальная иерархия может быть образована разделением групп нейронов в соответствии с произвольным уровнем абстракции. Нетипичные объекты также отчетливо различимы на плоскости выходных параметров. Их влияние сказываются лишь на положении соответствующего им и соседних нейронов. Евклидово расстояние является наиболее часто используемой в соревновательных АНС мерой сходства. Такое расстояние между компаниями со сходными структурами финансово-экономических показателей будет невелико, и, таким образом, эти компании будут располагаться на плоскости выходных параметров поблизости друг от друга в пределах одного кластера. Верно также и обратное: если две компании имеют существенно отличные структуры показателей, то и расстояние между ними будет большим, что не позволяет использовать для их совместного определения в пространстве простые концептуальные категории. Так же как различие между любыми двумя компаниями определяется как евклидово расстояние между векторами их показателей, так и различия между любыми двумя группами компаний может подсчитываться как евклидово расстояние между нормированными по каждой группе векторными переменными.

к определению границ концептуальных категорий,


Приступая к определению границ концептуальных категорий, целесообразно первоначально создать проекции Сэммона по основным финансово-экономическим показателям предприятий. По проекции Сэммона часто можно определить, что распределение данных унимодально (имеет единственный максимум), иными словами, данные не кластеризуются. В ряде случаев, однако, это может являться следствием некорректной входной обработки данных, например, способом выравнивания по гистограмме. Это можно проверить, рассмотрев плотности безусловного распределения исходных данных. Выполненная по методу Сэммона проекция некоторой выборки предприятий может также сразу продемонстрировать, что очень мало предприятий располагается близко друг другу, а также многие из них находятся на большом расстоянии от главных кластеров. В этом случае имеет смысл поэкспериментировать с масштабированием и построить новые границы главных кластеров. Как правило, результаты успешного использования масштабирования хорошо видны на проекции Сэммона. АНС может быть с высокой эффективностью использована для получения репрезентативной выборки из общей совокупности входных данных. Например, она позволяет выбрать по одному предприятию из каждой группы, которые вместе образуют репрезентативную выборку из всей совокупности компаний. АНС представляют собой хороший инструмент для сравнения различных классов (подклассов) предприятий по отдельным показателям. Плоскости выходных параметров, созданные с целью разграничения предприятий на подклассы, могут быть с успехом использованы в качестве средства для сравнения отдельных компаний. Этот метод имеет преимущества по сравнению с определением средних значений для каждого подкласса, поскольку метод средних арифметических всегда дает отклонение в сторону группы с большим числом членов. АНС следует рассматривать как ядро системы информационного обеспечения (поддержки) принятия решений для инвесторов, использующей также другие методы математического анализа. В совокупности они образуют компьютерную экспертную систему (expert system), содержащую дерево поиска и метод прослеживания в терминах искусственного интеллекта (artificial intelligence, AI). Исследователь передает такой системе свои знания в форме правил «если . то», а программист реализует их в программном обеспечении. Экспертная система определяет большое логическое дерево или несколько маленьких деревьев. В ее составе можно выделить две части: базу знаний и блок формирования выводов. База знаний представляет собой просто дерево или деревья, сформированные по правилам выбора из двух альтернатив. Блок формирования выводов на практике является некоторой схемой для рассуждений или «соединения» этих правил в единую цепь. В данном случае имеется нечеткая система, которая представляет собой разновидность экспертных систем, в которых знания хранятся в виде нечетких правил или нечетких связей. Результаты обучения АНС можно проверить методом ошибки квантования, а также при помощи проекции Сэммона. Нейроны адаптивной сети представляют собой общую форму входных данных и квантуют входное пространство (т.е. отображают входное пространство на дискретное множество). Обучение нейронов АНС путем последовательного предъявления векторов входных данных позволяетполучить как бы эластичную пространственную сеть, которая по мере обучения нейросети растягивается, охватывая всю совокупность данных входного пространства. При этом ошибка квантования по множеству обучающих примеров является мерой сходства результатов АНС с тестами. Алгоритм такого тестирования состоит в предъявлении на вход АНС группы наборов показателей предприятий, не использовавшихся ранее в процессе обучения и содержащих пропущенные показатели. В результате расчетов определяются значения пропущенных показателей и сравниваются с теми значениями, которые были исключены из тестовых наборов. Критерием качества АНС является наличие явной корреляции между определенными с помощью сети и истинными значениями параметров. Показателем, характеризующим меру сходства, в этом случае является ошибка квантования рядов. Кроме этого, можно вычислить среднее отклонение. Проекции Сэммона позволяют вычислить отклонения по каждому параметру, что также может свидетельствовать о качестве обученной АНС.

Качество построения АНС позволяет оценить


Качество построения АНС позволяет оценить также анализ чувствительности одних компонент к изменению других. С этой целью вычисляется вектор значений некоторого одного избранного параметра. Два других параметра выбираются для построения двух осей, подходящего по размеру окна, а также ряда строк и столбцов. Значение избранного параметра высвечивается на выходной плоскости как цвет элемента изображения или как численное значение. При отображении одногоединственного объекта на плоскости нейроны принимают вид многоугольников. Соответствующие нейроны могут быть выделены на плоскости выходных параметров АНС более ярким цветом. В области компонент, подвергшихся существенному масштабированию, будет располагаться большое число нейронов, в то время как в области слабо масштабированных . один или несколько. При вычислении ошибки квантования вывод значений ограничен только теми элементами изображения, для которых ошибка квантования меньше, чем некоторая пропорцияошибки квантования для множества обучающих примеров. Сильно масштабированные компоненты допускают лишь незначительное изменение значений, а для слабо масштабированных компонент диапазон допустимых отклонений весьма широк. В визуальном представлении на плоскости выходных изображений присутствуют только те области, в которых содержится достаточное количество похожих наблюдений. Особенно интересные нейроны создают на экране неоднородности. Во многих случаях при сравнении этих нейронов с соответствующими им примерами могут быть выявлены некоторые более важные компоненты. В реальной ситуации ни один параметр не имеет точного глобального значения. Значение возникает в каждой конкретной ситуации при комбинации значений компонент, уникальной для того или иного участника рынка. Результаты могут быть обобщены путем группировки аналогичных наблюдений. Чтобы понять различие между соседними наблюдениями, следует учесть, что алгоритм АНС создает нейроны там, где наблюдения, располагающиеся близко друг к другу, являются существенными. Распределение значений того или иного параметра зависит от константы масштабирования. В случае слабо масштабированных компонент усредненные значения их признаков располагаются ближе друг к другу, а граничная область бывает весьма обширной. Граничный эффект и роль масштабирования можно ясно увидеть, расположив наблюдения по линейной шкале оттенков серого цвета. Полученный результат должен быть средним по оттенку. При сильном масштабировании соответствующего параметра можно наблюдать сразу весь спектр значений . от черного до белого, однако АНС при этом может быть очень запутанной. При более слабом масштабировании границы расширяются, и значения оказываются более или менее серыми при меньшем числе нейронов. При среднем масштабировании средне-серую окраску приобретают только один или два нейрона. Влияние основных компонент не может быть полностью элиминировано, причем меньшие по значению компоненты будут усредняться сильнее. Одновременное использование группы плоскостей выходных изображений с различными константами масштабирования является одной из возможностей сгладить представление функции, подлежащей визуализации. Число нейронов, используемых в данном окне значений компонент, и точки, в которых нейроны меняются, различны. Усредненное значение по группе плоскостей дает более сглаженный вид каждого отдельного параметра, поэтому в каждом конкретном случае могут быть использованы наиболее подходящие плоскости выходных изображений. Другим способом сглаживания квантованных значений, сгенерированных АНС, является использование группы объектов, организованных в виде портфеля. Наиболее подходящий нейрон содержит значения компонент каждого объекта, которые затем суммируются и делятся на число объектов в портфеле. Слегка различающимся между собой объектам соответствуют значения нейронов, расположенных по соседству или в других подобластях, а для нетипичных объектов вычисляются, возможно, наилучшие значения.

Метод формирования портфеля особенно полезен


Метод формирования портфеля особенно полезен при анализе чувствительности. В этом случае для каждого объекта и для каждого элемента плоскости выходных изображений вычисляется значение одной из компонент, а результирующее среднее значение представляется в графической (путем выделения цветом) или цифровой форме. В результате становятся видны типичные комбинации значений компонент, которые располагаются обычно вместе. Качество различных АНС можно сравнивать, вычисляя средние значения портфелей для заданных подтипов в пространстве наблюдений. Для отдельных типов и компонент могут быть разработаны специальные плоскости выходных параметров, результаты которых будут заметно лучше. Иногда на таких плоскостях, особенно вблизи границ пространства наблюдений (там, где существенно важные нейроны при обычном алгоритме не учитываются) видны некоторые систематические ошибки. Одним из важнейших применений портфеля является анализ редких компонент и исключительныхслучаев. Некоторые ситуации могут возникать лишь случайно. При этом распределение наблюдений будет настолько разнообразным, что в пространстве наблюдений становится невозможной какая бы то ни было кластеризация. Эти объекты можно сравнить с типичными значениями, не относящимися к исключительным ситуациям. С помощью определенной группировки значения компонент, входящих в портфель объектов, могут сравниваться и усредняться. В общем случае, чтобы проверить обученную АНС на релевантность, необходимо либо иметь дополнительную информацию, не использовавшуюся при создании АНС, либо использовать для получения тех же результатов другие математические методы. Например, при проверке достоверности карты платежеспособности метод АНС можно проверить с помощью линейного дискриминантного анализа (ЛДА) (linear discriminant analysis). Эта математическая модель наиболее часто применяется для предсказания банкротств. Основой алгоритма ЛДА является вычисление по специальной формуле показателя Z , характеризующего в комплексе платежеспособность компании. Получив показатель Z для каждой компании из входного массива, необходимо нанести его значения на плоскость выходных параметров АНС. Это позволит ограничить некоторые области, состоящие из фирм со сходной, согласно проделанному анализу ЛДА, платежеспособностью. Этим областям можно дать название диапазонов неплатежеспособности (диапазоны изменения Z ). Можно сделать вывод о релевантности АНС, если определенные диапазоны неплатежеспособности ( Z  7 ) будут находиться в зоне платежеспособности на плоскости выходных параметров АНС. Аналогично, низкие диапазоны неплатежеспособности (Z  2 ) должны полностью попадать в зону банкротства. Компании с показателем Z , лежащим в диапазоне от 2 до 5, должны попадать в пограничную зону. Чтобы получить диапазоны неплатежеспособности, вместо ЛДА можно также использовать другую нейронную модель . многослойный перцептрон. Эта модель имеет общую с ЛДА цель . получение показателя Z для использования его как меры платежеспособности. Данная модель также способна разделять нелинейные паттерны. Фактически ЛДА представляет собой частный случай многослойного перцептрона.

и тех же единицах, например,


Нормирование на основе привязки к другим переменным (linking) означает, что, если две компоненты измеряются в одних и тех же единицах, например, в рублях, и обе имеют один и тот же диапазон изменения, их может быть удобно нормировать с помощью одного фактора. При автоматическом нормировании, как правило, компонента нормируется по стандартному отклонению, если диапазон ее изменения не превышает восьми стандартных отклонений. В противном случае нормирование производится по диапазону ее изменения. Число «8» выбрано, исходя из эвристических соображений, поскольку, как показывает практика, это приводит к более или менее естественному нормированию. В большинстве случаев лучше позволить компьютерной программе произвести нормирование переменных в соответствии с параметрами, предлагаемыми по умолчанию. Присвоение переменной более или менее высокого приоритета имеет тот же эффект, что и явное изменение нормировки. Вводя приоритеты переменных, исследователь производит взвешивание переменных в процессе формирования плоскости выходных параметров. Например, если при сравнительной оценке эффективности работы предприятий показатель оборачиваемости активов считается менее важным, этой переменной может быть присвоен более низкий приоритет. Приоритет переменной придает ей дополнительный вес путем умножения данного фактора на его внутренний масштаб. Если установленный приоритет превышает единицу, внутреннее представление соответствующей переменной будетохватывать более широкий диапазон, в результате чего кластеры, расположенные вдоль соответствующей оси, станут более протяженными. Напротив, если установленный приоритет не превышает единицы, соответствующая компонента будет сжата, и ее влияние на результирующую картину снизится. В частности, если фактору приоритета присвоено очень малое значение, например от 0 до 0,1, то влияние соответствующей компоненты становится абсолютно несущественным. Этот эффект можно использовать при связывании того или иного параметра с остальными данными в целях устранения его влияния на процесс упорядочивания выходных параметров. Например, если при анализе прибыльности предприятий желательно, чтобы решающую роль в визуальном представлении играли затраты на персонал, можно определить приоритет соответствующего параметра большим единицы. Аналогично, если параметр краткосрочной задолженности не должен иметь большого значения, необходимо установить для него более низкий приоритет. Очевидно, что распределение приоритетов может приводить к значительным изменениям вида результирующих структур на плоскости выходных параметров. Выбирая диапазон изменения переменной по гистограмме и устанавливая величину коэффициента увеличения, можно добавлять либо удалять записи в той или иной области пространства данных. Этот процесс обычно называется модификацией данных. Выбор диапазона увеличения является очень тонкой процедурой, поэтому использовать ее следует с большой осторожностью. Менее критичным является подавление части данных, которое может оказаться полезным при исключении выбросов или выборе диапазона для построения гистограмм. Если исследователя интересуют конкретные участки диапазона изменения данных, увеличение данных участков может послужить эффективным средством для того, чтобы сосредоточить процесс создания плоскости выходных параметров в соответствующей области. Любая модификация множества данных отражается на гистограмме не только выбранной, но и других компонент, поскольку при этом происходит добавление или удаление не только отдельных компонент, но записей данных в целом.

Как правило, АНС позволяет обрабатывать


Как правило, АНС позволяет обрабатывать наборы входных данных с некоторым количеством пропущенных параметров. Как отмечалось в предыдущем разделе, это является одним из важных преимуществ алгоритма. Таким образом, отсутствие нескольких значений во входных наборах не означает, что эти наборы должны быть удалены. Но если количество пропущенных данных в определенных наборах значительно, скажем, более 50%, то соответствующие векторы целесообразно исключить в процессе модификации данных. Преобразование данных может быть использовано применительно к любой переменной с целью оценки ее значимости или влияния на окончательный результат. Наиболее распространенными видами преобразования являются логарифмическое и сигмоидное. В ходе преобразования первого типа производится сжатие масштаба высоких значений переменных, последнее же принимает во внимание выбросы. Как правило, компьютерные программы, реализующие алгоритм АНС, предлагают установленные по умолчанию значения параметров преобразования, обеспечивающие достаточно правдоподобный выбор градиентов и смещения. В процессе преобразования данных изменяются характеристики распределения данных. Внутреннее представление данных переопределяется переменной с помощью выбранной функции. Поскольку при этом изменяются расстояния между записями, данная процедура оказывает влияние на внутренние отношения соседства во множестве данных. Поэтому пользоваться этим средством следует с осторожностью. Преобразование данных может также применяться для выравнивания гистограмм. Предположим, что записи конкретной переменной сконцентрированы, главным образом, в левой части ее гистограммы, и меньшее число записей имеет большие значения. В этом случае можно начать формирование АНС с более равномерного распределения плотности данных. Применение логарифмического преобразования ведет к большему выравниванию распределения, поскольку логарифмическая функция обладает высоким разрешением в области малых значений на гистограмме. За счет этого меньшие значения будут оказывать большее влияние на кластеризацию данных. Напротив, сигмоидная функция создает более сбалансированное распределение путем растяжения центра гистограммы и сдвига ее концов. Преобразования с помощью сигмоидной функции позволяют обрабатывать резкие выбросы в исходных данных, не исключая их из рассмотрения.

Программы автоматически определяют, сколько записей


Программы автоматически определяют, сколько записей из исходного множества данных соответствует каждому узлу. Узлы, которым не соответствуют никакие данные, окрашиваются в белый цвет. Узлы, которым соответствует хотя бы один набор данных, окрашиваются в монохромный цвет, насыщенность которого зависит от количества соответствующих им данных. Цветная шкала в нижней части экрана позволяет соотнести используемые цвета с численными значениями. Программы также автоматически определяют ошибку квантования, которая представляет собой меру соответствия векторов исходного множества данных тому или иному конкретному узлу. Среднее значение этих величин по всем узлам представляет собой ошибку квантования для АНС в целом. Ошибка квантования для узлов, которым не соответствует никаких данных (т.е. частота равна нулю), изображается обычно белой. Ненулевые значения ошибки квантования показываются различными оттенками одного цвета. Цветная шкала в нижней части экрана позволяет соотнести используемые цвета с численными значениями. Программные пакеты дают возможность в каждом окне, независимо друг от друга, вывести или скрыть различные аспекты АНС, используя для этого команды меню либо различные комбинации клавиш:  показать или скрыть метки;  показать или скрыть разграничители;  показать или скрыть изолинии;  показать или скрыть ближайшее окружение кластеров.

При обучении АНС целесообразно использовать


При обучении АНС целесообразно использовать несколько выбранных случайным образом обучающих множеств и испытывать модель на нескольких множествах тестовых данных (не включающих в себя примеры, использованные для обучения), с большей или меньшей интенсивностью помех, с выбросами или без них. Сопоставление полученных результатов поможет выбрать АНС, наилучшим образом соответствующую поставленной цели. Если оценивать АНС подобным образом, скорей всего, обнаружится, что между количеством, качеством и устойчивостью кластеров, полученных с помощью данной модели, существует множество компромиссных вариантов. Наилучшая комбинация должна определяться исследователем с точки зрениямаксимально полного решения конкретных задач, стоящих перед ним. В некоторых случаях требуемое сжатие данных может быть максимальным (что соответствует минимальному числу кластеров), и соответствующее низкое качество кластеров и слабая устойчивость будут вполне допустимыми. В других случаях может потребоваться создание более тонко настроенной АНС (т.е. плоскости выходных параметров с четкими границами между кластерами) и хорошая устойчивость без значительного сжатия данных. Например, если выходные результаты предназначаются, главным образом, для выработки политики и принятия решений на макроуровне, требуется максимальное сжатие данных. Для других задач, таких как анализ эффективности работы предприятий, потребуется намного более тонкая дифференциация между кластерами. В заключение данного раздела рассмотрим наиболее типичный случай объединения метода АНС с генетическими алгоритмами с точки зрения соответствующих процедур. Полученная в результате этого система сохраняет свойства АНС, позволяя добиться большей гибкости за счет того, что размерность плоскости выходных параметров заранее не фиксируется. Размерности этой плоскости эволюционируют по мере обучения. Используемая при этом процедура состоит из четырех этапов: 1. Инициализация нейронной сети. Исходная плоскость выходных параметров состоит из основных нейронов, организованных в виде плоской решетки небольшой размерности; ее рост в дальнейшем будет зависеть от законов эволюции. 2. При предъявлении нейросети вектора входных данных каждый нейрон исходной структуры оценивается по критерию сходства АНС, в результате чего определяется нейрон-победитель, который является наилучшим приближением вектора входных данных. 3. Производится генерирование новых нейронов и их добавление на плоскость выходных параметров. Число нейронов в каждой последовательной генерации зависит от факторов роста (reco и thresold), определяемых перед началом процедуры, а также пространственной диспозиции нейронов на плоскостивыходных параметров. Свойства новых нейронов частично «наследуются» от нейрона-победителя, а частично берутся из списка случайных величин, лежащих внутри заданных изначально границ, что напоминает биологический процесс скрещивания и мутации. АНС реагирует на внешние стимулы в зависимости от предопределенных критериев. Коэффициент редукции отражает то, каким образом нейрон-победитель создает свое окружение. Чем выше значение данного коэффициента, тем меньше векторное расстояние до соседних нейронов. С математической точки зрения коэффициент редукции действует как весовой коэффициент при вычислении евклидова расстояния от лидера до остальных нейронов. Значения этого коэффициента будут более высокими на первых стадиях, постепенно уменьшаясь по мере выполнения алгоритма. Во многих случаях целесообразно не сохранять значения коэффициента постоянными, а подобрать функцию, которая управляла бы его изменением по ходу обучения АНС. 4. Этот этап представляет собой повторение процесса от этапа 2 до тех пор, пока в АНС не будут введены все входные данные.

алгоритма АНС от обычного заключается


Основное отличие «генетического» алгоритма АНС от обычного заключается в типе создаваемой плоскости выходных параметров. С геометрической точки зрения отличительные особенности алгоритмов состоят в способе представления ими пространства входных данных. Главная идея, на которой основана архитектура генетической АНС, состоит в выявлении существенных особенностей входных данных, динамике их изменения и настройке на них, что дает возможность АНС самостоятельно выбирать направления эволюции. Небольшая в начале плоскость выходных параметров развивается по определенном направлении, выделяя те особенности входных данных, которые алгоритм АНС считает наиболее перспективными. Рост плоскости может контролироваться, поскольку индексация новых генераций отлична от индексации предшествующих. Таким образом, всегда сохраняется двумерная структура плоскости выходных параметров, даже если на практикенейроны окажутся организованными в различные слои в соответствии с моментом их создания. Окончательный результат применения метода генетической АНС оказывается совершенно отличным от того, которого можно было бы ожидать при обучении с помощью обычной АНС. Генетическая АНС значительно лучше распознает структуры и паттерны во входных данных даже в случае существенного влияния искажающих факторов. Это позволяет рекомендовать этот алгоритм для решения задач количественного прогнозирования с помощью нейронных сетей. Если сравнить результаты генетической и обычной АНС по характеристикам сходимости, масштабируемости, способности к обобщению и стабильности, то в большинстве случаев генетический алгоритм окажется более эффективным. Масштабируемость связана со свойством сходимости в том смысле, что возрастание числа нейронов на плоскости выходных параметров требует большего времени для выполнения одной итерации в процессе обучения. Иначе говоря, сложность сети влияет на время вычисления. Не смотря на то, что количество нейронов в генетических сетях в конце процесса обучения, как правило, превышает их количество в обычных АНС, такие сети требуют меньше времени на обучение, так как обучающий процесс изначально охватывает небольшое число нейронов. Т.е. на начальных шагах процедуры сеть имеет небольшое число нейронов, увеличивая тем самым скорость процесса распознавания образов. Важнейшим отличительным качеством генетических сетей является высокая способность к обобщению способность распознавать образы, лежащие вне множества обучающих примеров. Это качество становятся особенно очевидными при сравнительном анализе стабильности алгоритмов двух типов. Генетический алгоритм дает более близкие друг к другу результаты всякий раз, когда моделирование повторяется с измененными ключевыми параметрами.