Читать книгу PANN: Новая Технология Искусственного Интеллекта. Учебное пособие онлайн

3. PANN, в отличие от классических сетей, не требует очень большой памяти и вычислительной мощности компьютера, поэтому можно использовать дешевые компьютеры и требуется намного меньшее количество электроэнергии.

4. PANN позволяет решать сложные задачи на однослойной сети.

5. PANN требует в десятки и даже сотни раз меньшего количества имиджей в обучающей выборке.

Таким образом открываются возможности создавать на основе PANN полноценные продукты, используя не очень дорогую и экономичную в плане потребления энергии компьютерную технику.

Рис. 5. Долгое и дорогое обучение против быстрого и дешевого

2.4. МАТЕМАТИЧЕСКАЯ ОСНОВА РАСПОЗНАВАНИЯ

НА НЕЙРОНЕ PROGRESS

Линейность нейрона Progress приводит к тому, что и сеть, построенная на этих нейронах, линейна. А это обеспечивает ее полную прозрачность, простоту описывающей ее теории и применяемой математики.

В 1965 г. Лотфи Заде ввел понятие «нечетких множеств» и идею «нечеткой логики». В какой-то степени это послужило подсказкой для нашей работы по разработке математического обоснования и логики PANN. Математические операции в PANN направлены на сравнение неточно совпадающих имиджей и оценку степени их расхождения в виде коэффициентов сходства.

2.4.1. Определения

В 2009 г. было сделано интересное открытие, названное «нейрон Мерлин Монро» или в других источниках «нейрон бабушки». Оказывается, в голове человека знания по определенным темам «разнесены» по отдельным нейронам и нейронным группам, которые связаны друг с другом ассоциативными связями, так что возбуждение может передаваться с одних нейронов на другие. Это знание вместе с принятой парадигмой «Один нейрон – один имидж» позволило построить систему распознавания PANN.

Введем понятие «нейрон-имидж» – это нейрон, обученный конкретному имиджу. В PANN каждый нейрон-имидж – это реализованная функциональная зависимость (функция) Y = f (X), где:

X – некоторый числовой массив (вектор), обладающий свойствами:

при X = A, f (A) = N

при X ≠ A, f (A)

A – некоторая заданная величина.

N – размерность вектора X, то есть число цифр в этом векторе.

Для записи числовых векторов X предложен специальный формат, запатентованный компанией Progress Inc. Этот формат, названый Binary Comparison Format (BCF), представляет собой прямоугольную бинарную цифровую матрицу, в которой:

• количество колонок равно длине N (числу цифр) массива;

• количество строк равно числу выбранных для сети уровней веса k;

• каждая значащая цифра обозначается единицей (1) в соответствующей строке, а отсутствие цифры – нулем (0);

• каждая строка соответствует некоторой значащей цифре записываемого числового массива, то есть в строке, обозначенной как «нулевая», цифра «1» соответствует цифре «0» в исходном массиве, а в строке, обозначенной как «девятая», – цифра «1» соответствует цифре 9 в массиве;

• в каждой колонке матрицы имеется одна единица, соответствующая величине данной цифры, а все остальные величины в этой колонке равны 0;

• сумма всех единиц в матрице массива равна длине N данного массива, например для массива из 20 цифр она равна 20;

• суммарное количество нулей и единиц в матрице каждого массива равно произведению длины N данного массива на величину основания используемой системы счисления.

1, 9, 3, 6, 4, 5, 4, 9, 8, 7, 7, 1, 0, 7, 8, 0, 9, 8, 0,2].

Рис. 6. BCF-имидж как разреженная бинарная матрица

Особенностью сетей PANN является то, что обучение нейронов по имиджам, типичное для нейронных сетей, может быть заменено переформатированием файлов, несущих числовые зависимости, к формату BCF, или просто загрузкой в сеть файлов в этом формате.

X |X|.

2.4.2. Сравнение числовых массивов

Сравнение объектов, или определение сходства и различия.

Определение сходства тех или иных объектов путем их сравнения играет огромную роль в мышлении, позволяет выявлять аналогии и отличия разных объектов – существ, предметов, процессов, идей и т. п. В разных отраслях науки, в первую очередь в Теории Подобия, используются безразмерные коэффициенты сходства или критерии подобия (Coefficient Similarity, или CoS), иногда называемые «мера сходства», «мера ассоциации», «мера подобия» и т. п.

Функции сравнения в PANN реализуются через математические операции над матрицами числовых массивов. Рассмотрим простейший алгоритм сравнения через векторное произведение числовых массивов нейронов-имиджей.

121212

1212

Рассмотрим отношение:

CoS12

Примеры:

Рис. 7. Перемножение матриц для сравнения числовых массивов

Рис. 8. Сравнение десятичных числовых массивов |A| и |B|

Классические нейронные сети при распознавании только определяют, на какой класс более всего похож некоторый распознаваемый объект. При этом они не могут указать, насколько он похож. Из-за этого распознавание иногда неустойчиво – существуют известные примеры, когда изменения одного пикселя в имидже оказалось достаточным, чтобы его распознавание изменилось. Это значит, что распознавание в классических сетях сильно зависит от случайных шумов.

В PANN ситуация иная – величина коэффициента сходства очень четко показывает, насколько существенна разница между имиджами. Разница сходства в одну сотую при формате 32 × 32 пикселя соответствует примерно изменению 10 пикселей. И этого уже достаточно для того, чтобы уверенно отличать имиджи друг от друга. А разница в одну десятую говорит уже о вполне серьезном различии и высокой устойчивости распознавания, малой зависимости распознавания от шумов.

В отличие от классических нейронных сетей, сети PANN позволяют резко повысить качество распознавания за счет:

• статистической обработки распознавания по классам и по имиджам;

• совмещения распознавания по классам и распознавания непосредственно по имиджам. Причем совмещенное распознавание по классам и по имиджам позволяет решить одну из самых неприятных проблем, ограничивающих применение нейронных сетей в медицине и ряде других приложений – проблему прозрачности и объяснимости результатов работы сети. Подробнее мы расскажем об этом в разделе «4.6. Распознавание сетью PANN».

2.4.3. Оценка достоверности и точности распознавания

Достоверность и точность распознавания имиджей нейронными сетями крайне важны для их использования.

Точность и надежность распознавания классической нейронной сети определяется путем тестирование нескольких десятков, сотен или тысяч имиджей и подсчета числа правильных и неправильных распознаваний. Это очень спорный тест. Из-за непрозрачности работы классических сетей распознавание сильно зависит от случайных особенностей обучения:

• иногда результаты обучения плохо воспроизводятся, одна и та же сеть, обученная на одних и тех же имиджах, в одних случаях будет распознавать лучше, в других хуже;

• нет способов адекватной оценки точности и надежности распознавания по каждому из имиджей;

• влияние отбора тестовых имиджей. Иногда их подбирают специально для обеспечения нужного результата.

Распознавание сетью PANN оценивается по числовому коэффициенту сходства рассматриваемого имиджа:

1. С любым набором загруженных в сеть отдельных имиджей.

2. Со всеми классами, которым обучена данная сеть.

При этом и классы, и отдельные имиджи ранжируются по степени сходства, что позволяет точно оценить величину различий между всеми сравниваемыми классами и тем самым оценить точность и надежность распознавания.

Безусловно, возможно формально (с точки зрения машины) правильное, но не устраивающее нас распознавание. Даже люди нередко распознают других людей не по главным, а по второстепенным признакам. Например, оценивая сходство не по чертам лица, а по одежде. Бывает, что при распознавании человеческих лиц особенности освещения оказываются более весомыми, чем черты лица.

Но проблемы такого рода вполне решаемы в PANN несколькими путями, в частности:

1. Выравнивание освещенности известными графическими или математическими средствами.

2. Введение системы оценки весомости признаков и фильтрации некоторых признаков.

3. Создание набора пересекающихся классов, как будет показано в ниже.

4. Создание «комитета по распознаванию» – логической экспертной системы, выносящей «приговор» по сумме распознаваний по разным классам и имиджам. То есть фактически воспроизводящей то, что делает человек, внимательно приглядывающийся к объекту.

2.4.4. Индексация числовых последовательностей в BCF

Индексация для быстрого поиска информации.

Сегодня в компьютерной науке широко применяется поисковая индексация. Файлы индексов облегчают поиск информации, и по своему объему они в 10 раз меньше, чем исходные файлы. Но для разных типов файлов (например, графических) индексация сложнее, и поиск не всегда работает адекватно.

PANN обеспечивает более организованный и стандартизированный подход к индексации и поиску.

Использование разработанного компанией Progress Inc формата Binary Comparison Format (BCF) позволяет строить стандартные и универсальные поисковые индексы – идентификаторы для любой числовой последовательности как линейные свертки цифрового массива. Эти индексы представляют собой последовательность матричных сумм с совпадающими номерами строк и столбцов, полученных путем векторного умножения данного цифрового массива на его собственную транспозицию. И они могут быть по объему гораздо меньше, чем при обычной индексации.

При этом процесс поиска по индексам происходит параллельно, что обеспечивает его многократное ускорение.

|X|

|X| |X|^T|X| × |X|^T = |Σ| = Σ00, Σ11, Σ22, Σ33, Σ44, … Σ99

Рис. 9. Формирование поисковых индексов

Длина полученного индекса равна числу уровней веса и не зависит от числа пикселей в имиджах. Значит, если установить стандартное число весов 10 (это удобно, так как соответствует принятой десятичной системе счисления), то эти индексы будут стандартными для всех библиотек, что обеспечит возможность их всеобщего применения.

Каждый образ в библиотеках распознавания должен быть снабжен индексом. Распознавание каждого нового образа должно начинаться с формирования его индекса, на его базе происходит быстрое распознавание по подготовленным библиотекам.

Точность распознавания по такого рода индексам может быть очень высокой. Например, при использовании десятизначной системы счисления (10 уровней веса от 0 до 9), даже если мы ограничимся только первой значащей цифрой каждой суммы, индексом будет комбинация из 10 однозначных, то есть вероятность случайных совпадений индексов не превысит 10^—10 (1 / 10 миллиардов).

2.4.5. Паттерны подобия и другие способы сравнения и индексации в BCF

Выявление паттернов для понимания происходящих событий и управления ими – одно из важнейших приложений нейронных сетей.

Существует немало причин, почему два разных имиджа могут быть подобными или казаться нам подобными. Чаще всего подобие определяется общностью происхождения и/или изготовления разных объектов. Либо тем, что разные объекты изменяются и развиваются по некоторым общим паттернам, например по законам природы. Паттерны в живописи или музыке могут быть законами композиции, конструирования машин – формулами сопромата, в обществе – обычаями и государственными законами и так далее.

Аналог некоторого объекта – это другой объект с высокой степенью подобия данному объекту. Аналогия (похожесть) может быть общей или частной, по тому или иному отдельному параметру, статической или динамической, полной или частичной и т. п. Любой объект может иметь значительное число разных аналогов.

Мы описали распознавание имиджей и формирования поисковых индексов с использованием коэффициентов сходства, получаемых через произведения матриц имиджей. Но это не единственный вариант, возможный в PANN. Мы проверили также другие возможности, в частности, распознавание через:

1. Матричные произведения входного и сравниваемого массивов на массив, представляющий «стандарт сравнения» [Xst] и вычисление CoS через разность полученных матричных сумм.

2. Характеристические суммы двух массивов и вычисление CoS через разность спектров мощностей сигналов входного и сравниваемого массивов.

3. Преобразование Фурье амплитудно-частотных спектров входного и сравниваемого массивов и вычисление CoS через разность или соотношение гармоник одноименных строк BCF-формата.

Разные виды распознавания могут использоваться совместно для повышения точности и достоверности окончательного заключения.

2.5. БИБЛИОТЕКИ СРАВНЕНИЯ КАК ОСНОВА РАСПОЗНАВАНИЯ

Распознавание в сетях PANN аналогично распознаванию в биологическом мозге.

Человеческая память – это обширная библиотека, в которой лежит множество самых разных объектов и связанной с этими объектами информации. При этом многие объекты связаны прямо или косвенно друг с другом ассоциативными связями. Увидев некоторый объект, мы его сравниваем с образами в нашей памяти и так распознаем, например, как собаку, дом или автомобиль. И когда мы распознали объект и вспомнили его наиболее близкие аналоги, мы получаем возможность переносить информацию с аналогов на данный объект. Так мы получаем дополнительные знания об объекте, осознаем возможности его использования или защиты от него и т. п.

Аналогично работает и сеть PANN. В памяти компьютера формируются библиотеки сравнения, и распознавание производится путем сопоставления полученной информации с той информацией, которая лежит в этих библиотеках по степени схожести, определяемой по коэффициентам сходства.

Библиотеки сравнения PANN состоят из «единиц памяти», причем:

1. Каждая «единица памяти» представляет собой некоторую числовую последовательность, которая может быть записана в графических или текстовых форматах или в формате BCF, разработанном специально для PANN.

2. Каждая «единица памяти» может быть снабжена своими индексами (общими и частными, по разным деталям) для быстрого поиска сетью PANN информации в библиотеках.

3. Каждая «единица памяти» имеет сложное строение, содержит данные о разных параметрах и свойствах объекта. Например, я сказал «самолет», и в моей памяти всплыло множество виденных в натуре или на картинках самолетов, знания об их конструкции, применении; проблемы, которые мы решали для компаний «Сухой» и «Миля» в России и «Боинг» в США и т. п.

4. Каждая «единица памяти» имеет ассоциативные, программные, гипертекстовые и т. п. связи со многими другими «единицами памяти». Например, самолет у меня лично ассоциируется с резиномоторной моделью, которую построил в детстве; со случаем, когда чуть не попал в авиационную аварию; с неограниченным количеством спиртного, которое давали в трансконтинентальных рейсах в прошлом веке; с террористической атакой 11 сентября 2001 г. и т. п.

5. Также «единица памяти» может хранить важные дополнительные сведения, в том числе приводящие к пониманию процесса, эмоциональному к нему отношению, оценке его полезности, вредности, рисков и т. п.

Рис. 10. Единица ассоциативной памяти

Библиотека памяти обеспечивает идентификацию некоторого объекта, выявление близких аналогов или объектов-антагонистов на основе идентификации, возможность переноса на идентифицированный объект информации, связанной с найденными аналогами.

Каждая новая идентифицированная «единица памяти» может включаться в библиотеки сравнения, и таким образом можно постоянно доучивать PANN.

2.6. ФОРМИРОВАНИЕ НЕЙРОННОЙ СЕТИ

НА ОСНОВЕ НЕЙРОНОВ PROGRESS

Новые уникальные возможности при формировании нейронной сети.

В классических нейронных сетях первым шагом работы является формирование структуры сети из «пустых», необученных нейронов и формированию на синапсах случайного набора весов. И только после этого начинается обучение подготовленной сети.

В PANN совершенно другая ситуация: можно по отдельности учить любое количество нейронов; учить нейроны группами по пять, десять, сотням или тысячам нейронов или готовить целые библиотеки в формате BCF. А потом просто объединить все, что нужно, и таким образом получить единую сеть.

Существует множество разных схем и структур классических нейронных сетей, многие из них без труда можно воспроизвести с применением формального нейрона Progress. Рассмотрим сходства и различия классического персептрона с сетью PANN.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

1 2 3 45