способ и устройство интеллектуальной обработки информации в нейронной сети
Классы МПК: | G06G7/60 живых организмов, например их нервной системы |
Патентообладатель(и): | Осипов Василий Юрьевич (RU) |
Приоритеты: |
подача заявки:
2011-02-08 публикация патента:
27.03.2012 |
Изобретение относится к области моделирования функциональных аспектов человека. Техническим результатом является расширение функциональных возможностей по интеллектуальной обработке информации в нейронной сети. Сущность способа в том, что при обработке сигнала в рекуррентной многослойной сети с обратными связями, замыкающими контура с временем задержки единичных образов меньше времени невосприимчивости нейронов сети после их возбуждения, со сдвигами совокупностей единичных образов вдоль слоев, при передаче совокупностей единичных образов от слоя к слою их задерживают с учетом текущих состояний слоев. 2 н.п. ф-лы, 3 ил.
Формула изобретения
1. Способ интеллектуальной обработки информации в нейронной сети, заключающийся в подаче в многослойную рекуррентную сеть с обратными связями, замыкающими контура с временем задержки единичных образов меньше времени невосприимчивости нейронов сети после их возбуждения, сигнала, разложенного на составляющие в базисе, согласованном с входным слоем сети, с каждой составляющей, преобразованной в последовательность единичных образов с частотой повторения как предварительно заданной функцией от амплитуды составляющей, представлении сигнала в виде последовательных совокупностей единичных образов в соответствии с предварительно заданными правилами его распознавания с учетом обратных результатов распознавания, сдвигах совокупностей единичных образов вдоль слоев с учетом текущих состояний слоев, запоминании результатов распознавания на элементах сети, использовании в качестве результатов обработки последовательных совокупностей единичных образов на выходном слое сети после обратного преобразования в соответствующие им исходные сигналы, отличающийся тем, что при передаче совокупностей единичных образов от слоя к слою их задерживают с учетом текущих состояний слоев.
2. Устройство интеллектуальной обработки информации в нейронной сети, содержащее первый слой нейронов, первый вход которого является входом устройства, второй вход соединен с выходом второго блока динамических синапсов, выход - с входом первого блока задержек, второй слой нейронов, первый вход которого соединен с выходом первого блока динамических синапсов, выход - с входом второго блока задержек, блок управления, первый вход которого соединен с выходом первого слоя, являющимся выходом устройства, второй вход - с выходом второго слоя, первый выход - с вторым входом второго блока динамических синапсов, второй выход - с вторым входом первого блока динамических синапсов, первый вход первого блока динамических синапсов соединен с выходом первого блока задержек, первый вход второго блока динамических синапсов соединен с выходом второго блока задержек, отличающееся тем, что дополнительно введена связь третьего выхода блока управления с третьим входом первого слоя нейронов и связь четвертого выхода этого блока со вторым входом второго слоя нейронов.
Описание изобретения к патенту
Изобретение относится к бионике, моделированию функциональных аспектов человека.
В настоящее время известны многие способы и устройства интеллектуальной обработки информации в нейронной сети, применяемые для аппроксимации, классификации, распознавания образов, обработки речи, прогнозирования, идентификации, оценивания производственных процессов, ассоциативного управления и для решения других творческих задач (Хайкин С. Нейронные сети: полный курс, 2-е издание. Пер. с англ. М.: Издательский дом «Вильямс», 2006. - 1104 с.; Галушкин А.И. Теория нейронных сетей. Кн. 1: Учебное пособие для вузов / Общая ред. А.И.Галушкина. - М.: ИПРЖР, 2000. - 416 с.).
Однако всем им характерны узкие возможности по запоминанию структурно-сложных изменяющихся во времени сигналов, их распознаванию, ассоциированию с другими сигналами, извлечению из памяти сети и воспроизведению в исходной форме. Эти известные способы и устройства не позволяют при обработке информации решать широкий спектр задач одной и той же нейронной сетью. Они не обеспечивают возможностей наделения машин осознанным восприятием внешнего мира и осознанного активного взаимодействия с ним. В целом известным способам и устройствам свойственны узкие функциональные возможности по интеллектуальной обработке информации в нейронной сети.
Наиболее близким аналогом изобретения является способ интеллектуальной обработки информации в многослойной рекуррентной нейронной сети с обратными связями, замыкающими контура с временем задержки единичных образов меньше времени невосприимчивости нейронов сети после их возбуждения. Согласно этому способу сигнал подают в сеть после разложения на составляющие в базисе, согласованном с входным слоем сети, с каждой составляющей, преобразованной в последовательность единичных образов с частотой повторения как предварительно заданной функцией от амплитуды составляющей. Представляют сигнал в сети в виде последовательных совокупностей единичных образов в соответствии с предварительно заданными правилами его распознавания с учетом обратных результатов распознавания. При передаче совокупностей единичных образов от слоя к слою сдвигают их вдоль слоев с учетом текущих состояний слоев. Запоминают результаты распознавания на элементах сети. Используют в качестве результатов обработки последовательные совокупности единичных образов на выходном слое сети после обратного преобразования в соответствующие им исходные сигналы (Осипов В.Ю. Ассоциативная интеллектуальная машина / Информационные технологии и вычислительные системы. 2010, № 2, с.59-67).
Этому способу характерны следующие недостатки. Согласно ему все сигналы обрабатываются в сети в одном и том же масштабе времени. При такой обработке сжатый или растянутый во времени входной сигнал воспринимается сетью как новый относительно ранее воспринятого того же самого сигнала в неизмененном временном масштабе. Это существенно ограничивает возможности способа по распознаванию, например, быстрой и медленной речи, одних и тех же замедленных и ускоренных процессов. Отсутствие возможности замедлять или ускорять ассоциирование сигналов друг с другом в сети, изменять их временной масштаб и скорость продвижения в ней не позволяет переходить к модельному времени, отличающемуся от реального. Это существенно ограничивает функциональные возможности способа по интеллектуальной обработке информации.
Наиболее близким аналогом изобретения среди устройств выступает устройство, содержащее два слоя нейронов, два блока динамических синапсов, два блока задержек и блок управления. Первый вход первого слоя нейронов является входом устройства. Второй вход этого слоя соединен с выходом второго блока динамических синапсов, выход слоя - с входом первого блока задержек. Вход второго слоя нейронов соединен с выходом первого блока динамических синапсов, выход - с входом второго блока задержек. Первый вход блока управления соединен с выходом первого слоя, являющимся выходом устройства, второй вход этого блока - с выходом второго слоя, первый выход - с вторым входом второго блока динамических синапсов, второй выход - с вторым входом первого блока динамических синапсов. При этом первый вход первого блока динамических синапсов соединен с выходом первого блока задержек, а первый вход второго блока динамических синапсов соединен с выходом второго блока задержек (Осипов В.Ю. Ассоциативная интеллектуальная машина / Информационные технологии и вычислительные системы. 2010, № 2, с.59-67).
К недостаткам этого устройства относятся ограниченные возможности по распознаванию сигналов с различными уровнями временного сжатия и растяжения, прогнозированию и восстановлению событий.
Задачей изобретения является расширение функциональных возможностей по интеллектуальной обработке информации в нейронной сети.
Технический результат от использования изобретения заключается в улучшении распознавания и восстановления сигналов, в расширении возможностей по прогнозированию событий.
Поставленная задача решается тем, что в известном способе интеллектуальной обработки информации в нейронной сети, заключающемся в подаче в многослойную рекуррентную сеть с обратными связями, замыкающими контура с временем задержки единичных образов меньше времени невосприимчивости нейронов сети после их возбуждения, сигнала, разложенного на составляющие в базисе, согласованном с входным слоем сети, с каждой составляющей, преобразованной в последовательность единичных образов с частотой повторения как предварительно заданной функцией от амплитуды составляющей, представлении сигнала в виде последовательных совокупностей единичных образов в соответствии с предварительно заданными правилами его распознавания с учетом обратных результатов распознавания, сдвигах совокупностей единичных образов вдоль слоев с учетом текущих состояний слоев, запоминании результатов распознавания на элементах сети, использовании в качестве результатов обработки последовательных совокупностей единичных образов на выходном слое сети после обратного преобразования в соответствующие им исходные сигналы, согласно изобретению при передаче совокупностей единичных образов от слоя к слою их задерживают с учетом текущих состояний слоев.
Описанный способ реализуется устройством интеллектуальной обработки информации в нейронной сети, содержащим первый слой нейронов, первый вход которого является входом устройства, второй вход соединен с выходом второго блока динамических синапсов, выход - с входом первого блока задержек, второй слой нейронов, первый вход которого соединен с выходом первого блока динамических синапсов, выход - с входом второго блока задержек, блок управления, первый вход которого соединен с выходом первого слоя, являющимся выходом устройства, второй вход - с выходом второго слоя, первый выход - с вторым входом второго блока динамических синапсов, второй выход - с вторым входом первого блока динамических синапсов, первый вход первого блока динамических синапсов соединен с выходом первого блока задержек, первый вход второго блока динамических синапсов соединен с выходом второго блока задержек, согласно изобретению, в которое дополнительно вводят связь третьего выхода блока управления с третьим входом первого слоя нейронов и связь четвертого выхода этого блока со вторым входом второго слоя нейронов.
Для расширения функциональных возможностей по интеллектуальной обработке информации в нейронной сети автор изобретения предлагает при передаче совокупностей единичных образов от слоя к слою их задерживать с учетом текущих состояний слоев, что является новым существенным признаком изобретения.
Новым существенным признаком изобретения в части устройства выступает дополнительное введение связи третьего выхода блока управления с третьим входом первого слоя нейронов и связи четвертого выхода этого блока со вторым входом второго слоя нейронов.
Сущность изобретения поясняется фиг.1-3.
На фиг.1 приведена структурная схема устройства интеллектуальной обработки информации в двухслойной нейронной сети, реализующего предложенный способ, где 1, 5 - первый, второй слои нейронов; 2, 6 - первый, второй блоки задержек; 3, 4 - первый, второй блоки динамических синапсов; 7 - блок управления.
На фиг.2 представлена схема, поясняющая особенности управления временными задержками совокупностей единичных образов в предложенном устройстве (фиг.1), где 1.1÷1.n, 5.1÷5.n - нейроны, соответственно, первого и второго слоя; 2.1÷2.n, 6.1÷6.n - элементы задержек, соответственно, первого и второго блоков задержек; 3.1÷3.m, 4.1÷4.m - динамические синапсы, соответственно, первого и второго блоков динамических синапсов; 7 - блок управления.
На фиг.3,а, б, в представлены примеры линейной схемы продвижения совокупностей единичных образов вдоль слоев в двухслойной рекуррентной сети, поясняющие возможности изменения скорости прохождения сигналов по сети, их временного сжатия и растяжения, где 1.1÷1.10 и 2.1÷2.10 - логические поля, на которые разбиваются, соответственно, первый и второй слои сети за счет сдвигов совокупностей единичных образов вдоль них.
Способ осуществляется следующим образом.
Рассмотрим его на примере предложенного устройства интеллектуальной обработки информации в нейронной сети, структурная схема которого представлена на фиг.1.
Входной сигнал, разложенный на составляющие в базисе, согласованном с первым слоем 1 сети, при этом каждая его составляющая преобразована в последовательность единичных образов с частотой повторения как предварительно заданной функцией от амплитуды составляющей, подают на этот слой. За каждым номером последовательности закрепляется в общем случае частотная и пространственная составляющая, соответствующая исходному сигналу. Детали такого преобразования известны (Осипов В.Ю. Прямое и обратное преобразование сигналов в ассоциативных интеллектуальных машинах / Мехатроника, автоматизация, управление. 2010, № 7, с.27-32).
После подачи на первый вход первого слоя нейронов такого сигнала на его выходе имеют место последовательные совокупности единичных образов, несущие всю информацию о входном сигнале. Информация о фазе передается через относительные задержки единичных образов. Длительности единичных образов, составляющие одну совокупность на выходе слоя, всегда одинаковы. Однако значение этих длительностей зависит от управляющих воздействий со стороны блока управления 7.
После задержки в первом блоке задержек 2 последовательные совокупности единичных образов поступают на первый блок динамических синапсов 3. Все единичные образы, принадлежащие одной и той же совокупности, задерживаются на элементах блока задержек 2 (фиг.2) на одинаковое время. Время задержки каждой совокупности в блоке задержек 2 зависит только от длительности единичных образов в совокупности, поступающей на этот блок. При этом во всех случаях на выходе блока задержек 2 все задержанные совокупности состоят из единичных образов одинаковой длительности.
Каждый единичный образ из текущей совокупности подается одновременно в первом блоке динамических синапсов 3 на совокупность своих динамических синапсов, обеспечивающих связь каждого нейрона, породившего единичный образ в общем случае, со всеми нейронами второго слоя нейронов 5 (фиг.2).
Амплитуда единичного образа на выходе каждого синапса равна амплитуде входного единичного образа, умноженной на вес wij(t) синапса. Веса wij(t) синапсов определяются через произведение их весовых коэффициентов k ij(t) и функций ослабления (rij(t)),
Весовые коэффициенты, kij(t), изменяются в зависимости от воздействий на синапсы единичных образов и выступают в качестве элементов долговременной памяти сети. При прохождении единичных образов через синапсы они снимают с них информацию о предыдущих воздействиях и оставляют информацию о своем появлении через изменения весовых коэффициентов. Для каждого динамического синапса, связывающего i-й нейрон с j-м нейроном, весовой коэффициент kij(t) на момент времени t поступления на синапс очередного единичного образа может определяться согласно правилам:
где gij(t) - число запомненных синапсом единичных образов на момент t; bt+1(x i(t), yj(t), yj(t+1)) - эффект от единичного взаимодействия нейронов на t+1 момент времени; x i(t), yj(t) - состояния, соответственно, i-го и с j-го нейронов на момент t; yj(t+1) - состояние j-го нейрона на t+1; - положительный коэффициент. В частном случае =0,5.
В случае если активизированный i-й нейрон возбуждает j-й нейрон, то bt+1(xi (t), yj(t), yj(t+1))=1. Когда i-й нейрон не может активизировать j-й нейрон из-за нахождения его уже в невосприимчивом состоянии, bt+1(xi(t), yj(t), yj(t+1))=-1. При условии что j-й нейрон возбуждается за счет других нейронов сети, i-й нейрон в этом процессе не участвует, bt+1(xi(t), yj(t), yj(t+1))=- . Величина может принимать значения, например, от 0,2 до 0,5. Во всех других случаях bt+1(xi(t), yj (t), yj(t+1))=0.
Функции (rij(t)) ослабления единичных образов в (1) зависят от rij(t) - условной удаленности связываемых через синапсы нейронов (условных расстояний между ними) на текущий момент времени.
Для расчета (rij(t)) применима формула:
где h - степень корня. Чем она выше, тем шире ассоциативное взаимодействие в сети;
- положительный постоянный коэффициент. Например, при h=2 величина может быть равной 9,0.
Определение r ij(t) для каждого динамического синапса при отсутствии управления со стороны блока управления, полагая, что расстояние между слоями пренебрежимо мало, сводится к расчету расстояния между нейронами в плоскости X, Y слоев через проекции yij, xij.
Значения yij, xij для синапсов, при отсутствии управления ими, можно рассчитать в единицах нейронов через порядковые номера связываемых нейронов во взаимодействующих слоях при заданных длинах их строк и столбцов.
Управление такими синапсами с блока управления 7 для смещения совокупностей единичных образов вдоль слоев осуществляется путем изменения соответствующих условных расстояний rij(t) между нейронами первого и второго слоев. Так, путем одновременного изменения, например, xij(t) для всех синапсов второго слоя на некоторую величину d реализуется сдвиг текущей совокупности единичных образов вдоль этого слоя, что эквивалентно сдвигу второго слоя относительно первого слоя. При сдвигах за пределы слоя по координате Х возможны сдвиги на начало слоя со смещением, например, вниз по координате Y на заданную величину.
Для принятия решения в блоке управления о сдвиге очередной совокупности единичных образов в нем сначала анализируются состояния первого и второго слоя. В случае когда на выходе первого слоя имеет место совокупность единичных образов, которую нельзя передать на второй слой по коротким связям (синапсам с минимальными функциями (rij(0)) ослабления единичных образов) из-за нахождения соответствующих нейронов второго слоя в состояниях невосприимчивости, осуществляют сдвиг этой совокупности. В случае когда нет препятствий для передачи совокупности единичных образов по коротким связям, сдвиг ее не осуществляют.
В общем случае смещенные совокупности единичных образов с выхода первого блока динамических синапсов 3 поступают на первый вход второго слоя нейронов 5.
Заметим, что все единичные образы, поступившие на один и тот же нейрон по различным синапсам, суммируются. При превышении этой суммы заданного порога возбуждения нейрона он возбуждается и на его выходе формируется единичный образ, длительность которого зависит от управляющего воздействия со стороны блока управления 7. Затем имеющаяся сумма обнуляется, а сам нейрон затем переходит в состояние невосприимчивости входных сигналов. В нем он находится некоторое время, значение которого также зависит от управляющего воздействия на нейрон со стороны блока управления 7. Это время всегда должно быть больше, чем время задержки единичных образов в блоках 1, 2, 3, 5, 6, 4, входящих в двухслойный многопучковый контур нейронной сети. Это условие легко обеспечивать, так как для нейронов с увеличением длительности формируемых единичных образов возрастает также время их невосприимчивости после возбуждения.
Последовательные совокупности единичных образов с выхода второго слоя 5, после задержки в блоке 6, поступают на второй блок динамических синапсов 4. В этих блоках они аналогичным образом, как и в блоках 1, 2, 3, обрабатываются и, сдвинутые вдоль первого слоя в зависимости от состояний первого и второго слоев, поступают на второй вход первого слоя нейронов 1.
С учетом этого поступающие на первый слой нейронов 1 прямые и обратные совокупности единичных образов в нем корректно связываются, распознаются и порождают на его выходе новые совокупности единичных образов, несущие в себе информацию как о текущих, так и ранее запомненных сетью сигналах, связанных с первыми. При этом за счет соответствующих сдвигов совокупностей единичных образов вдоль слоев исключается наложение обратных результатов распознавания на прямые совокупности.
Согласно правилам (1)-(4) между входом и выходом устройства, реализующего предлагаемый способ интеллектуальной обработки информации в нейронной сети, легко устанавливается однозначное соответствие между составляющими входных и выходных сигналов. Заметим, что в качестве выхода также можно успешно использовать выход второго слоя.
С учетом этого соответствия по номерам нейронов, формирующих последовательности единичных образов на выходе устройства, определяют частотные и пространственные характеристики составляющих исходного сигнала. По частотам следования и относительным задержкам единичных образов, соответственно, устанавливают амплитуды и фазы составляющих исходного сигнала. Затем воспроизводят составляющие исходных сигналов и путем их сложения восстанавливают исходные, например речевые, зрительные и другие, сигналы. Для определения амплитуд составляющих исходного сигнала определяют текущее число единичных образов, попадающих в предварительно заданный интервал времени. Для воспроизведения составляющих исходных сигналов применим, например, их цифровой синтез по известным параметрам.
За счет реализуемых пространственных сдвигов совокупностей единичных образов в нейронной сети ее слои логически разбиваются на поля с размерами этих сдвигов. На фиг.3,а, б, в представлены примеры линейной схемы продвижения совокупностей единичных образов вдоль слоев при сдвигах совокупностей только по одной координате на заданную величину. В рассматриваемых примерах каждый слой сети за счет сдвигов разбивается на 10 одинаковых полей. Согласно фиг.3,а, б, в последовательные совокупности единичных образов подают на первое поле первого слоя сети. При прохождении по сети они из последовательных совокупностей преобразуются в параллельные, которые продвигаются вдоль слоев. Результаты обработки снимаются с последнего поля первого или второго слоя. В соответствии с фиг.3,а сдвиг совокупностей единичных образов осуществляется только при передаче их со второго слоя на первый. На фиг.3,б приведено одно из состояний первого слоя при вводе в сеть последовательно через равные промежутки времени совокупностей единичных образов «С», «Е», «Т», «Ь». На фиг.3,в отражено состояние первого слоя сети при вводе в нее этой же последовательности совокупностей единичных образов, но растянутой во времени. Стрелками показано направление продвижения совокупностей вдоль слоев сети.
Преобразование последовательных совокупностей в параллельные обеспечивает возможность широких ассоциаций между разнесенными во времени сигналами. От задержек совокупностей при передаче от слоя к слою зависят скорость их продвижения вдоль слоев и формируемые в плоскостях слоев сети пространственные структуры из отдельных совокупностей. Заметим, что изменение задержек совокупностей единичных образов предусматривает одинаковое изменение параметров нейронов для каждого поля слоев сети.
Для одного и того же сигнала с различным уровнем сжатия или растяжения во времени, поступающего в сеть, будут характерны свои пространственные структуры в сети (фиг.3,б, в). Возможности нейронной сети по распознаванию сигналов и вызову связанной информации из сети тем выше, чем больше степень совпадения ранее запомненных и обрабатываемых таких пространственных структур. Если нейронная сеть обучалась на одних сигналах, а ей необходимо распознать и восстановить те же самые сигналы, но сжатые или растянутые во времени, возникают трудности, так как существенно не совпадают их пространственные структуры в плоскостях слоев сети и, соответственно, схемы ассоциативных связей.
Для того чтобы в наибольшей мере обеспечить такое совпадение, а также наделить сеть возможностью опережающего и отстающего во времени вызова сигналов из ее памяти, управления скоростью процессов на ее выходе, согласно изобретению предлагается при передаче совокупностей единичных образов от слоя к слою их задерживать с учетом текущих состояний слоев. Увеличение или уменьшение задержек совокупностей единичных образов позволяет изменять пространственную структуру сигналов в плоскостях слоев сети и настраивать сеть на наилучшее распознавание. Наилучшему распознаванию свойственно наибольшее число ассоциативно вызываемых из памяти сети недостающих единичных образов и наибольшее число стираемых ошибочных образов. В частном случае можно использовать только критерий наибольшего числа ассоциативно вызываемых из памяти единичных образов. Определение их числа осуществимо путем текущего сравнения состояний полей первого и второго слоев сети. Так, сравнивая передаваемые с первого слоя на второй совокупности с совокупностями, которые они порождают на выходе второго слоя, можно определить как число новых вызванных единичных образов, так и число подавленных ошибочных образов. Изменяя периодически вправо и влево на незначительную величину все задержки совокупностей единичных образов и оценивая прирост принятого показателя в блоке управления 7, можно сначала определить направление изменения задержек для наилучшего распознавания сигналов, а затем установить значения задержек, обеспечивающих максимум принятого показателя. Например, если своевременно увеличить задержки в сети (фиг.3,а), то растянутую во времени последовательность совокупностей «С», «Е», «Т», «Ь», поступающую в нее, можно привести в сети к виду на фиг.3,б вместо вида на фиг.3,в. За счет этого достигается согласование масштаба времени обрабатываемых сигналов с масштабом времени сигналов, на которых обучалась сеть, и улучшается распознавание первых. Заметим, что изменение задержек по отношению к сигналам, уже находящимся в сети, приводит к их временному сжатию или растяжению. Ускоряются или замедляются процессы в сети и на ее выходе. В случае ускорения процессов из памяти сети вызываются также сжатые сигналы, отражающие события, опережающие реальное время. Иначе говоря, сеть начинает прогнозировать события. При замедлении процессов вызываются растянутые сигналы с опозданием. Замедление процессов дает возможность расширить число одновременно обрабатываемых сигналов в сети и улучшить за счет этого их запоминание и восстановление. Во всех случаях блок управления 7 (фиг.1) вырабатывает команды для первого и второго слоев нейронов исходя из достижения максимума принятого показателя эффективности ассоциативного вызова единичных образов из памяти сети.
Таким образом, задержка совокупностей единичных образов с учетом текущих состояний слоев позволяет существенно расширить функциональные возможности по интеллектуальной обработке информации в нейронной сети, наделить сеть новыми свойствами.
Способ и устройство интеллектуальной обработки информации в нейронной сети могут быть реализованы с использованием известной элементной базы. В качестве нейронов слоев применимы ждущие мультивибраторы с перестраиваемыми или переключаемыми емкостями или резисторами. В качестве элементов задержек в блоках задержек могут использоваться не перестраиваемые ждущие мультивибраторы, запускающиеся не по переднему, а по заднему фронту входного импульса.
Блоки динамических синапсов и блок управления могут быть реализованы специализированными процессорами, программируемыми интегральными схемами, функционирующими в соответствии с рассмотренными выше правилами.
Результаты математического моделирования работы этого устройства, реализующего предлагаемый способ, в среде MatLab, при числе нейронов в каждом слое, равном 900, полностью подтвердили описанные выше возможности, которые существенно шире возможностей известных технических решений по интеллектуальной обработке информации в нейронной сети.
Класс G06G7/60 живых организмов, например их нервной системы