способ идентификации сигнала случайного процесса и устройство для его осуществления
Классы МПК: | H03M1/48 преобразователи со следящей системой G04F10/04 с использованием счетных импульсов или полупериодов переменного тока G01R13/02 для представления измеряемых электрических переменных величин в цифровом виде |
Автор(ы): | Капля Э.И. |
Патентообладатель(и): | Научно-исследовательский институт измерительных систем |
Приоритеты: |
подача заявки:
1995-08-29 публикация патента:
27.11.1997 |
Изобретение относится к области измерительной техники в частности, к анализу и синтезу речевых сигналов и может быть использовано в автоматике, вычислительной технике и кодовых системах, например, замках, управлении бытовой техникой и цветовой визуализации музыкальных речевых произведений. Технический результат - уменьшение объема вычислений для анализа по методу линейного предсказания или для оценивания фармантных частот при верификации в реальном масштабе времени, ограничиваемых только измерением основного тона и энергии. Устройство содержит микрофон 1, программируемый усилитель 2, блок 3 выделения, изменения знака первой производной на основе аналого-цифрового преобразования (АЦП), формирователь 4 импульсов управления, блок образов, блок 6 оперативной памяти, преобразователь 7 время - цифра, блок 8 принятия решения, блок 9 отображения, генератор 10 импульсов сетки эталонной частоты, формирователь 11 импульсов по фронту и спаду сигнала. 2 с.п.ф-лы, 2 ил.
Рисунок 1, Рисунок 2
Формула изобретения
1. Способ идентификации сигнала случайного процесса, заключающийся в совокупности операций: запоминают образы, принимают решение об опознании или отклонении абонента, отличающийся тем, что дополнительно задают допустимое количество отклонений от запомненного образа, задают координаты образов в виде амплитудно-временных величин, преобразуют сигнал, для чего выделяют момент изменения знака первой производной в сигнале сообщения и регистрируют координаты амплитудно-временных значений сигнала в данный момент, сравнивают результаты регистрации с запомненными образами, визуально отображают принятое решение по результатам сравнения с учетом заданного количества отклонений. 2. Устройство идентификации сигнала случайного процесса, содержащее микрофон, блок образов, блок принятия решений, отличающееся тем, что введены программируемый усилитель, блок выделения изменения знака первой производной на основе аналого-цифрового преобразователя, формирователь импульсов управления, блок оперативной памяти, преобразователь время цифра, блок отображения, формирователь импульсов по фронту и спаду сигнала, вход программирования, генератор импульсов сетки эталонной частоты, при этом микрофон через последовательно соединенные программируемый усилитель, блок выделения изменений знака первой производной на основе аналого-цифрового преобразователя, первый вход блока оперативной памяти, первый вход блока принятия решений связан с блоком отображения, причем второй выход "Знак" блока выделения изменения знака первой производной на основе аналого-цифрового преобразователя подключен к первому входу формирователя импульсов управления и формирователю импульсов по фронту и спаду сигнала, а третий выход к второму входу программируемого усилителя, к третьему входу которого и первому входу преобразователя время цифра подключен первый выход формирователя импульсов управления, кроме того, второй вход блока оперативной памяти соединен с формирователем импульсов по фронту и спаду сигнала через второй вход преобразователя время цифра, третий вход которого связан с генератором импульсов эталонной частоты, при этом второй выход формирователя импульсов управления подключен к третьему входу блока оперативной памяти и через блок образов к второму входу блока принятия решений, третий вход которого подключен к третьему выходу формирователя импульсов управления, второй выход которого к второму входу формирователя импульсов управления, а третий вход связан с входом программирования.Описание изобретения к патенту
Изобретение относится к измерительной технике, в частности к анализу и синтезу речевых сигналов, и может быть использовано в автоматике, вычислительной технике и кодовых системах, например, замках, управлении бытовой техникой и цветовой визуализации музыкальных/речевых произведений. Известны способ и устройство возбуждения синтезатора формантных частот в использовании многочисленных поддающихся идентификации звуков речи-фонем (Кейтер Дж. Компьютеры-синтезаторы речи. М. Мир, 1985), в котором, образуя последовательность фонем, фонемный синтезатор копирует речь, т.е. используется математическое представление для восстановления речи в частотной области. Недостаток способа и устройства в том, что техническое решение в частотной области содержит элементы, не реализуемые в микроэлектронном исполнении, следовательно, имеет существенный физический объем при наличии регулировочных операций, а также сложность алгоритма получения формантных частот. Прототипом способа обработки сигнала случайного процесса является способ обработки речевого сигнала в системе верификации диктора (Рабинер Л.Р. Шафер Р.В. Цифровая обработка речевых сигналов. М.Радио и связь, 1981, с.445, рис. 9.12), заключающийся в ФОРМИРОВАНИИ последовательности отсчетов, ВЫДЕЛЕНИИ конечных точек, ФИЛЬТРАЦИИ низких частот, ДЕТЕКТИРОВАНИИ основного тона, ИЗМЕРЕНИИ энергии, анализе на основе линейного предсказателя, формантном АНАЛИЗЕ, ХРАНЕНИИ (запоминании) образов, динамическом ИСКАЖЕНИИ времени по отношению к зарегистрированному образу, ВЫЧИСЛЕНИИ метрики. Прототипом устройства идентификации сигнала случайного процесса является цифровая система верификации диктора (то же, с.444, рис.9.11), содержащая микрофон, блок эталонного образа, блок произнесенной фразы, блок запроса, блок запроса, блок сравнения, блок принятия решения, блок верифицируемого абонента с совокупностью связей. Недостаток способа и устройства большой объем вычислений для анализа по методу линейного предсказания или для оценивания формантных частот при верификации в реальном масштабе времени, ограничиваемых только измерением основного тона и энергии. Техническим результатом изобретения является упрощение алгоритма операции выделяют за счет построения операции анализируют во временной области. Технический результат достигается тем, что в способ идентификации сигнала случайного процесса, как вариант способ идентификации сигнала речевого сигнала, заключающегося в совокупности операций ЗАПОМИНАЮТ образы, ПРИНИМАЮТ решение об опознании или отклонении абонента дополнительно ЗАДАЮТ допустимое количество отклонений от запомненного образа, ЗАДАЮТ координаты образов в виде амплитудно-временных величин, ПРЕОБРАЗУЮТ сигнал, для чего ВЫДЕЛЯЮТ момент изменения знака первой производной в сигнале сообщения и РЕГИСТРИРУЮТ координаты амплитудно-временных значений сигнала в данный момент, СРАВНИВАЮТ результаты регистрации с запомненными образами, визуально ОТОБРАЖАЮТ принятое решение по результатам сравнения с учетом заданного количества отклонений. Технический результат достигается тем, что в устройство идентификации сигнала случайного процесса, содержащее микрофон, блок образов, блок принятия решений, ВВЕДЕНЫ программируемый усилитель, блок выделения изменения знака первой производной на основе аналого-цифрового преобразователя (АЦП), формирователь импульсов управления, блок оперативной памяти, преобразователь время-цифра (ПВЦ), блок отображения, формирователь импульсов по фронту и спаду сигнала, вход программирования, генератор импульсов сетки эталонной частоты, при этом микрофон через последовательно соединенные программируемый усилитель, блок выделения изменения знака первой производной на основе аналого-цифрового преобразователя, первый вход блока оперативной памяти, первый вход блока принятия решений связан с блоком отображения, причем второй выход "знак" блока выделения изменения знака первой производной на основе аналого-цифрового преобразователя подключен к первому входу формирователя импульсов управления и формирователю импульсов по фронту и спаду сигнала, а третий выход к второму входу программируемого усилителя, к третьему входу которого и первому входу преобразователя время-цифра (ПВЦ) подключен первый выход формирователя импульсов управления. Кроме того, второй вход блока оперативной памяти соединен с формирователем импульсов по фронту и спаду сигнала через второй вход преобразователя время-цифра (ПВЦ), третий вход которого связан с генератором импульсов эталонной частоты, при этом второй выход формирователя импульсов управления подключен к третьему входу блока оперативной памяти и через блок образов к второму входу блока принятия решений, третий вход которого подключен к третьему выходу формирователя импульсов управления, второй выход которого к второму входу формирователя импульсов управления, а третий вход связан с входом программирования. Введение операции ЗАДАЮТ допустимое количество отклонений от запомненного образа как критерий оценки потерь необходимо для снижения вероятности ошибочной идентификации как из-за отдельных изменений во входном сигнале, так и из-за инструментальных ошибок, кроме того, операция достаточна для выявления факта подделки сигнала или принятия требуемого решения по результатам соответствия общим критериям данного сигнала, что исключает необходимость принятия неординарных мер. Например, при произнесении кодового слова голос идентифицируемой личности в данный момент по каким-либо причинам "хрипит", что идентифицируется как подделка. По факту оценки точности кодового слова личность имеет право выполнить иные действия для достижения поставленной цели. В случае невыполнения указанных действий принимается РЕШЕНИЕ о подделке с соответствующей визуализацией. В частности, в опытах закладывалось требование ввода в определенные временные интервалы заданной последовательности звуков, что исключало механическое вмешательство в замок. Введение операции ЗАДАЮТ координаты образов в виде амплитудно-временных необходимо для цифровой идентификации характерных признаков и очередности их следования и достаточно для учета отличий из-за индивидуальных инструментальных отклонений в виде величин МИНИМУМ-МАКСИМУМ. Введение операции ПРЕОБРАЗУЮТ сигнал на основе следящего аналого-цифрового преобразования необходимо для определения текущего значения входного сигнала и характера его изменения и достаточно, в частности, для определения момента изменения знака первой производной сигнала. Наибольшей ценностью в данном случае по Больцману и Хартли обладает именно момент изменения знака первой производной, факт выделения которого упрощает совокупность последующих операций. Критерием определения изменения знака первой производной может быть выбрано изменение очередности формирования уровней БОЛЬШЕ-МЕНЬШЕ по определенному закону, например, повторение одного уровня БОЛЬШЕ-МЕНЬШЕ-МЕНЬШЕ с последующим МЕНЬШЕ-БОЛЬШЕ. Введение операции ВЫДЕЛЯЮТ момент изменения знака первой производной в сигнале сообщения необходимо для построения команды об отсчете текущего значения (амплитуда, время) сигнала как наиболее ценной информации в сигнале и достаточно для исключения избыточности результатов. Можно показать, что низшие моменты имеют более важное значение чем высшие. В большинстве практических случаев плотность вероятности P(x) имеет наиболее существенное значение в интервале, расположенном около математического ожидания m, причем длина этого интервала имеет порядок @ Y @. Если в этом интервале функция j(x) достаточно гладкая, то ее с необходимой степенью точности можно представить рядом Тейлора в окрестности точки mj(x)=j(m0)+j"(m0)(x-m0)+1/2j"(m0)(x-m0)2 +(1/n)!j(n) (m0)(x-mn)+. Подставив это разложение в выражение момента
и с учетом определения центральных моментов
получим M{j(x)}mj"(m0)+1/2j"(m0)D +.(1/n)!(m0)D. Если функция j(x) изменяется в указанном интервале достаточно медленно, то в разложении можно ограничиться учетом лишь первых двух членов. При этом
M{j(x)}m0=j"(m0)+0,5j"(m0)D. Отсюда видно, что матожидание достаточно плавной функции от случайной величины приближенно определяется матожиданием и дисперсией, роль высших моментов убывает с увеличением их порядка. Кроме того, данная операция необходима и достаточна для получения нового положительного качества адаптивности. Алгоритм преобразования при контроле случайных сигналов дееспособен в широком диапазоне частот и независимо от частоты входного сигнала обеспечивает регистрацию координат 2-3 точек, что в соответствии с теоремами Шеннона/Котельникова необходимо и достаточно для восстановления сигнала. Следует отметить, новое качество позволяет реализовать увеличение коэффициента сжатия полосы частот
. где К коэффициент сжатия по числу отсчетов;
n объем информационной части слова несжатых данных;
mин-объем информационной части слова сжатых данных;
mcл -объем служебной информации, приходящей на один существенный отсчет. В среднем величина коэффициента сжатия по числу отсчетов лежит в пределах 5 100 раз, снижаются непроизводительные затраты для последующей обработки полученной при этом информации. Введение информации РЕГИСТРИРУЮТ необходимо для сохранения текущих данных входного сигнала на время выполнения последующих операций и достаточно для согласования скорости изменения входного сигнала с пропускной способностью применяемой системы. Введение операции СРАВНИВАЮТ необходимо для оценки текущих характерных данных по хранящимся образам/критериям и достаточно для выполнения совокупностью простейших операций при формировании выходного результата. Процесс выполнения операции состоит из двух частей: одна из которых идентифицирует принадлежность к образу по общим признакам; вторая по индивидуальным, присущим данному процессу, например, идентификация речи человека для буквенного представления с последующей визуализацией на бумаге/мониторе или идентификация речи конкретного субъекта. Следовательно, идентификация выполняется по двум критериям: общее и частное. Введение операции визуально ОТОБРАЖАЮТ необходимо как заключительное действие способа и достаточно для применения в используемых системах. Например, для включения исполнительного механизма в кодовом замке, как результат сравнения произнесенных звуков с заданными кодами, хранящимися в памяти. На фиг.1 представлены временные диаграммы, поясняющие алгоритм способа; на фиг.2 вариант структуры схемы устройства идентификации сигнала случайного процесса. Устройство (фиг.2) как вариант преобразования и опознания заданной последовательности речевого сигнала содержит микрофон 1, программируемый усилитель 2, блок выделения момента изменения знака первой производной du/dt входного сигнала (патент РФ N 2024194), формирователь 4 импульсов управления, блок образов 5, блок оперативной памяти (БОП) 6, преобразователь время-цифра (ПВЦ) 7 на основе решения, блок 8 принятия решения, блок 9 отображения, генератор 10 сетки частот, формирователь 11 импульсов по фронту и спаду сигнала (патент РФ N 1409099), вход программирования 12. Микрофон 1 через последовательное соединение программируемого усилителя 2, блока 3 выделения, первый вход блока 6 оперативной памяти, первый вход блока 8 принятия решений связан с блоком 9 визуализации. Второй выход "знак" блока 3 выделения изменения знака подключен к первому входу формирователя 4 импульсов управления и формирователю 11 импульсов по фронту и спаду сигнала, а третий выход к второму входу программируемого усилителя 2, к третьему входу которого и первому входу преобразователя 7 время-цифра (ПВЦ) подключен первый выход формирователя 4 импульсов управления. Кроме того, второй вход блока 6 соединен с формирователем 11 импульсов по фронту и спаду сигнала через второй вход преобразователя 7 время-цифра (ПВЦ), третий вход которого связан с генератором 10 импульсов эталонной частоты, при этом второй выход формирователя 4 импульсов управления подключен к третьему входу блока 6 и через блок образов 5 к второму входу блока 8 принятия решений, третий вход которого подключен к третьему выходу формирователя 4 импульсов управления, второй выход которого к второму входу формирователя 4 импульсов управления, а третий вход связан с входом 12 программирования. Способ идентификации сигнала (для примера речевого) осуществляется следующим образом. В исходном состоянии и в процессе создания звуковые образы каждой буквы ЗАПОМИНАЮТСЯ блоком образов в виде последовательности локальных экстремумов, т. е. sgn(du/dt) c координатами (u1, t1). Причем каждое значение последующей временной координаты отсчитывается от предыдущего значения. Таким образом, в исходном состоянии операция ЗАПОМИНАЮТ образов-идентификаторов обеспечивает постоянное хранение в виде цифрового двоичного кода всех последовательностей личности, по которой предполагается ее опознание. С учетом возможного разброса значений характерных информационных точек, обусловленного особенностями гортанного канала воспроизведения, а также погрешностью преобразования, каждая из них задается в двухуровневом виде: БОЛЬШЕ-МЕНЬШЕ. В исходном состоянии осуществляют следящее аналого-цифровое ПРЕОБРАЗОВАНИЕ входного потенциала с идентификацией факта наличия постоянной составляющей сигнала фиг.1а(t0) du/dt=0 до момента времени t=0. По результатам преобразования входного сигнала ВЫДЕЛЯЮТ момент изменения знака первой производной sgn(du/dt) в сигнале речевого сообщения фиг.1b(t1). Сформированным сигналом в соответствующий момент t1 фиг.1b РЕГИСТРИРУЮТ координаты (амплитуда, время относительно предыдущего момента) экстремальных значений сигнала в данный момент времени. Далее СРАВНИВАЮТ полученные значения с хранящейся информацией заданных образов, а затем ПРИНИМАЮТ решение о соответствии входной информации заданному образу. Операция ПРИНИМАЮТ решение является следствием поступления сигнала в момент изменения знака первой производной или в момент превышения текущим значением t1 заданного значения. Каждая буква может быть представлена своим образом в виде последовательности ключевых локальных экстремумов, внутри которых располагаются экстремумы, характеризующие каждый субъект. Последнее, в качестве примера, представлено на фиг.1а, б следующим образом: моменты t0,t1,t4 -присущи данной букве; моменты t2, t3 конкретному лицу. Решение принимается: совпадение импульса локального экстремума и факта соответствия его временного смещения относительно предыдущего диапазону соответствующего временного интервала ЗАПОМНЕННОГО образа, соответствие и переход к следующему значению, - превышение импульсом локального экстремума его временного смещения относительно предыдущего диапазона соответствующего временного интервала образа, заданному на ХРАНЕНИЕ, ошибка: переход к следующему значению, при повторении стоп и визуализация несоответствия, превышение диапазоном соответствующего временного интервала образа, заданному на хранение, временного смещения импульса локального экстремума относительно предыдущего; продолжение работы до выполнения предыдущих критериев, повторение ошибок - несоответствие и возврат в исходное состояние с предложением повторить. Сформированное решение визуально ОТОБРАЖАЮТ о соответствии/ошибке входного образа хранящемуся. При положительном (совпадении) решении ПРИНИМАЮТ решение о переходе к следующему значению данного образа. Операция визуально ОТОБРАЖАЮТ заключается в представлении в заданном виде (звуковой, световой, речевой или механическом исполнении,) принятого решения о соответствии/ошибке речевого сигнала с учетом заданного критерия по виду и количеству отклонений. Например, уровень значения сигнала зависит от интенсивности голоса субъекта в данный момент, что без дополнительных мер нормализации по уровню, проблематично вводить "жесткий" критерий идентификации по уровню. Наиболее "стабильным" параметром в звуковом сигнале, идентифицирующим букву, является временной интервал между локальными экстремумами. Для снижения вероятности ошибки целесообразно вводить двойной критерий привязки экстремумов: относительно предыдущего и относительно начального. Последнее позволяет вводить коррекцию начала преобразования временного интервала относительно предыдущего. Рассмотрим работу варианта устройства опознания речевого сигнала (фиг. 2). В исходном состоянии усилитель 2 установлен в режим максимального усиления для нижесреднего по мощности голоса, что задается потенциалом блока 4 формирователя импульсов управления. Последнее определяется заданным алгоритмом в блоке 3 АЦП и отсутствием входного сигнала с микрофона 1. Алгоритмом предусматривается установка максимального коэффициента усиления после подачи напряжения. Уменьшение на N дБ коэффициента усиления в усилителе 2 осуществляется блоком 3 по факту превышения уровнем входного сигнала допустимого диапазона преобразования, например, в n раз. Алгоритм адаптации и выборки определяется блоком 4 в соответствии программой по шине 12. В частности, критерием может быть каждый идентифицируемый образ или длительность символа, что определяется сигналом по выходу "знак" блока 3. Реализация алгоритма каждого образа осуществляется выборкой формирователя 4 определенной области блока 5 при помощи счетчика импульсов с блока 8. Поступающий сигнал с микрофона 1 после усиления блоком 2 поступает на блок выделения 3, обеспечивающий:
формирование на выходе "знак" импульсного сигнала фиг.16 в момент изменения знака первой производной входного напряжения фиг.1а;
формирование на выходе "вых" цифрового кода адекватного уровню входного сигнала в момент формирования сигнала на выходе "знак". Импульс, сформированный в момент времени t0, через блок 4 поступает на ПВЦ 7, идентифицируя команду начала счета. Последующие импульсы в моменты времени t1 tn через формирователь 11 импульсов по фронту и спаду осуществляют запись в БОП 6 текущего значения двоичного кода, адекватного разновременности относительно предыдущего отсчета. Промежуточное запоминание необходимо для опознания путем сравнения с заданным кодом в блок 5. Опознание осуществляется по значениям координат: амплитуда и время. Приоритетным критерием является разновременность между соседними, так как уровень амплитуды зависит от интенсивности звукового воздействия. Критерий - уровень сигнала целесообразно использовать при высокой идентификации речевого сигнала при введении двухуровневого сравнения (больше/меньше) в блок 8. В исходном состоянии с блока 5 на блок 8 подаются начальные значения образа, при соответствии входных величин которым формируется сигнал для блока 4. Данным сигналом устанавливается адрес следующего кода текущего сигнала. В случае необходимости выбора одного из нескольких заданных образов, например, идентификации нескольких голосов, блок 4 организует последовательное сравнение с кодами только данного образа. Факт опознания образа в блоке 4 принимается по состоянию адресного поля. При положительном результате через блок 8 выдается информация на блок визуализации 9 о соответствии входного сигнала заданному образу. В случае отрицательного результата формирователь выдает сигнал ошибки на блок визуализации 9. Действие способа и устройства проверены на макетах, выполненных в основном на ИС серий 561 и 140. Положительный эффект определяется повышением ценности результатов преобразования до 90 95% операцией АНАЛИЗИРУЮТ во временной области без дополнительных систем обработки за счет исключения избыточности данных, при сокращении объема в операции РЕГИСТРИРУЮТ и снижении затрат в задании эталонных образов, стоимость реализации хранения которых является одной из самых дорогих. Кроме того, данный способ идентификации снижает поток данных в среднем на 2 порядка, особенно при работе с речевыми потоками. Последнее особенно важно при сохранении речи, так как может быть применена память без подвижного носителя типа магнитной ленты. Апробация показывает: для хранения 4 часовой речи достаточно 2-3 Мбайта памяти, т.е. энергонезависимые микросхемы ОЗУ, серийно выпускаемые ведущими фирмами мира в области вычислительной техники, с объемом до 10 Мбайт. Результаты подтвердили работоспособность и эффективность для применения в областях кардиологии, неврологии, а также кузнечно-прессовых производствах, опознании речевых сигналов. Для апробации в кардиологии использовался ЭКС, который восстанавливался на мониторе ПЭВМ и при ее помощи по формуле Баевского вычислялись индексы с последующей диагностикой; в неврологии выделялись ритмы в биопотенциалах полушарий головного мозга, идентифицирующие состояние пациента. Реальное время диагностики составляло единицы секунд против 1 ч. Оценка эффективности для кузнечно-прессового производства, основанного на ударных производствах, проводилась сравнением силы и форм удара получаемого и эталонных значений сигнала для данного материала. Данные об ударе позволяют при необходимости вносить коррекцию в настройку оборудования, что снижает брак в производстве. Расчетные данные позволяют прогнозировать разработку электронного стетоскопа, что повысит эффективность терапевтов и педиатров при диагностике заболевания органов дыхания людей и исключит облучение при флюорографии. Совокупность элементов и связей обеспечивает:
возможность представления речевого образа в амплитудно-временной области, что упрощает схемотехническое исполнение;
отсутствие частотно-зависимых элементов позволяет реализовать устройство в микроэлектронном исполнении, что сокращает физический объем в 4-5 раз в сравнении с существующим;
улучшение габаритно-массовых характеристик исключается электромеханическое устройство, снижается энергоемкость источника питания.
Класс H03M1/48 преобразователи со следящей системой
Класс G04F10/04 с использованием счетных импульсов или полупериодов переменного тока
Класс G01R13/02 для представления измеряемых электрических переменных величин в цифровом виде