способ и устройство порогового сжатия динамического диапазона речевых сигналов с автоматическим определением порога
Классы МПК: | H04B1/64 устройства для сужения и расширения динамического диапазона |
Автор(ы): | Уваров Владимир Константинович (RU), Кутюмина Елена Андреевна (RU) |
Патентообладатель(и): | Федеральное государственное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный университет кино и телевидения" "СПбГУКиТ" (RU) |
Приоритеты: |
подача заявки:
2007-06-13 публикация патента:
20.04.2009 |
Изобретение относится к области приборостроения и может использоваться при передаче сигналов оповещения. Достигаемый технический результат - обеспечение максимальной разборчивости речи при наличии мешающего шума. Способ порогового сжатия динамического диапазона речевых сигналов с автоматическим определением порога характеризуется тем, что исходный речевой сигнал дополняют сопряженным с ним по Гильберту сигналом, выделяют квадрат огибающей сигнала, определяя сумму квадратов каждого из пары сопряженных по Гильберту сигналов, выходной сигнал формируют делением одного из сопряженных по Гильберту сигналов на субсигнал сжатия, получаемый сложением порогового напряжения и напряжения, полученного из квадрата огибающей сигнала, при этом из квадрата огибающей сигнала извлекают квадратный корень, вычисляя огибающую исходного сигнала, результат интегрируют, с помощью компаратора сравнивают проинтегрированную огибающую исходного сигнала с опорным напряжением, сигнал с выхода компаратора инвертируют, перемножают с огибающей сигнала, принятого микрофоном в зоне озвучивания, для этого сигнал с выхода микрофона дополняют сопряженным с ним по Гильберту сигналом, выделяют огибающую принятого микрофоном сигнала, определяя корень квадратный из суммы квадратов каждого из пары сопряженных по Гильберту сигналов микрофона, полученное произведение интегрируют, масштабно изменяют, ограничивают сверху по величине и используют полученное напряжение для уменьшения напряжения исходного порога компрессии. Устройство содержит два квадратурных фазовращателя, три сумматора, аналоговый делитель, два блока извлечения квадратного корня, микрофон, две пары квадратичных детекторов, два интегратора, масштабный усилитель, ограничитель, вычитатель, компаратор, аналоговый перемножитель и инвертор. 2 н.п. ф-лы, 1 ил.
Формула изобретения
1. Способ порогового сжатия динамического диапазона речевых сигналов с автоматическим определением порога, при котором исходный речевой сигнал дополняют сопряженным с ним по Гильберту сигналом, после чего выделяют квадрат огибающей сигнала, определяя сумму квадратов каждого из пары сопряженных по Гильберту сигналов, выходной сигнал формируют делением одного из сопряженных по Гильберту сигналов на субсигнал сжатия, получаемый сложением порогового напряжения и напряжения, полученного из квадрата огибающей сигнала, отличающийся тем, что из квадрата огибающей сигнала извлекают квадратный корень, вычисляя огибающую исходного сигнала, результат интегрируют, с помощью компаратора сравнивают проинтегрированную огибающую исходного сигнала с опорным напряжением, сигнал с выхода компаратора инвертируют, а затем перемножают с огибающей сигнала, принятого микрофоном в зоне озвучивания, для этого сигнал с выхода микрофона дополняют сопряженным с ним по Гильберту сигналом, после чего выделяют огибающую принятого микрофоном сигнала, определяя корень квадратный из суммы квадратов каждого из пары сопряженных по Гильберту сигналов микрофона, полученное произведение интегрируют, масштабно изменяют, ограничивают сверху по величине и используют полученное напряжение для уменьшения напряжения исходного порога компрессии, которое выбрано для срабатывания при незначительном уровне шума в зоне озвучивания.
2. Устройство порогового сжатия динамического диапазона речевых сигналов с автоматическим определением порога, которое включает в себя последовательно соединенные квадратурный фазовращатель, два квадратичных детектора, первый и второй сумматоры, а также аналоговый делитель, первый вход которого соединен с первым выходом квадратурного фазовращателя, второй вход которого соединен с выходом второго сумматора, на второй вход которого подается напряжение порога компрессии, выход аналогового делителя образует выход устройства, отличающееся тем, что оно дополнительно снабжено первым блоком извлечения квадратного корня, включенным между первым и вторым сумматором, кроме того, оно дополнительно снабжено последовательно соединенными микрофоном, вторым квадратурным фазовращателем, второй парой квадратичных детекторов, третьим сумматором, вторым блоком извлечения квадратного корня, аналоговым перемножителем, первым интегратором, масштабным усилителем, ограничителем и вычитателем, а также последовательно соединенными вторым интегратором, компаратором и инвертором, причем вход второго интегратора подключен к выходу первого блока извлечения квадратного корня, выход инвертора соединен со вторым входом аналогового перемножителя, на второй вход вычитателя подается постоянное напряжение исходного порога, на второй вход компаратора подается постоянное опорное напряжение, на второй вход ограничителя подается постоянное напряжение порога ограничения, а выход вычитателя соединен со вторым входом второго сумматора.
Описание изобретения к патенту
Группа изобретений относится к области приборостроения и предназначена для порогового сжатия динамического диапазона речевых сигналов, главным образом, с целью повышения разборчивости речи, воспринимаемой на фоне акустических помех, за счет автоматизации определения порога амплитудного компрессирования при передаче сигналов оповещения, например, в аэропортах, в помещениях речных, морских и железнодорожных вокзалов, помещениях автобусных станций и других помещениях и зонах оповещения групп населения, находящихся в условиях действия акустических помех.
Известен способ, позволяющий сжимать динамический диапазон звуковых сигналов при передаче, реализованный в пороговых компрессорах динамического диапазона, используемых как в составе компандерных систем (например, компандерах Долби), так и в виде отдельных пороговых устройств амплитудного компрессирования, автоматического регулирования уровня [1, с.175-185].
К причинам, препятствующим достижению требуемого технического результата при использовании известного способа, относится то, что:
- в компандерных системах пороги срабатывания компрессоров должны быть согласованы с порогами срабатывания экспандеров и поэтому изменяться не могут;
- в амплитудных компрессорах, используемых в виде отдельных пороговых устройств, звукооператор или звукорежиссер имеет возможность изменять порог сжатия, но не может этого делать оперативно, когда уровень звукового сигнала постоянно изменяется; поэтому он вынужден устанавливать такие значения порога амплитудной компрессии, которые наименее заметно искажают фонограмму;
- в компрессорах, применяемых при записи фонограмм кинофильмов, параметры амплитудного компрессирования (порог и степень) установлены в аппаратуре записи фонограмм и их изменять нельзя, поскольку они регламентированы соответствующими нормативными документами; выбраны они компромиссно по наибольшему повышению разборчивости речи фонограммы при среднем уровне помех в виде музыкального сопровождения и шума зрительного зала, при допустимой по оценкам экспертов заметности на слух этих преобразований звуковых сигналов.
Наиболее близким способом того же назначения к заявленному в группе изобретений способу по совокупности признаков является способ, реализованный в устройстве по А.с. СССР № 1058077.
Наиболее близким устройством того же назначения к заявленному устройству в группе изобретений является устройство по А.с. СССР № 1058077.
К причинам, препятствующим достижению требуемого технического результата при использовании известного способа и устройства для его осуществления, принятых за прототип, относится то, что при их использовании нельзя оперативно автоматически изменять порог амплитудного компрессирования, когда уровень акустических помех в зоне оповещения изменяется.
В прототипе выбранный порог амплитудного компрессирования устанавливается для всего фрагмента фонограммы целиком.
Сущность изобретения заключается в следующем.
Единая задача, на решение которой направлена заявляемая группа изобретений, заключается в повышении разборчивости речевых сигналов, воспринимаемых при наличии мешающих акустических шумов. Названное повышение разборчивости достигается за счет автоматического установления такой величины порога амплитудного компрессирования, которая обеспечивает максимальную разборчивость речи при данном уровне мешающего шума.
Известно, что при выборе слишком большой величины порога амплитудного компрессирования часть слабых звуков может быть недоступна для восприятия из-за маскирующего действия окружающего шума. При выборе слишком малой величины порога амплитудного компрессирования, такой, что слабые согласные звуки речи в результате компрессии становятся достаточно громкими и не страдают от мешающего действия шума, речь звучит неестественно и, как правило, разборчивость такой речи ниже, чем при оптимальном значении порога компрессии.
Установлено, что чем больше уровень мешающего акустического шума в зоне прослушивания речи, тем меньше величина оптимального значения порога компрессии.
Единый технический результат, который может быть получен при осуществлении группы изобретений, заключается в том, что при изменении уровня мешающего акустического шума в зоне прослушивания речи порог амплитудного компрессирования устанавливается в заявляемом устройстве автоматически близким к оптимальному значению, которое обеспечивает максимальную разборчивость речи при наличии действующего в данный момент времени мешающего шума, а не остается одинаковым и оптимальным в среднем, как в настоящее время.
Указанный единый технический результат при осуществлении группы изобретений по объекту-способу достигается тем, что как и в известном способе исходный сигнал дополняют сопряженным с ним по Гильберту сигналом, после чего выделяют квадрат огибающей исходного сигнала, определяя сумму квадратов каждого из пары сопряженных по Гильберту сигналов, выходной сигнал формируют делением одного из сопряженных по Гильберту сигналов на субсигнал сжатия, получаемый сложением порогового напряжения и напряжения, полученного из квадрата огибающей сигнала, но в отличии от прототипа из квадрата огибающей сигнала извлекают квадратный корень, вычисляя огибающую исходного сигнала, результат интегрируют, с помощью компаратора сравнивают проинтегрированную огибающую исходного сигнала с опорным напряжением, сигнал с выхода компаратора инвертируют, а затем перемножают с огибающей сигнала, принятого микрофоном в зоне озвучивания, для этого сигнал с выхода микрофона дополняют сопряженным с ним по Гильберту сигналом, после чего выделяют огибающую принятого микрофоном сигнала, определяя корень квадратный из суммы квадратов каждого из пары сопряженных по Гильберту сигналов микрофона, полученное произведение интегрируют, масштабно изменяют, ограничивают сверху по величине и используют полученное напряжение для уменьшения напряжения исходного порога компрессии, которое выбрано для срабатывания при незначительном уровне шума в зоне озвучивания.
В качестве примера реализации заявляемого способа предлагается устройство.
Указанный единый технический результат при осуществлении изобретения достигается тем, что известное устройство, которое включает в себя последовательно соединенные квадратурный фазовращатель, два квадратичных детектора, первый и второй сумматоры, а также аналоговый делитель, первый вход которого соединен с первым выходом фазовращателя, второй вход которого соединен с выходом второго сумматора, на второй вход которого подается напряжение порога компрессии, выход аналогового делителя образует выход устройства, дополнительно снабжено первым блоком извлечения квадратного корня, включенным между первым и вторым сумматорами, кроме того, оно дополнительно снабжено последовательно соединенными микрофоном, вторым квадратурным фазовращателем, второй парой квадратичных детекторов, третьим сумматором, вторым блоком извлечения квадратного корня, аналоговым перемножителем, первым интегратором, масштабным усилителем, ограничителем и вычитателем, а также последовательно соединенными вторым интегратором, компаратором и инвертором, причем вход второго интегратора подключен к выходу первого блока извлечения квадратного корня, выход инвертора соединен со вторым входом аналогового перемножителя, на второй вход вычитателя подается постоянное напряжение исходного порога, на второй вход компаратора подается постоянное опорное напряжение, на второй вход ограничителя подается постоянное напряжение порога ограничения, а выход вычитателя соединен со вторым входом второго сумматора.
Проведенный заявителем анализ уровня техники, включающий поиск по патентам и научно-техническим источникам информации, позволил установить, что заявителем не обнаружен аналог как для способа, так и для устройства, характеризующийся признаками, идентичными всем существенным признакам как способа, так и устройства заявленной группы изобретений, а определение из числа выявленных аналогов прототипа как наиболее близкого по совокупности признаков, позволило определить совокупность существенных по отношению к техническому результату признаков в заявленном объекте, изложенных в формуле изобретения.
Следовательно, каждый из объектов заявленной группы изобретений соответствует требованию «новизна» действующего законодательства.
Для проверки соответствия заявленного изобретения требованию изобретательского уровня заявителем проведен дополнительный поиск решений с целью выявления признаков, совпадающих с признаками, отличительными от прототипа, результаты которого показали, что каждый из объектов изобретения не следует для специалиста явным образом из известного уровня техники, поскольку из уровня техники, определенного заявителем, не выявлено влияние предусматриваемых существенными признаками заявленного изобретения преобразований на достижение технического результата.
Следовательно, заявленное изобретение соответствует требованию «изобретательский уровень» действующего законодательства.
На чертеже представлена структурная схема заявляемого устройства, где 1, 13 - квадратурные фазовращатели; 2, 3, 14, 15 - квадратичные детекторы; 4, 7, 16 - сумматоры; 5, 17 - блоки извлечения квадратного корня; 6 - аналоговый делитель; 8 - вычитатель; 9, 19 - интеграторы; 10 - компаратор; 11 - инвертор; 12 - микрофон; 18 - аналоговый перемножитель; 20 - масштабный усилитель; 21 - ограничитель.
Сведения, подтверждающие возможность осуществления изобретения с получением вышеуказанного технического результата, заключаются в следующем.
Предлагаемое устройство работает следующим образом.
В качестве математической модели входного речевого сигнала принимается модель:
где sвх(t) - входной сигнал; Sp(t), p(t) - соответственно огибающая и текущая фаза этого сигнала.
На выходах квадратурного фазовращателя КФВ1 (1 на чертеже) формируются два сопряженных по Гильберту сигнала:
Квадратичными детекторами КД1 и КД2 (2, 3 на чертеже) входной и сопряженный сигналы возводятся в квадрат:
На выходе сумматора Сум1 (4 на чертеже) выделяется квадрат огибающей входного сигнала как сумма сигналов (4) и (5):
Блоком извлечения квадратного корня БИКК1 (5 на чертеже) определяется огибающая входного сигнала:
На выходе интегратора Инт2 (9 на чертеже) формируется усредненное значение огибающей входного сигнала:
где Т2 - время интеграции интегратора (9 на чертеже).
В компараторе Комп (10 на чертеже) происходит сравнение усредненной огибающей речевого сигнала u вых9(t) с опорным напряжением Uоп:
где Uоп определено уровнем шума канала выделения Sp(t), чтобы компаратор реагировал лишь на огибающую речевых сигналов, но не на шум.
В инверторе Инв (11 на чертеже) происходит инвертирование сигнала uвых10(t):
Этот сигнал затем перемножается в перемножителе Пер (18 на чертеже) с огибающей шума Sш(t), которая выделяется следующим образом.
В качестве математической модели шумового сигнала, поступающего с микрофона М (12 на чертеже), принимается модель:
где uм(t) - входной сигнал с микрофона (12 на чертеже); Sш(t), ш(t) - соответственно огибающая и текущая фаза этого сигнала.
На выходах квадратурного фазовращателя КФВ2 (13 на чертеже) формируются два сопряженных по Гильберту сигнала:
Квадратичными детекторами КД3 и КД4 (14, 15 на чертеже) входной и сопряженный сигналы возводятся в квадрат:
На выходе сумматора Сум3 (16 на чертеже) выделяется квадрат огибающей шума как сумма сигналов (14) и (15):
Блоком извлечения квадратного корня БИКК2 (17 на чертеже) определяется огибающая шума:
Сигнал с выхода перемножителя (18 на чертеже):
То есть во время звучания речевых сообщений, поступающих в зону озвучивания, огибающая полученного на выходе микрофона (12 на чертеже) сигнала не влияет на формирование сигнала управления. Кроме того, предотвращается возникновение в зоне озвучивания акустической обратной связи.
Сигнал с выхода перемножителя интегрируется в интеграторе Инт1 (19 на чертеже):
Время интеграции интегратора (19 на чертеже) T1 должно быть достаточно большим, чтобы во время звучания речевых сообщений, поступающих в зону озвучивания, когда сигнал с выхода инвертора прерывает поступление смеси речевого сигнала и шума от микрофона на вход интегратора (19 на чертеже), напряжение uвых19(t) не могло значительно измениться.
Коэффициент масштабного усилителя МУ (20 на чертеже) Кму позволяет регулировать скорость процесса снижения порога компрессирования при увеличении уровня шума:
Ограничитель Огр (21 на чертеже) выполняет ограничение сигнала uвых20(t) сверху с порогом, равным Uпор огр:
где Uпор огр - величина напряжения порога ограничения, которая ограничивает уменьшение порога срабатывания компрессора до его минимального значения.
Порог компрессирования формируется на выходе вычитателя Выч (8 на чертеже), в котором напряжение uвых21(t) вычитается из напряжения исходного порога компрессии Uпор исх, выбранного для срабатывания при незначительном уровне шума в зоне озвучивания:
Таким образом, порог компрессирования при увеличении уровня шума в зоне озвучивания уменьшается от своей максимальной величины Uпор макс=Uпор исх при малом уровне шума до минимальной величины Uпор мин =Uпор исх-Uпор огр при значительном уровне шума.
Исполнительным элементом данной схемы является делитель Дел (6 на чертеже), в котором входной сигнал делится на сумму порогового напряжения и огибающей речевого сигнала, формируемого в сумматоре Сум2 (7 на чертеже):
Таким образом, сигнал на выходе компрессора выглядит следующим образом:
Uпор исх выбирается при малом уровне мешающего шума в зоне оповещения как оптимальный порог компрессирования, при котором слабые звуки не будут маскироваться окружающим шумом. Целесообразно выбрать Uпор исх=1В, тогда, как видно из формулы (23), при слабом сигнале и слабом уровне шума выходной сигнал совпадает с входным. При уменьшении порога компрессирования вследствие увеличения уровня шума слабый входной сигнал усиливается, так как uпор<B, но только до определенной величины. При слишком большом усилении слабых согласных звуков разборчивость речи падает, поэтому вводится ограничение минимального порога Uпор мин, при котором достигается оптимальная разборчивость речи при высоком уровне мешающего шума.
Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного изобретения следующих условий:
- средство, воплощающее заявленное изобретение при его осуществлении, предназначено для использования в промышленности, именно в технике связи и в системах оповещения;
- для заявленного изобретения, в том виде, как оно охарактеризовано в формуле изобретения, подтверждена возможность его осуществления с помощью вышеописанных в заявке или известных до даты приоритета средств и методов.
Следовательно, заявленное изобретение соответствует требованию «промышленная применимость» по действующему законодательству.
Литература
1. Звуковое вещание / А.В.Выходец, П.М.Жмурин, И.Ф.Зорин и др.; Под ред. Ю.А.Ковалгина: Справочник. - М.: Радио и связь, 1993. - 464 с.
Класс H04B1/64 устройства для сужения и расширения динамического диапазона