Определение или обнаружение характеристик речи, не отнесенные к группам  ,15/00: .обнаружение наличия или отсутствия сигналов речи – G10L 11/02
Патенты в данной категории
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ С ПОМОЩЬЮ ЧЕТКОСТИ ГОЛОСА
Изобретение относится к обработке аудиосигнала, в частности к процессору или способу обработки для повышения разборчивости речи и очистки зашумленного речевого аудиосигнала. Техническим результатом является повышение разборчивости речи и четкости голоса. Указанный результат достигается тем, что в способе улучшения речевых компонентов аудиосигнала, состоящего из речевых и шумовых компонентов, изменяют аудиосигнал из временной области во множество поддиапазонов в частотной области, с созданием множественных сигналов поддиапазона, обрабатывают поддиапазоны аудиосигнала, причем упомянутая обработка включает в себя управление усилением аудиосигнала в некоторых из упомянутых поддиапазонов, при этом усилением в поддиапазоне управляют путем аддитивной/субстрактивной или мультипликативной комбинации а) снижения усиления в поддиапазоне при увеличении оценки уровня шумовых компонентов в поддиапазоне, при этом оценку уровня шумовых компонентов в поддиапазоне определяют при отсутствии речи, и b) увеличения усиления в поддиапазоне при присутствии речевых компонентов в поддиапазоне аудиосигнала, причем увеличение усиления снижают в соответствии с временным сглаживанием при переходе от присутствия речевых компонентов к отсутствию речевых компонентов. Далее изменяют обработанный аудиосигнал поддиапазона из частотной области во временную область для обеспечения аудиосигнала, в котором речевые компоненты улучшены. 4 н.п. ф-лы, 5 ил. |
2469423 патент выдан: опубликован: 10.12.2012 |
|
СРЕДСТВО ОБНАРУЖЕНИЯ ГОЛОСОВОЙ АКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ НЕСКОЛЬКИХ МИКРОФОНОВ
Изобретение относится к области обработки звука, в частности к обнаружению голосовой активности с использованием нескольких микрофонов. Техническим результатом является повышение надежности обнаружения голосовой активности. Указанный результат достигается тем, что в способе обнаружения голосовой активности принимают речевой сигнал от микрофона для восприятия речи, принимают шумовой сигнал от микрофона для восприятия шумов, отличного от микрофона для восприятия речи, определяют характеристическое значение речи на основе, по меньшей мере, частично, речевого сигнала, причем этап определения характеристического значения речи содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала, определяют объединенное характеристическое значение на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала, причем этап определения объединенного характеристического значения содержит этап, на котором определяют взаимную корреляцию на основе речевого сигнала и шумового сигнала, определяют метрику голосовой активности на основе, по меньшей мере, частично, одного из речевого характеристического значения и объединенного характеристического значения и отношения абсолютного значения автокорреляции речевого сигнала к взаимной корреляции и определяют состояние голосовой активности на основе метрики голосовой активности. 5 н. и 17 з.п. ф-лы, 9 ил. |
2450368 патент выдан: опубликован: 10.05.2012 |
|
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ В ЗВУКОЗАПИСИ РАЗВЛЕКАТЕЛЬНЫХ ПРОГРАММ
Изобретение относится к обработке сигналов звукозаписи, в частности к повышению разборчивости звукозаписи развлекательных программ, таких как телевизионная звукозапись. Техническим результатом является улучшение ясности и разборчивости речи, такой как звукозапись диалогов и повествовательного изложения. Указанный результат достигается тем, что в ответ на одно или более управляющих воздействий обрабатывают звукозапись развлекательных программ: изменяют уровень сигнала звукозаписи в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления. Далее формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот: определяют в одной широкой полосе частот отрезки времени звукозаписи развлекательных программ (а) как речевые или неречевые либо (b) как вероятно являющиеся речевыми или неречевыми, получают в каждой из множества полос частот величину пульсаций уровней речи, отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на величину пульсаций уровней речи, преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень и смещают каждый соответствующий адаптивный пороговый уровень по результату определения для формирования управляющего сигнала для каждой полосы частот. 6 н. и 24 з.п. ф-лы, 7 ил. |
2440627 патент выдан: опубликован: 20.01.2012 |
|
СПОСОБ ОБНАРУЖЕНИЯ ПАУЗ В РЕЧЕВЫХ СИГНАЛАХ И УСТРОЙСТВО ЕГО РЕАЛИЗУЮЩЕЕ
Изобретение относится к технике цифровой обработки речевых сигналов. Технический результат заключается в сокращении объема вычислительных операций при цифровой обработке речевых сигналов. Указанный технический результат достигается тем, что речевой сигнал с выхода электроакустического преобразователя суммируют с новым стабильным по частоте и амплитуде сигналом, полученную сумму сигналов усиливают, ограничивают по амплитуде и преобразуют путем перемножения с копией первичного речевого сигнала в новый сигнал, который сравнивают с установленным порогом и при превышении амплитуды полученного сигнала установленного значения порога принимают решение о наличии паузы в речевом сигнале. 2 н.п. ф-лы, 3 ил. |
2436173 патент выдан: опубликован: 10.12.2011 |
|
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВА ДЛЯ ОБНАРУЖЕНИЯ ИЗМЕНЕНИЯ СИГНАЛОВ
Изобретение относится к обработке речевых сигналов. Раскрытые конфигурации включают в себя системы, способы и устройства, выполненные с возможностью формировать последовательность значений спектрального наклона, которая основана на неактивных кадрах речевого сигнала. Для каждого из множества неактивных кадров речевого сигнала решение по передаче принимается согласно изменению, вычисленному, по меньшей мере, между двумя соответствующими значениями последовательности. Результат решения по передаче решает, передается ли описание молчания для соответствующего неактивного кадра. Технический результат - обеспечение снижения вероятности ошибочных положительных решений посредством этапа принятия решения. 5 н. и 41 з.п. ф-лы, 34 ил. |
2417456 патент выдан: опубликован: 27.04.2011 |
|
ОБНАРУЖЕНИЕ АКТИВНОСТИ СЛОЖНОГО СИГНАЛА ДЛЯ УСОВЕРШЕНСТВОВАННОЙ КЛАССИФИКАЦИИ РЕЧИ/ШУМА В АУДИОСИГНАЛЕ
Изобретение относится к системам сжатия аудиосигнала, в частности, к системам классификации речи/шума при сжатии аудиосигнала. Техническим результатом является создание способа и устройства для достоверного обнаружения наличия важной с точки зрения восприятия информации в сложных сигналах. Технический результат достигается тем что, выполняют первое определение того, содержит ли рассматриваемый аудиосигнал информацию, представляющую собой речь или шум, причем выполняют второе определение того, содержит ли аудиосигнал неречевую информацию, являющуюся важной для восприятия слушающим субъектом, и осуществляют выборочную отмену результата первого определения, соответствующего шуму, в ответ на результат второго определения, соответствующий неречевой информации, являющейся важной для восприятия слушающим субъектом. 3 с. и 17 з.п.ф-лы, 13 ил.
|
2251750 патент выдан: опубликован: 10.05.2005 |
|