Определение или обнаружение характеристик речи, не отнесенные к группам 15/00 – G10L 11/00
G10L 11/02 | .обнаружение наличия или отсутствия сигналов речи переключение направления передачи с помощью тональной частоты в телефонных системах с двухполосными громкоговорителями H 04M 9/10 |
G10L 11/04 | .определение пика речевых сигналов |
G10L 11/06 | .распознавание выраженных голосом и не выраженных голосом звуков речевых сигналов 11/04 имеет преимущество |
Патенты в данной категории
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ С ПОМОЩЬЮ ЧЕТКОСТИ ГОЛОСА
Изобретение относится к обработке аудиосигнала, в частности к процессору или способу обработки для повышения разборчивости речи и очистки зашумленного речевого аудиосигнала. Техническим результатом является повышение разборчивости речи и четкости голоса. Указанный результат достигается тем, что в способе улучшения речевых компонентов аудиосигнала, состоящего из речевых и шумовых компонентов, изменяют аудиосигнал из временной области во множество поддиапазонов в частотной области, с созданием множественных сигналов поддиапазона, обрабатывают поддиапазоны аудиосигнала, причем упомянутая обработка включает в себя управление усилением аудиосигнала в некоторых из упомянутых поддиапазонов, при этом усилением в поддиапазоне управляют путем аддитивной/субстрактивной или мультипликативной комбинации а) снижения усиления в поддиапазоне при увеличении оценки уровня шумовых компонентов в поддиапазоне, при этом оценку уровня шумовых компонентов в поддиапазоне определяют при отсутствии речи, и b) увеличения усиления в поддиапазоне при присутствии речевых компонентов в поддиапазоне аудиосигнала, причем увеличение усиления снижают в соответствии с временным сглаживанием при переходе от присутствия речевых компонентов к отсутствию речевых компонентов. Далее изменяют обработанный аудиосигнал поддиапазона из частотной области во временную область для обеспечения аудиосигнала, в котором речевые компоненты улучшены. 4 н.п. ф-лы, 5 ил. |
2469423 выдан: опубликован: 10.12.2012 |
|
СПОСОБ И УСТРОЙСТВО, ПРЕДНАЗНАЧЕННЫЕ ДЛЯ ЭФФЕКТИВНОЙ ПЕРЕДАЧИ СИГНАЛОВ РАЗМЕРНОСТИ И ПАЧКИ В ПОЛОСЕ ЧАСТОТ И РАБОТЫ С МАКСИМАЛЬНОЙ ПОЛОВИННОЙ СКОРОСТЬЮ ПРИ ШИРОКОПОЛОСНОМ КОДИРОВАНИИ РЕЧИ С ПЕРЕМЕННОЙ СКОРОСТЬЮ ПЕРЕДАЧИ БИТОВ ДЛЯ БЕСПРОВОДНЫХ СИСТЕМ МДКР
Изобретение относится к радиосвязи и предназначено для взаимодействия первой станции, использующей первую схему связи, со второй станцией, использующей вторую схему связи. Связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом. Звуковой сигнал классифицируют для определения, должны ли быть переданы параметры кодирования сигнала из одной станции в другую станцию с использованием первого режима связи, в котором используется полная скорость передачи для передачи параметров кодирования сигнала. Если классификация звукового сигнала определит, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и, если принят запрос для передачи параметров кодирования сигнала из одной станции в другую станцию с использованием второго режима связи, предназначенного для уменьшения скорости передачи во время передачи параметров кодирования сигнала, часть параметров кодирования сигнала из одной станции удаляют, а остальные параметры кодирования сигнала передают в другую станцию с использованием второго режима связи. Удаленную часть параметров кодирования сигнала регенерируют перед тем, как другая станция декодирует параметры кодирования сигнала. Технический результат - повышение достоверности передачи. 6 н. и 11 з.п. ф-лы, 6 табл., 8 ил. |
2461897 выдан: опубликован: 20.09.2012 |
|
СРЕДСТВО ОБНАРУЖЕНИЯ ГОЛОСОВОЙ АКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ НЕСКОЛЬКИХ МИКРОФОНОВ
Изобретение относится к области обработки звука, в частности к обнаружению голосовой активности с использованием нескольких микрофонов. Техническим результатом является повышение надежности обнаружения голосовой активности. Указанный результат достигается тем, что в способе обнаружения голосовой активности принимают речевой сигнал от микрофона для восприятия речи, принимают шумовой сигнал от микрофона для восприятия шумов, отличного от микрофона для восприятия речи, определяют характеристическое значение речи на основе, по меньшей мере, частично, речевого сигнала, причем этап определения характеристического значения речи содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала, определяют объединенное характеристическое значение на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала, причем этап определения объединенного характеристического значения содержит этап, на котором определяют взаимную корреляцию на основе речевого сигнала и шумового сигнала, определяют метрику голосовой активности на основе, по меньшей мере, частично, одного из речевого характеристического значения и объединенного характеристического значения и отношения абсолютного значения автокорреляции речевого сигнала к взаимной корреляции и определяют состояние голосовой активности на основе метрики голосовой активности. 5 н. и 17 з.п. ф-лы, 9 ил. |
2450368 выдан: опубликован: 10.05.2012 |
|
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯ ЗВУКОВОЙ АКТИВНОСТИ И КЛАССИФИКАЦИИ ЗВУКОВЫХ СИГНАЛОВ
Настоящее изобретение относится к обнаружению звуковой активности, оценке фоновых шумов и классификации звуковых сигналов, где под звуком понимается полезный сигнал. Техническим результатом является улучшение производительности обнаружения звуковой активности в присутствии музыкальных сигналов, а также улучшение распознавания невокализованных звуков и музыки. Указанный результат достигается тем, что в способе оценки тональности звукового сигнала выполняют вычисление текущего остаточного спектра звукового сигнала, обнаружение пиков в текущем остаточном спектре, вычисление карты корреляции между текущим остаточным спектром и предыдущим остаточным спектром для каждого обнаруженного пика, вычисление долгосрочной карты корреляции на основе вычисленной карты корреляции. При этом долгосрочная карта корреляции характеризует тональность звукового сигнала. 12 н. и 54 з.п. ф-лы, 6 ил. |
2441286 выдан: опубликован: 27.01.2012 |
|
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ В ЗВУКОЗАПИСИ РАЗВЛЕКАТЕЛЬНЫХ ПРОГРАММ
Изобретение относится к обработке сигналов звукозаписи, в частности к повышению разборчивости звукозаписи развлекательных программ, таких как телевизионная звукозапись. Техническим результатом является улучшение ясности и разборчивости речи, такой как звукозапись диалогов и повествовательного изложения. Указанный результат достигается тем, что в ответ на одно или более управляющих воздействий обрабатывают звукозапись развлекательных программ: изменяют уровень сигнала звукозаписи в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления. Далее формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот: определяют в одной широкой полосе частот отрезки времени звукозаписи развлекательных программ (а) как речевые или неречевые либо (b) как вероятно являющиеся речевыми или неречевыми, получают в каждой из множества полос частот величину пульсаций уровней речи, отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на величину пульсаций уровней речи, преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень и смещают каждый соответствующий адаптивный пороговый уровень по результату определения для формирования управляющего сигнала для каждой полосы частот. 6 н. и 24 з.п. ф-лы, 7 ил. |
2440627 выдан: опубликован: 20.01.2012 |
|
СПОСОБ ОБНАРУЖЕНИЯ ПАУЗ В РЕЧЕВЫХ СИГНАЛАХ И УСТРОЙСТВО ЕГО РЕАЛИЗУЮЩЕЕ
Изобретение относится к технике цифровой обработки речевых сигналов. Технический результат заключается в сокращении объема вычислительных операций при цифровой обработке речевых сигналов. Указанный технический результат достигается тем, что речевой сигнал с выхода электроакустического преобразователя суммируют с новым стабильным по частоте и амплитуде сигналом, полученную сумму сигналов усиливают, ограничивают по амплитуде и преобразуют путем перемножения с копией первичного речевого сигнала в новый сигнал, который сравнивают с установленным порогом и при превышении амплитуды полученного сигнала установленного значения порога принимают решение о наличии паузы в речевом сигнале. 2 н.п. ф-лы, 3 ил. |
2436173 выдан: опубликован: 10.12.2011 |
|
ИЗМЕРЕНИЕ ГРОМКОСТИ СО СПЕКТРАЛЬНЫМИ МОДИФИКАЦИЯМИ
Изобретение относится к обработке аудиосигналов, в частности к измерению воспринимаемой громкости аудиосигнала. Воспринимаемая громкость аудиосигнала измеряется посредством модификации спектрального представления аудиосигнала как функции от эталонной спектральной формы так, чтобы спектральное представление аудиосигнала более близко соответствовало эталонной спектральной форме, и определения воспринимаемой громкости модифицированного спектрального представления аудиосигнала. Технический результат - повышение эффективности объективного измерения громкости относительно субъективных впечатлений. 3 н. и 7 з.п. ф-лы, 11 ил. |
2434310 выдан: опубликован: 20.11.2011 |
|
СПОСОБ ВЫЯВЛЕНИЯ ПАТОЛОГИИ ГОЛОСОВЕДЕНИЯ В РЕЧИ
Изобретение относится к области психофизиологии, а именно к психофизиологии речи, и может быть использовано при анализе характеристик голосового аппарата человека для диагностики различных видов патологии голосоведения и объективной оценки эффективности проведения лечения. Сущность способа состоит в том, что в спектре выделяют пары наборов низкочастотных гармоник и/или обертонов и наборов высокочастотных обертонов, соответствующих определенному виду патологии голосоведения, после чего для каждой пары наборов вычисляют коэффициенты голосовой гармонизации как отношение суммарной энергии определенного набора относительно высокочастотных обертонов к суммарной энергии определенного набора относительно низкочастотных гармоник и/или обертонов и сравнивают со значениями соответствующих одного или нескольких коэффициентов голосовой гармонизации при норме и при патологии и делают вывод о наличие того или иного вида патологии голосоведения в речи. Технический результат - увеличение селективности и повышение чувствительности способа выявления патологии голосоведения. 2 ил. |
2433488 выдан: опубликован: 10.11.2011 |
|
ОЦЕНКА ПЕРИОДА ОСНОВНОГО ТОНА
Изобретение относится к оценке периода основного тона в аудиосигналах. Автокорреляционные величины определяют как основу для оценки периода основного тона в сегменте аудиосигнала. Первый рассматриваемый диапазон задержки для автокорреляционных вычислений делят на первый набор секций, и первые автокорреляционные величины определяют для задержек в множестве секций этого первого набора секций. Второй рассматриваемый диапазон задержки для автокорреляционных вычислений делят на второй набор секций таким образом, что секции первого набора и секции второго набора перекрываются. Вторые автокорреляционные величины определяют для задержек в множестве секций этого второго набора секций. Технический результат - обеспечение эффективности оценки основного тона аудиосигнала. 5 н. и 26 з.п. ф-лы, 6 ил. |
2421826 выдан: опубликован: 20.06.2011 |
|
СПОСОБ РАЗДЕЛЕНИЯ ДЖИТТЕРА ПЕРИОДА ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА
Изобретение относится к области анализа речевых сигналов, а именно к анализу и разложению на составляющие джиттера периода основного тона речевого сигнала. Техническим результатом является создание способа разделения джиттера основного тона речевого сигнала на случайную и периодическую составляющие с помощью спектрального метода. Указанный технический результат достигается тем, что определяют на каждом кадре речевого сигнала значение периода основного тона, вектор значений основного тона сохраняют в виде сигнальных векторов, затем по сигнальным векторам определяют функции ошибок временных интервалов, вычисляют усредненный спектр ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP, соответствующий частотам пиковых значений амплитуд в усредненном спектре ошибок временных интервалов, вычисляют модифицированный спектр периодического джиттера на частотах FP с амплитудами усредненного спектра ошибок временных интервалов и фазами спектра ошибок временных интервалов, вычисляют временную последовательность периодического джиттера путем обратного преобразования Фурье от модифицированного спектра периодического джиттера, вычисляют модифицированный спектр случайного джиттера путем подстановки на частотах FP амплитуды, равной корню квадратному из разности усредненной спектральной плотности мощности и квадрата модуля усредненного спектра ошибок временных интервалов, и случайной, равномерно распределенной фазы. 3 ил. |
2419166 выдан: опубликован: 20.05.2011 |
|
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВА ДЛЯ ОБНАРУЖЕНИЯ ИЗМЕНЕНИЯ СИГНАЛОВ
Изобретение относится к обработке речевых сигналов. Раскрытые конфигурации включают в себя системы, способы и устройства, выполненные с возможностью формировать последовательность значений спектрального наклона, которая основана на неактивных кадрах речевого сигнала. Для каждого из множества неактивных кадров речевого сигнала решение по передаче принимается согласно изменению, вычисленному, по меньшей мере, между двумя соответствующими значениями последовательности. Результат решения по передаче решает, передается ли описание молчания для соответствующего неактивного кадра. Технический результат - обеспечение снижения вероятности ошибочных положительных решений посредством этапа принятия решения. 5 н. и 41 з.п. ф-лы, 34 ил. |
2417456 выдан: опубликован: 27.04.2011 |
|
АНАЛИЗАТОР РЕЧИ, ОБНАРУЖИВАЮЩИЙ ЧАСТОТУ ОСНОВНОГО ТОНА, СПОСОБ АНАЛИЗА РЕЧИ И ПРОГРАММА АНАЛИЗА РЕЧИ
Изобретение относится к методу анализа речи, обнаруживающему частоту основного тона голоса, а также к методу обнаружения эмоций, оценивающему эмоцию на основании частоты основного тона голоса. Технический результат - повышение точного и уверенного обнаружения голосовой частоты и повышение точности оценки эмоций. Анализатор речи включает в себя блок поступления голосового сигнала, блок частотного преобразования, автокорреляционный блок и блок обнаружения основного тона. Блок частотного преобразования преобразует голосовой сигнал, полученный в блоке поступления голосового сигнала, в частотный спектр. Автокорреляционный блок вычисляет автокорреляционное колебание при сдвиге частотного спектра на частотной оси. Блок обнаружения основного тона вычисляет частоту на основе локального интервала между гребнями или впадинами автокорреляционного колебания. 3 н. и 6 з.п. ф-лы, 5 ил. |
2403626 выдан: опубликован: 10.11.2010 |
|
СНИЖЕНИЕ РАЗРЕЖЕННОСТИ В КОДИРОВАННЫХ РЕЧЕВЫХ СИГНАЛАХ
Изобретение относится к кодированию речи и более конкретно к проблеме разреженности в кодированных речевых сигналах. Обеспечивается снижение разреженности во входном цифровом сигнале, включающем в себя первую последовательность значений выборок. Выходной цифровой сигнал формируется в ответ на входной цифровой сигнал. Выходной цифровой сигнал включает в себя вторую последовательность значений выборок, причем указанная вторая последовательность значений выборок имеет более высокую плотность ненулевых значений выборок, чем первая последовательность значений выборок. Технический результат - повышение качества кодирования речевых сигналов. 4 н. и 8 з.п. ф-лы, 20 ил. |
2388069 выдан: опубликован: 27.04.2010 |
|
СПОСОБ ПЕРЕДАЧИ РЕЧЕВЫХ СИГНАЛОВ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ
Изобретение относится к области передачи сигналов. Сущность способа и устройства передачи речевых сигналов (PC) состоит в восстановлении огибающей речевого сигнала на приемной стороне. Для этого фазовая манипуляция (ФМн) на 180° осуществляется клиппированным не речевым сигналом, а его производной по времени. На приемной стороне знакопеременные импульсы клиппированной производной по времени PC дискретизируются по времени, в результате чего образуется колебание с дельта-модуляцией, которое затем детектируется путем интегрирования его по времени и низкочастотной фильтрации, в результате чего получается переданный PC с его огибающей. С целью исключения нелинейных искажений от клиппирования операции дифференцирования клиппированию подвергается не PC (широкополосный), а сформированный по нему однополосный (узкополосный) сигнал, который затем линейно переносится опять в тональный диапазон частот путем когерентного детектирования. Технически результат - повышение качества клиппированного речевого сигнала до максимально возможного значения в результате восстановления амплитуды в клиппированном речевом сигнале и исключения нелинейных искажений при его клиппировании. 2 н.п. ф-лы, 4 ил. |
2371783 выдан: опубликован: 27.10.2009 |
|
СИСТЕМА ДЕТЕКТИРОВАНИЯ РЕЧИ
Изобретение предназначено для ввода аудиоинформации. Система содержит аудиомикрофон, объединенный с датчиком речи, формирующим сигнал, основанный на входном незвуковом сигнале, генерируемом на основе действия, производимого говорящим человеком во время разговора, такого как движение лица, вибрация кости, вибрация горла, изменение полного внутреннего сопротивления горла и так далее. Компонент детектора речи генерирует сигнал детектирования речи, указывающий на вероятность того, что пользователь говорит, и дополнительно вычисляет комбинированный сигнал путем умножения сигнала детектирования речи на сигнал микрофона, а процессор распознавания речи распознает речь для обеспечения выходного сигнала распознавания, указывающего на речь в сигнале микрофона на основании комбинированного сигнала. Технический результат - устранение шума, связанного с фоновой речью и повышение удобства для пользователя. 3 н. и 10 з.п. ф-лы, 11 ил. |
2363994 выдан: опубликован: 10.08.2009 |
|
КВАНТОВАНИЕ ОСНОВНОГО ТОНА ДЛЯ РАСПРЕДЕЛЕННОГО РАСПОЗНАВАНИЯ РЕЧИ
Изобретение касается области систем распределенного распознавания речи, где раскрыты система, способ и пригодная для чтения компьютером среда для квантования информации об основном тоне звука. Способ включает в себя захват звука, представляющего пронумерованный кадр из множества пронумерованных кадров. Способ дополнительно включает в себя вычисление класса кадра, в котором класс представляет собой любой из вокализированного или невокализированного класса. Если кадр представляет собой вокализированный класс, для кадра рассчитывается основной тон (903). Если кадр представляет собой кадр с четным номером и вокализированный класс, рассчитывается ключевое слово первой длины посредством абсолютного квантования основного тона кадра (910). Если кадр представляет собой кадр с нечетным номером и вокализированный класс и доступен достоверный кадр, рассчитывается ключевое слово второй длины посредством дифференциального квантования основного тона кадра (905). Если нет доступного достоверного кадра, рассчитывается ключевое слово второй длины посредством абсолютного квантования основного тона кадра. Технический результат - компактное представление информации о классе и основном тоне для сохранения низкой скорости передачи в битах без потери точности и устойчивости против ошибок канала связи. 4 н. и 20 з.п. ф-лы, 10 ил., 2 табл. |
2331932 выдан: опубликован: 20.08.2008 |
|
СПОСОБ И УСТРОЙСТВО, ПРЕДНАЗНАЧЕННЫЕ ДЛЯ ЭФФЕКТИВНОЙ ПЕРЕДАЧИ СИГНАЛОВ РАЗМЕРНОСТИ И ПАЧКИ В ПОЛОСЕ ЧАСТОТ И РАБОТЫ С МАКСИМАЛЬНОЙ ПОЛОВИННОЙ СКОРОСТЬЮ ПРИ ШИРОКОПОЛОСНОМ КОДИРОВАНИИ РЕЧИ С ПЕРЕМЕННОЙ СКОРОСТЬЮ ПЕРЕДАЧИ БИТОВ ДЛЯ БЕСПРОВОДНЫХ СИСТЕМ МДКР
Изобретение относится к радиосвязи и предназначено для взаимодействия первой станции со второй станцией. Технический результат - повышение достоверности передачи. Для этого первая станция использует первую схему связи и содержит первый кодер и первый декодер, а вторая станция использует вторую схему связи и содержит второй кодер и второй декодер, связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций первой или второй в декодер другой станции. Звуковой сигнал классифицируют для определения, должны ли быть переданы параметры кодирования сигнала из кодера одной станции в декодер другой станции с использованием первого режима связи, в котором используется полная скорость передачи для передачи параметров кодирования сигнала. Если классификация звукового сигнала определит, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и, если принят запрос для передачи параметров кодирования сигнала из кодера одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи во время передачи параметров кодирования сигнала, часть параметров кодирования сигнала из кодера одной станции удаляют, а остальные параметры кодирования сигнала передают в декодер другой станции с использованием второго режима связи. Удаленную часть параметров кодирования сигнала регенерируют перед тем, как декодер другой станции декодирует параметры кодирования сигнала. 24 н. и 38 з.п. ф-лы, 8 ил., 6 табл. |
2326449 выдан: опубликован: 10.06.2008 |
|
СПОСОБ МОДИФИКАЦИИ СИГНАЛА ДЛЯ ЭФФЕКТИВНОГО КОДИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ
Изобретение относится к области кодирования. Технический результат заключается в обеспечении оптимального качества и скорости передачи звуковых сигналов. Сущность изобретения заключается в том, что речевой сигнал разбивают на последовательность кадров, формируют сигнал из речевого сигнала таким образом, чтобы импульсы основного тона могли быть идентифицированы из сформированного сигнала, определяют местоположение последнего импульса основного тона текущего кадра и местоположение последнего импульса основного тона предшествующего кадра со ссылкой на сформированный сигнал, определяют оптимальное значение параметра задержки таким образом, что кривая задержки основного тона, представляющая изменение задержки основного тона в текущем кадре, характеризуемом упомянутым оптимальным значением параметра задержки, обеспечивала наименьшую ошибку предсказания, когда кривая задержки основного тона используется для предсказания местоположения последнего импульса основного тона в предшествующем кадре. 5 н. и 50 з.п. ф-лы, 13 ил., 3 табл. |
2302665 выдан: опубликован: 10.07.2007 |
|
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ РЕЧИ
Изобретение относится к области анализа и распознавания речевых сигналов. Техническим результатом является повышение точности распознавания слов речи, достигаемый тем, что в процессе обучения системы распознаванию формируются эталонные биспектральные признаки фонем - положения максимумов модуля биспектра (ММБ) звукового сигнала и амплитуды ММБ звукового сигнала, а также эталонные признаки слов, представляющие собой совокупности усредненных временных отрезков от начала слова до начала и окончания всех фонем и пауз в слове, а в процессе распознавания речевой сигнал, соответствующий интервалу слова, разбивается на сегменты, в которых формируются биспектральные признаки - положения ММБ звукового сигнала и амплитуды ММБ звукового сигнала, сравниваемые с эталонными биспектральными признаками фонем в соответствии с первым и вторым критериями принятия решения. Из принятых в процессе сравнения решений о распознанных фонемах на всех сегментах формируются две последовательности решений о распознанных фонемах, из которых выделяются наиболее часто встречающиеся решения (буквенные коды фонем), формирующие набор буквенных кодов фонем распознаваемого слова. При сравнении набора буквенных кодов фонем распознаваемого слова с наборами буквенных кодов фонем всех слов словаря с учетом эталонных признаков слов формируется массив значений показателей распознавания, равных количеству совпадающих буквенных кодов фонем и кодов пауз и решение о распознавании слова принимается в пользу того слова словаря, при сравнении с которым получен максимальный показатель распознавания. 8 ил. |
2296376 выдан: опубликован: 27.03.2007 |
|
СПОСОБ РАСПОЗНАВАНИЯ ФОНЕМ РЕЧИ И УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ СПОСОБА
Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. Техническим результатом является повышение точности распознавания фонем речи, достигающийся тем, что формирование признаков фонем для распознавания фонем речи основано на применении биспектрального анализа, базирующегося на преобразовании цифровых последовательностей кодов, соответствующих речевым сигналам, в биспектральную область, характеризующую взаимодействия между значениями компонентов Фурье на разных частотах в диапазоне речи, таким образом, обеспечивается выделение дополнительной, существенно новой информации из речевых сигналов, что повышает точность при распознавании фонем, а устройство, реализующее заявленный способ распознавания фонем речи, содержит: вычислительную систему, включающую тактовый генератор, контроллер, оперативное запоминающее устройство, процессор, предназначенный для формирования биспектральных признаков и распознавания на их основе фонем речи, цифроаналоговый преобразователь, долговременное запоминающее устройство, видеоконтроллер и аналого-цифровой преобразователь, а также клавиатуру, дисплей, наушники, микрофон. 2 н.п. ф-лы, 5 ил. |
2268504 выдан: опубликован: 20.01.2006 |
|
ОБНАРУЖЕНИЕ АКТИВНОСТИ СЛОЖНОГО СИГНАЛА ДЛЯ УСОВЕРШЕНСТВОВАННОЙ КЛАССИФИКАЦИИ РЕЧИ/ШУМА В АУДИОСИГНАЛЕ
Изобретение относится к системам сжатия аудиосигнала, в частности, к системам классификации речи/шума при сжатии аудиосигнала. Техническим результатом является создание способа и устройства для достоверного обнаружения наличия важной с точки зрения восприятия информации в сложных сигналах. Технический результат достигается тем что, выполняют первое определение того, содержит ли рассматриваемый аудиосигнал информацию, представляющую собой речь или шум, причем выполняют второе определение того, содержит ли аудиосигнал неречевую информацию, являющуюся важной для восприятия слушающим субъектом, и осуществляют выборочную отмену результата первого определения, соответствующего шуму, в ответ на результат второго определения, соответствующий неречевой информации, являющейся важной для восприятия слушающим субъектом. 3 с. и 17 з.п.ф-лы, 13 ил.
|
2251750 выдан: опубликован: 10.05.2005 |
|
СПОСОБ АВТОМАТИЧЕСКОЙ ИДЕНТИФИКАЦИИ ЛИЧНОСТИ Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах. Техническим результатом является повышение надежности идентификации личности. Изобретение основано на том, что в вокализованных зонах речевого сигнала выделяют временные интервалы с определенной длительностью и определяют оценки коэффициентов корреляции параметров речевого сигнала. 2 з.п.ф-лы, 4 ил. | 2161826 выдан: опубликован: 10.01.2001 |
|
СПОСОБ ОЦЕНКИ ПЕРИОДА "ЗАТЯГИВАНИЯ" В УСТРОЙСТВЕ ДЕКОДИРОВАНИЯ РЕЧЕВОГО СИГНАЛА ПРИ ПРЕРЫВИСТОЙ ПЕРЕДАЧЕ И УСТРОЙСТВО КОДИРОВАНИЯ РЕЧЕВОГО СИГНАЛА И ПРИЕМОПЕРЕДАТЧИК Изобретение касается способа ручного синхронизирования устройства кодирования речевого сигнала передающего устройства и устройства декодирования речевого сигнала приемного устройства в системе связи, использующей прерывистое передающее устройство между передающим устройством и приемным устройством. Прерывистая передача временно содержит последовательные кадровые периоды, где некоторые из периодов содержат передаваемые кадры, а некоторые периоды не содержат передачу, в силу чего способ содержит этапы вырабатывания периодов передачи информации, содержащих по меньшей мере один кадр и информацию, передаваемую пользователем на упомянутое устройство передатчика, и периодов молчания, имеющих длительность по меньшей мере одного кадрового периода и содержащих информацию, отличную от информации, передаваемой пользователем. Прерывистая передача дополнительно содержит нерегулярность появления периода (Т), содержащего по меньшей мере один кадр между периодом передачи информации и следующим периодом молчания, причем нерегулярный период образует период затягивания для определения информации, касающейся периода молчания. В соответствующем изобретению способе количество кадровых периодов подсчитывается в приемном устройстве до определенного момента, обнаруживается начало упомянутого периода молчания и на основании упомянутого подсчитанного количества кадровых периодов и начала периода молчания принимается решение, имеется ли период затягивания (Т) упомянутого типа или нет между упомянутым периодом передачи информации и периодом молчания после периода передачи информации, что и является достигаемым техническим результатом. 3 с. и 5 з.п. ф-лы, 8 ил. | 2158446 выдан: опубликован: 27.10.2000 |