Распознавание речи: .техника распознавания речи, специально предназначенная для крайне неблагоприятных условий окружения, например в шуме, при речи, вызванной стрессом – G10L 15/20
Патенты в данной категории
ПОВЫШЕНИЕ КАЧЕСТВА РЕЧИ С ИСПОЛЬЗОВАНИЕМ МНОЖЕСТВА ДАТЧИКОВ С ПОМОЩЬЮ МОДЕЛИ СОСТОЯНИЙ РЕЧИ
Изобретение относится к распознаванию и передаче речи, в частности к способам и устройствам для определения правдоподобия состояния речи на основании сигнала альтернативного датчика и сигнала микрофона, основанного на принципе воздушной проводимости. Техническим результатом является формирование речевого сигнала повышенного качества. Указанный технический результат достигается тем, что генерируют сигнал альтернативного датчика, причем альтернативный датчик является менее чувствительным к окружающему шуму, чем микрофон, основанный на принципе воздушной проводимости, генерируют сигнал микрофона, основанного на принципе воздушной проводимости, используют сигнал альтернативного датчика и сигнал микрофона, основанного на принципе воздушной проводимости, для оценивания правдоподобия L(St) состояния St речи, посредством оценивания отдельной составляющей правдоподобия для каждой из набора частотных составляющих и объединение отдельных составляющих правдоподобия для формирования оценки правдоподобия состояния речи, используют правдоподобие состояния речи для оценивания значения сниженного шума, которое моделирует значение сниженного шума при заданном состоянии речи. Правдоподобие состояния речи используется вместе с сигналом альтернативного датчика и сигналом микрофона, основанного на принципе воздушной проводимости, для того, чтобы оценить значение чистой речи для сигнала чистой речи. 3 н. и 10 з.п. ф-лы, 6 ил. |
2420813 патент выдан: опубликован: 10.06.2011 |
|
СПОСОБ ОЦЕНКИ ШУМА С ИСПОЛЬЗОВАНИЕМ ПОШАГОВОГО БАЙЕСОВСКОГО ИЗУЧЕНИЯ
Изобретение относится к оценке шума, в частности к оценке шума в сигналах, используемых для распознавания образов. Способ и устройство оценивают аддитивный шум в сигнале с помехами с использованием пошагового байесовского изучения, причем допускают априорное распределение изменяющегося во времени шума, и гиперпараметры (среднее значение и дисперсию) рекурсивно корректируют с использованием аппроксимации для апостериорного шума, вычисленной на предыдущем этапе времени. Аддитивный шум во временной области представляют в области логарифмического спектра или кепстра перед применением пошагового байесовского изучения. Результаты обеих оценок среднего значения и дисперсии для шума для каждого из отдельных кадров используют для выполнения расширения признаков речи в той же самой области логарифмического спектра или кепстра. Технический результат - повышение эффективности оценки шума в сигналах при распознавании образов. 5 н. и 15 з.п. ф-лы, 4 ил. |
2370831 патент выдан: опубликован: 20.10.2009 |
|
СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД УПРАВЛЕНИЯ
Изобретение относится к анализу речи в неблагоприятных условиях окружения. Его использование, например, в условиях движущегося транспортного средства или в условиях механического производства с высоким уровнем шумности обеспечивает технический результат в виде устойчивого распознавания команд независимо от особенностей произношения дикторов, а также сокращение объема памяти. Этот результат достигается благодаря тому, что в процессе преобразования речевой команды непрерывно заполняют первый кольцевой буфер оцифрованным сигналом, применяют гребенку рекурсивных фильтров к многократно прореженному сигналу и заполняют спектральными компонентами второй кольцевой буфер, определяют в нем границы речевого фрагмента на основе адаптивной оценки шумового окружения, переводят спектральные компоненты речевого фрагмента в линейный буфер анализа, получают из него сокращенное признаковое пространство и сравнивают полученные спектральные компоненты с векторами эталонов команд базы данных. 6 з.п.ф-лы, 2 ил. |
2271578 патент выдан: опубликован: 10.03.2006 |
|
УСТРОЙСТВО РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД В УСЛОВИЯХ ШУМОВ
Изобретение относится к радиотехнике. Технический результат заключается в повышении вероятности правильного распознавания команды в условиях шумов. Сущность изобретения заключается в том, что в устройство, содержащее блок определения начала и конца команды (БОНиКК), первый блок памяти (БП), блок сегментации на слоги (БСнС), блок нормирования команды по времени (БНКпВ), блок эталонных команд (БЭК) и вычислитель схожести команд (ВСК), причем выход БОНиКК соединен с первыми входами первого БП и БСнС, выход первого БП подключен к первому входу БНКпВ, второй вход которого соединен с выходом БСнС, дополнительно введены вход опорного шума (ОШ), второй БП, блок нормирования шума по времени (БНШпВ), первый и второй блоки нормирования по уровню (БНпУ) и смеситель сигналов (СС), при этом вход речевой команды соединен с входом БОНиКК и со вторыми входами БСнС и первого БП, вход ОШ подключен к первому входу второго БП, ко второму входу которого подключен выход БОНиКК, выход второго БП подсоединен к первому входу БНШпВ, выход БСнС подключен ко вторым входам БНШпВ, первого и второго БНпУ, БЭК и третьим входам первого и второго БП, выход БНШпВ подсоединен к первому входу СС, ко второму входу которого подсоединен выход БЭК, первый вход которого подключен к первому выходу ВСК, выход СС подсоединен к первому входу второго БНпУ, выход которого соединен со вторым входом ВСК, к первому входу которого подключен выход первого БНпУ, первый вход которого соединен с выходом БНКпВ. 6 ил. |
2267820 патент выдан: опубликован: 10.01.2006 |
|
СИСТЕМА АДАПТИВНОЙ ФИЛЬТРАЦИИ АУДИОСИГНАЛОВ ДЛЯ УЛУЧШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ ПРИ НАЛИЧИИ ШУМА Изобретение относится к передаче речи. Его использование в переносных цифровых радиотелефонах позволяет получить технический результат в виде повышения разборчивости речи. Способ реализуется в устройстве для селективного видоизменения кадра цифрового сигнала, образованного множеством последовательных кадров, когда цифровой сигнал представляет поступивший на передатчик аудиосигнал, образованный речевой и/или шумовой составляющими. Технический результат достигается благодаря тому, что в устройстве для селективного видоизменения кадра цифрового сигнала введены: устройство оценки уровня энергии, детектор речевой составляющей, устройство оценки шума, работающее, когда детектор речевой составляющей определяет, что речевая составляющая не формирует части кадра, справочную таблицу, содержащую множество вводов, при этом каждый ввод снабжен индексом, указывающим на уровень оценок шума, и фильтр для приема кадра цифрового сигнала, характеристики которого могут отбираться по вводу справочной таблицы, к которой было обращение, а ввод соответствует обновленной оценке шума, полученной устройством оценки шума. 2 с. и 8 з.п.ф-лы, 12 ил. | 2163032 патент выдан: опубликован: 10.02.2001 |
|
СПОСОБ И УСТРОЙСТВО ВОКОДИРОВАНИЯ ПЕРЕМЕННОЙ СКОРОСТИ ПРИ ПОНИЖЕННОЙ СКОРОСТИ КОДИРОВАНИЯ Изобретение относится к системе связи и предназначено для выполнения кодирования с линейным предсказанием, возбуждаемого кодом переменной скорости. Технический результат - обеспечение оптимизированного выбора режима кодирования для эффективного кодирования скорости входного речевого сигнала. Логическая схема 14 определения скорости выбирает скорость, при которой осуществляется кодирование речевого сигнала. Выбор скорости основан на согласующемся по заданному значению сигнал/шум, определенному элементом 12 определения режимов, нормализованной функции автокорреляции, вычисленной элементом 4 вычисления нормализованной автокорреляции, отсчете пересечений нулевого уровня, определенном счетчиком пересечений нулевого уровня 6, прогнозируемом дифференциале усиления, вычисляемом вычислительным элементом 8 прогнозируемого дифференциала усиления и энергетическом дифференциале между кадрами, вычисляемом элементом вычисления энергетического дифференциала кадров 10. 4 c. и 18 з.п. ф-лы, 2 ил. | 2146394 патент выдан: опубликован: 10.03.2000 |
|