Распознавание речи: ..с использованием статистических моделей, например Скрытые модели Маркова (HMM) – G10L 15/14
Патенты в данной категории
СПОСОБ МАШИННОЙ ОЦЕНКИ КАЧЕСТВА ПЕРЕДАЧИ РЕЧИ
Изобретение относится к способам анализа звуковых сигналов, передаваемых по каналам радиосвязи, телефонии и трактам переговорных устройств. Сущность способа машинной оценки качества передачи речи заключается в том, что осуществляют загрузку звукового сигнала в оперативную память компьютера, выделяют в сигнале фрагменты активной и неактивной фаз, вычисляют спектры для каждой фазы, которые разделяют на критические полосы, и рассчитывают значения спектральных параметров для каждой критической полосы, причем параметры сигнала вычисляют как в спектральной, так и во временной областях, исключают из обработки фрагменты активной фазы, соответствующие тональному набору, до деления на критические полосы, осуществляют многоуровневую психоакустическую фильтрацию спектров, полученные параметры обрабатываемого сигнала сравнивают с ассоциациями, хранящимися в базе данных, и выбирают ассоциации, наиболее близкие по всем параметрам к обрабатываемому сигналу, а оценку качества речи определяют как сумму взвешенных значений степеней близости. Технической результат - обеспечение машинной оценки речевого сигнала путем сравнения параметров обрабатываемого сигнала с моделями речи, хранящимися в базе ассоциаций. 3 з.п. ф-лы, 5 табл., 8 ил. |
2435232 патент выдан: опубликован: 27.11.2011 |
|
СПОСОБ И УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧИ
Изобретение относится к распознаванию речи. Способ распознавания речи, включающий прием кадров, содержащих выборки аудиосигнала; формирование вектора признаков, содержащего первое число компонентов вектора для каждого кадра; проецирование вектора признаков по меньшей мере на два подпространства так, что число компонент каждого проецированного вектора признаков меньше чем первое число, а общее число компонент проецированного вектора признаков равно первому числу; установление для каждого проецированного вектора набора моделей смешивания, который обеспечивает наивысшую вероятность наблюдения; и анализ набора моделей смешивания для определения результата распознавания. Когда результат распознавания найден, определяют меру достоверности результата распознавания; это определение включает определение вероятности того, что результат распознавания корректен, определение нормализующего члена и деление этой вероятности на нормализующий член. Технический результат - повышение надежности и эффективности распознавания речи. 3 н. и 11 з.п. ф-лы, 2 ил. |
2393549 патент выдан: опубликован: 27.06.2010 |
|
СПОСОБ И УСТРОЙСТВО ДЛЯ БЫСТРОГО ВЫЧИСЛЕНИЯ ВЕРОЯТНОСТЕЙ НАБЛЮДЕНИЯ ПРИ РАСПОЗНАВАНИИ РЕЧИ
Изобретение относится к распознаванию речи и, более конкретно, к способу и устройству для вычисления акустических вероятностей при распознавании речи. Техническим результатом является обеспечение возможности более полного использования преимуществ векторной обработки, повышение скорости вычисления акустических вероятностей. Указанный результат достигается за счет того, что вычисляют функции смеси плотностей с использованием команд типа "одна команда - много данных" (SIMD) для получения вектора, содержащего компоненты смеси плотностей в качестве элементов. Содержимое вектора хранится в памяти (110) и используется при распознавания речи для всего множества компонентов смеси плотностей для последовательных кадров. 4 н. и 16 з.п. ф-лы, 6 ил. |
2302666 патент выдан: опубликован: 10.07.2007 |
|
СПОСОБ И УСТРОЙСТВО ДЛЯ ДИНАМИЧЕСКОЙ РЕГУЛИРОВКИ ЛУЧА В ПОИСКЕ ПО ВИТЕРБИ
Изобретение относится к распознаванию речи и, более конкретно, к способу и устройству для динамической регулировки луча в поиске по Витерби. Его применение позволяет получить технический результат в виде повышения надежности распознавания речи. Этот результат достигается благодаря тому, что способ включает в себя выбор начальной ширины луча, выяснение того, изменяется ли значение вероятности на кадр, динамическую регулировку ширины луча, декодирование входного речевого сигнала, при этом ширина луча динамически регулируется. Также предлагается устройство, включающее в себя процессор, компонент для распознавания речи, соединенный с процессором, память соединенную с процессором. При этом компонент для распознавания речи динамически регулирует ширину луча с целью декодирования входного речевого сигнала. 6 н. и 24 з.п. ф-лы, 6 ил., 4 табл. |
2276810 патент выдан: опубликован: 20.05.2006 |
|
УСТРОЙСТВО РАСПОЗНАВАНИЯ РЕЧИ Изобретение относится к распознаванию речи. Его использование при распознавании речи, состоящей из смешанного словаря уникальных для каждого человека слов и слов общего характера, позволяет обеспечить технический результат в виде распознавания речи произвольного говорящего субъекта. Этот технический результат достигается в устройстве, содержащем средство накопления совокупности словарных обозначений, осуществляющее накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, средство извлечения последовательностей обозначений для зарегистрированных слов, осуществляющее генерацию последовательностей обозначений единичных элементов речи для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, и средство регистрации, осуществляющее запоминание последовательностей обозначений единичных элементов речи для слов общего характера из введенной речевой информации произвольных говорящих субъектов, и созданных последовательностей обозначений для зарегистрированных слов в виде параллельных совокупностей в средстве накопления совокупности словарных обозначений, причем единичные элементы речи представляют собой акустические события, генерация которых выполнена посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний. 6 с. и 6 з.п. ф-лы, 15 ил., 3 табл. | 2223554 патент выдан: опубликован: 10.02.2004 |
|