Синтезирование речи; текст для систем синтезирования речи, например речевого диапазона – G10L 13/00
Патенты в данной категории
СИСТЕМА И СПОСОБ АВТОМАТИЧЕСКОГО ХРАНЕНИЯ И ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ О ЧРЕЗВЫЧАЙНОЙ СИТУАЦИИ
Изобретение относится к области автоматического хранения и извлечения информации о чрезвычайной ситуации с использованием автомобильной компьютерной системы. Технический результат - обеспечение оптимального объема передачи информации о чрезвычайной ситуации. Автомобильная коммуникационная система может извлекать информацию «в случае чрезвычайной ситуации» (ICE) из устройства беспроводной связи. ICE информация может включать контактную информацию, медицинскую информацию и т.д., и может быть передана провайдеру службы по чрезвычайным ситуациям, если автомобильная коммуникационная система производит звонок о чрезвычайной ситуации. Информация может также извлекаться в определенный момент времени до того, как производится звонок о чрезвычайной ситуации, и сохраняться в запоминающей ячейке автомобильной коммуникационной системы. 3 н. и 14 з.п. ф-лы, 4 ил. |
2528154 выдан: опубликован: 10.09.2014 |
|
СПОСОБ ПЕРЕОЗВУЧИВАНИЯ АУДИОМАТЕРИАЛОВ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ
Способ и устройство позволяют повысить качество проведения фазы обучения, улучшить степень совпадения голоса пользователя (целевого диктора) в конвертированном речевом сигнале, обеспечить возможность одноразового проведения фазы обучения для различных аудиоматериалов. Указанный технический результат достигается тем, что в программно управляемом электронном устройстве обработки информации (ПУЭУОИ) формируют акустическую базу исходных аудиоматериалов (АБИА) и акустическую обучающую базу (АОБ). Передают данные из АБИА для отображения списка исходных аудиоматериалов на экране монитора. При выборе из списка АБИА по меньшей мере одного аудиоматериала, данные о нем передают для сохранения в ОЗУ ПУЭУОИ. Осуществляют выбор из АОБ обучающих фраз диктора файлы, которые преобразуют в звуковые фразы и передают их пользователю на устройство воспроизведения звука. Пользователь посредством микрофона воспроизводит звуковые фразы, в процессе воспроизведения которых на экране монитора отображают текст воспроизводимой фразы и курсор, перемещающийся по тексту фразы в соответствии с тем, как пользователь должен ее воспроизвести. Создают файлы в соответствии с воспроизводимыми фразами, которые сохраняют по порядку воспроизведения фраз в формируемой акустической базе целевого диктора (АБЦД). ПУЭУОИ производит контроль скорости воспроизводимой фразы и ее громкости. Формируют файл функции конверсии. Файлы АБИА, используя файл функции конверсии, конвертируют для сохранения в формируемой акустической базе конвертированных аудиоматериалов (АБКА) и предоставления пользователю данных о конвертированных аудиоматериалах на экране монитора. Устройство содержит соответствующие функциональные блоки, реализующие способ. 2 н. и 11 з.п. ф-лы, 11 ил. |
2510954 выдан: опубликован: 10.04.2014 |
|
СЕТЬ СВЯЗИ И УСТРОЙСТВА ДЛЯ ПРЕОБРАЗОВАНИЯ ТЕКСТА В РЕЧЬ И ТЕКСТА В АНИМАЦИЮ ЛИЦА
Изобретение относится к области сетей связи и устройств для приема и отправки сообщений через сети связи, а именно к предоставлению пользователю анимированного изображения лица отправителя сообщения. Технический результат заключается в снижении объема обработки изображения, производимой устройством получателя, за счет частичного анимирования изображения лица отправителя путем накладывания двумерного изображения лица на выступающий участок трехмерной сетки, а изображения волос - на плоский участок сетки. Для этого система связи содержит отправляющее устройство, приемное устройство и соединяющую их сеть. Приемное устройство содержит запоминающее устройство, которое сохраняет множество изображений голов, ассоциированных с различными отправляющими устройствами, средство приемника для приема текстовых сообщений, средство преобразования текстовых символов сообщения в звуковое сообщение и средство анимации для формирования анимированного частичного трехмерного изображения головы отправителя. Средство анимации анимирует, по меньшей мере, одну черту лица головы, причем анимация соответствует перемещениям, выполняемым головой при чтении сообщения. Дисплей отображает анимированную частичную трехмерную голову, а акустическая система выводит звуковое сообщение синхронно с отображаемой головой. 3 н. и 15 з.п. ф-лы, 12 ил. |
2488232 выдан: опубликован: 20.07.2013 |
|
УСТРОЙСТВО НА ОСНОВЕ ЛИЧНОСТИ
Изобретение относится к мобильным устройствам. Техническим результатом является расширение функциональных возможностей устройства за счет введения темы, основанной на личности, с использованием синтезированной речи, музыки и визуальных элементов. Предоставляется тема, основанная на личности. Прикладная программа запрашивает файл ресурса личности для получения указания, соответствующего личности. Затем указание принимается в механизме синтеза речи. Далее, механизм синтеза речи запрашивает базу данных шрифтов голосов личностей для получения голосового шрифта, соответствующего личности. Затем механизм синтеза речи применяет голосовой шрифт к указанию. Указание с примененным голосовым шрифтом создается в устройстве вывода. 3 н. и 16 з.п. ф-лы, 4 ил. |
2471251 выдан: опубликован: 27.12.2012 |
|
СПОСОБ АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ТЕКСТА И КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ ЭТОГО СПОСОБА
Изобретение относится к информационным технологиям, в частности к предварительной обработке текстовой информации, и может быть использовано при распознавании и синтезе речи и других технических областях, в которых требуется обработка текстовой информации средствами вычислительной техники. Техническим результатом является повышение качества, увеличение скорости обработки и уменьшение количества информационных ресурсов. Указанный результат достигается тем, что способ включает объединение слов в синтагмы с простановкой символов пауз в конце синтагм с последующим транскрибированием синтагм для получения идеальных транскрипций синтагм в терминах фонем и аллофонов. Дополнительно формируют базу данных эталонных аллофонов. Сравнивают совпадение аллофонов идеальных транскрипций синтагм с эталонными аллофонами и исключают аллофоны идеальных транскрипций синтагм, не совпадающие с эталонными аллофонами. По аллофонам идеальных транскрипций синтагм, совпадающим с эталонными аллофонами, формируют сбалансированные синтагмы текста - имеющие наибольшее число совпадений аллофонов идеальных транскрипций синтагм с эталонными аллофонами. Устройство содержит блок ввода текста, блок анализа, блок базы данных, блок представления результатов. Введены блок ввода параметров и блок формирования сбалансированных синтагм. 2 н. и 4 з.п. ф-лы, 10 ил. |
2460154 выдан: опубликован: 27.08.2012 |
|
БОРТОВОЕ УСТРОЙСТВО РЕЧЕВОГО ОПОВЕЩЕНИЯ И КОММУТАЦИИ
Изобретение относится к области приборостроения, в частности к устройствам преобразования речевых сигналов, а более конкретно к синтезаторам речевых сообщений, и может быть использовано в авиационной технике, телефонии, системах связи и оповещения, вычислительной технике. Технический результат - обеспечение возможности анализа в режиме реального времени ситуаций, возникающих в полете, и повышение надежности устройства. 1 ил. |
2432622 выдан: опубликован: 27.10.2011 |
|
УСТРОЙСТВО ДЛЯ ВЫПОЛНЕНИЯ РЕЧЕВОГО ВОСПРОИЗВЕДЕНИЯ ТЕКСТА И СПОСОБ ДЛЯ НЕГО
Изобретение относится к устройствам для выполнения речевого воспроизведения текста (TTS) в автомобильных спутниковых навигационных системах. Техническим результатом является возможность слышимого обозначения при маршрутной навигации информации, заранее определенной пользователем. Указанный технический результат достигается тем, что навигационное устройство содержит средства для цифровой обработки звуков и слышимой их передачи, память, хранящую множество данных в виде текстовых указателей и предварительно записанные звуки, средство передачи данных между процессором устройства и памятью, операционную систему для управления обработкой и потоком данных между процессором и памятью, и тем, воспроизводятся ли упомянутые звуки слышимым образом, посредством повторяемого определения физических условий, сравниваемых с опорными значениями, предусмотренными в памяти, таким образом, чтобы удовлетворение условия вызывало формирование устройством звука посредством предварительно записанных звуков, хранимых на устройстве, или звука, цифровым образом представленного программным компонентом речевого воспроизведения текста (TTS), посредством подачи в него текстового указателя, соответствующего событию, или комбинации вышеприведенного, при этом при определении события, требующего воспроизведения звука программным компонентом TTS, операционная система обращается к набору опций, выбранных или отмененных пользователем устройства во время его конфигурирования, для определения, в какой мере следует слышимым образом обозначать это событие. 4 н. и 10 з.п. ф-лы, 6 ил. |
2425330 выдан: опубликован: 27.07.2011 |
|
СПОСОБ СИНТЕЗА РЕЧИ
Изобретение в целом относится к способам синтеза речи, а в частности к компилятивным способам синтеза речи на основе текста. Техническим результатом является улучшение качества синтезируемой речи за счет точной передачи интонации. Указанный технический результат достигается тем, что выделяют в тексте по меньшей мере одну часть, определяют интонацию каждой части, ставят в соответствие каждой части целевые речевые звуки, определяют физические параметры целевых речевых звуков, находят в речевой базе речевые звуки, наиболее близкие по физическим параметрам к целевым речевым звукам, синтезируют речь в виде последовательности из найденных речевых звуков, причем физические параметры указанных целевых речевых звуков определяют в соответствии с определенной интонацией. 11 з.п. ф-лы, 1 ил. |
2421827 выдан: опубликован: 20.06.2011 |
|
УСТРОЙСТВО ДЛЯ ИЗМЕНЕНИЯ ВХОДЯЩЕГО ГОЛОСОВОГО СИГНАЛА В ВЫХОДЯЩИЙ ГОЛОСОВОЙ СИГНАЛ В СООТВЕТСТВИИ С ЦЕЛЕВЫМ ГОЛОСОВЫМ СИГНАЛОМ
Изобретение относится к радиотехнике и может быть использовано в качестве системы воспроизведения караоке. Техническим результатом является обеспечение исполнения песни голосом пользователя, но в манере и с качественным уровнем исполнения профессионального певца с минимизацией ошибок исполнения и с повышением его качества. Указанный технический результат достигается тем, что устройство содержит источник (И) входящего звукового сигнала, запоминающее устройство (ЗУ), анализирующее устройство (АУ), производящее устройство (ПУ) и синтезирующее устройство (СУ). ПУ выполнено на базе характеристического анализатора (ХА) и корректирующего процессора (КП). Введены переключатель (П) режима обучения/эксплуатации и анализатор входного сигнала (ABC). И подсоединен к входу П. ЗУ снабжено блоком фонограмм (Б). Вход/выход П подсоединен к входу/выходу ABC, а его выход - к входу Б. Первый выход данных Б подсоединен к входу ABC, а второй выход данных Б - к входу АУ. ABC выполнен обеспечивающим разложение входящего голосового сигнала на синусоидальные компоненты сигнала (С), шумовые компоненты сигнала (Ш) и остаточные компоненты сигнала (О) и выполнен с возможностью формирования наборов характеристических векторов и функций преобразования для каждой упомянутой компоненты и передачи их в ЗУ. АУ выполнено обеспечивающим разложение входящего голосового сигнала с Б на С, Ш и О. ХА и КП выполнены с возможностью обработки упомянутых компонент. 5 з.п. ф-лы, 5 ил. |
2393548 выдан: опубликован: 27.06.2010 |
|
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА
Изобретение относится к информационным технологиям, в частности к предварительной обработке текстовой информации, и может быть использовано при распознавании и синтезе речи, аннотировании баз данных, а также при автоматическом синхронном переводе с языка на язык и других областях знаний. Изобретение позволяет получить все возможные варианты транскрипций исходного текста, не прибегая к анализу звучания текста. К полученным на основе текста идеальным транскрипциям применяют правила транскрипционного моделирования, получают дополнительные варианты транскрипций, к которым также применяют правила транскрипционного моделирования. Из полученного списка транскрипций исключают одинаковые транскрипции и сохраняют оставшиеся в списке транскрипции для дальнейшего использования. 3 з.п. ф-лы, 8 ил., 2 табл. |
2386178 выдан: опубликован: 10.04.2010 |
|
СПОСОБ МИКШИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ АБОНЕНТОВ ПРИ ПРОВЕДЕНИИ VoIP-КОНФЕРЕНЦИЙ
Изобретение относится конференц-системам построенным на базе технологии передачи речи по сетям с пакетной коммутацией (VoIP). Способ заключается в том, что на VoIP сервере декодируют получаемый по сети передачи данных кодированный речевой сигнал каждого абонента, измеряют уровень громкости речевого сигнала каждого абонента, суммируют речевые сигналы, уровень громкости которых превышает заранее заданный уровень, кодируют и передают полученную сумму каждому абоненту, при передаче полученной суммы абоненту, уровень громкости речевого сигнала которого превышает заранее заданный уровень, из нее вычитают сигнал текущего абонента. Технический результат заключается в исключении возможности усиления акустического эха в конференц-системе и снижении затрат на системные ресурсы. 10 з.п. ф-лы, 3 ил. |
2341907 выдан: опубликован: 20.12.2008 |
|
ПРЕОБРАЗОВАНИЕ БУКВЫ В ЗВУК ДЛЯ СИНТЕЗИРОВАННОГО ПРОИЗНОШЕНИЯ СЕГМЕНТА ТЕКСТА
Изобретение относится к области синтезирования речи из текста. Техническим результатом заявленного изобретения является акцентирование гласных в зависимости от других соседних букв и положения в синтезируемом сегменте текста. Технический результат достигается тем, что разделяют слово, выбранное из принятой текстовой строки, на подслова, образующие последовательность подслов, в которой, по меньшей мере, одно из подслов содержит, по меньшей мере, две буквы, а каждое из возможных подслов имеет заранее определенный вес, причем для создания последовательности подслов выбирают подслова с максимальными объединенными весами; определяют фонемы для подслов при помощи таблицы идентификаторов фонем; соединяют фонемы в последовательность фонем и выполняют синтезирование речи на основе последовательности фонем. 3 з.п. ф-лы, 6 ил. |
2320026 выдан: опубликован: 20.03.2008 |
|
СПОСОБ И УСТРОЙСТВО ФОРМИРОВАНИЯ ГЛАСНЫХ ЗВУКОВ РЕЧИ ИЗ ШУМОПОДОБНЫХ ЗВУКОВ ПИЩЕВОДНОГО ГОЛОСА
Изобретение предназначено для формирования из шумоподобных звуков пищеводного голоса людей без гортани звуков, похожих на звуки голоса здоровых людей. Технический результат - преобразование шумоподобных «гласных» звуков пищеводного голоса в гласные звуки с дискретным спектром гармоник, похожие на голос здорового человека. Для этого исходный сигнал демодулируют и корректируют полученную огибающую, которую перемножают на колебание с преобразованной мгновенной частотой, из входного сигнала выделяют сигналы согласных звуков речи, низкочастотную часть частотного диапазона, которую демодулируют, и спектральные составляющие возле частоты основного тона голоса, которые усиливают, дополняют сигналом, сопряженным по Гильберту, сопряженные сигналы перемножают, сигнал, сопряженный по Гильберту и ограниченный по амплитуде, суммируют с ограниченным по амплитуде сигналом, полученным в результате перемножения, и перемножают с ограниченным по амплитуде сигналом, содержащим спектральные составляющие возле частоты основного тона голоса, сигналы согласных звуков речи и преобразованные сигналы гласных звуков речи суммируют и формируют выходной речевой сигнал. 2 н.п. ф-лы, 1 ил. |
2320025 выдан: опубликован: 20.03.2008 |
|
ИДЕНТИФИКАЦИЯ ЕСТЕСТВЕННЫХ РЕЧЕВЫХ ПАУЗ В ТЕКСТОВОЙ СТРОКЕ
Изобретение относится к области синтеза речи из текста. Техническим результатом заявленного изобретения является повышение точности выполняемой идентификации естественных речевых пауз для различных речевых паттернов на входе. Технический результат достигается тем, что проводят анализ, по меньшей мере, одного слова в текстовой строке для определения, имеется ли естественная речевая пауза, расположенная смежно с указанным словом, причем анализ основан, по меньшей мере, на одном заранее определенном пороговом значении для этого слова, при этом указанное заранее определенное пороговое значение связано с количеством слогов между этим словом и одним из двух концов текстовой строки. 5 з.п. ф-лы, 5 ил. |
2319221 выдан: опубликован: 10.03.2008 |
|
СПОСОБ КОМПИЛЯЦИОННОГО ФОНЕМНОГО СИНТЕЗА РУССКОЙ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ
Изобретение относится к речевой информатике и приборостроению для синтеза речевых сообщений по тексту в системах акустического общения человека с автоматам. Состав элементов компиляции акустической базы данных согласная-гласная (СГ-слоги) и гласная-согласная (ГС-слоги), отдельные гласные и согласные. Способы их соединения: непосредственное соединение либо микширование для фонемосочетаний вида согласная-гласная-согласная-согласная (...СГСС...) и согласная-гласная-согласная конечная (...СГСконечная). Устройство для компиляционного фонемного синтеза русской речи, содержащее текстовый процессор, соединенный с акустической базой данных и блоком формирования звукового сигнала, который соединен с блоком воспроизведения, блока формирования СГС, вход которого соединен с соответствующими выходами акустической базы данных и текстового процессора, а выход соединен с входом блока формирования звукового сигнала. Технический результат - повышение естественности речи и скорости синтеза по тексту за счет совершенствования структуры элементов компиляции и использования способа соединения их с учетом фонетических особенностей русского языка. 2 н.п. ф-лы, 2 ил. |
2298234 выдан: опубликован: 27.04.2007 |
|
СПОСОБ И СИСТЕМА ДИНАМИЧЕСКОЙ АДАПТАЦИИ СИНТЕЗАТОРА РЕЧИ ДЛЯ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ СИНТЕЗИРУЕМОЙ ИМ РЕЧИ
Изобретение относится, в частности, к способу и системе адаптации синтезатора речи с помощью поступающих в реальном масштабе времени данных. При осуществлении способа и системы динамической модификации синтезированной речи на основе вводимого текста и множества значений параметров динамического управления генерируют синтезированную речь. Далее на основе входного сигнала, характеризующего разборчивость речи воспринимающим ее слушателем, формируют поступающие в реальном масштабе времени данные, на основе которых модифицируют одно или несколько значений параметров динамического управления. Технический результат - повышение разборчивости синтезированной речи. 3 н. и 27 з.п. ф-лы, 6 ил. |
2294565 выдан: опубликован: 27.02.2007 |
|
СПОСОБ ОБНАРУЖЕНИЯ И КОРРЕКЦИИ ЛОЖНЫХ ИМПУЛЬСОВ ПРИ ПЕРЕДАЧЕ РЕЧИ МЕТОДОМ ИМПУЛЬСНО-КОДОВОЙ МОДУЛЯЦИИ Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линии связи методом ИКМ. Способ обнаружения и коррекции ложных импульсов при передаче речи методом ИКМ заключается в отслеживании идущих друг за другом повышенных сдвоенных "скачков" уровня первой производной речевого сигнала, измерении среднего модуля первой производной сигнала на протяжении этого отрезка путем накопления модулей разности двух соседних ИКМ-отсчетов сигнала и установки двух одинаковых адаптивных порогов разного знака, пропорциональных среднему модулю первой производной; обнаруживают кодовую комбинацию, содержащую ложный бит, относительный уровень двух адаптивных порогов в моменты пауз речи повышают, а коррекцию ошибочного отсчета сигнала осуществляют путем замены его предшествующим неискаженным отсчетом. Достигаемый технический результат - повышение качества приема речевых сигналов. 1 ил. | 2191434 выдан: опубликован: 20.10.2002 |
|
СПОСОБ ПРЕОБРАЗОВАНИЯ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ Использование: в средствах цифрового кодирования речевых сигналов для их комплексного представления в целях передачи и хранения. Сущность изобретения: способ преобразования речи, основанный на векторных квантовании и деквантовании, снабжен дополнительным управлением с помощью сигнала тон/шум, который используют в качестве управляющего параметра: Т/Ш, Т/Ш* соответственно. Устройство преобразования речи и варианты практической реализации блоков в составе векторного квантователя с конечным числом состояний и векторного деквантователя с конечным числом состояний, обеспечивающие дополнительное управление сигналом тон/шум в процедуре векторного квантования и деквантования, что позволяет разделить множество эталонных кодовых векторов на два подмножества, соответствующие вокализованным и невокализованным фрагментам речевого сигнала, что повышает качество синтезированного речевого сигнала без увеличения битовой скорости передачи и приводит к более точному описанию последовательности переходов речевого сигнала и, следовательно, повышению разборчивости и натуральности синтезированного речевого сигнала, в чем и состоит технический результат, достигаемый при осуществлении заявленных изобретений. 2 с. и 3 з.п.ф-лы, 10 ил. | 2166804 выдан: опубликован: 10.05.2001 |
|
УСТРОЙСТВО ОБНАРУЖЕНИЯ И КОРРЕКЦИИ АНОМАЛЬНЫХ ЦИФРОВЫХ ОШИБОК ПРИ ПЕРЕДАЧЕ РЕЧИ МЕТОДОМ ИМПУЛЬСНО-КОДОВОЙ МОДУЛЯЦИИ Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии. Техническим результатом является повышение качества приема речевых сигналов, передаваемых цифровым методом с помощью ИКМ по линиям связи с невысокой помехозащищенностью. Устройство обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции содержит первое, второе, третье и четвертое оперативные запоминающие устройства, коммутатор адресов, блок генераторов, обнаружитель цифровых ошибок, первый и второй регистры сдвига, первый, второй и третий элементы ИСКЛЮЧАЮЩЕЕ ИЛИ, вычитатель кодов, первый и второй триггеры, накапливающий сумматор, компаратор кодов, элемент И и счетчик импульсов. Коррекция аномальных цифровых ошибок при передаче речевых сигналов методом ИКМ позволяет значительно снизить требования к помехоустойчивости соединительных линий связи при неизменном субъективном качестве восприятия речи. Моделирование предложенного алгоритма на ПЭВМ показало, что выигрыш по допустимой вероятности цифровых ошибок составляет в среднем (2-3) порядка соответственно для женских и мужских голосов. 1 ил. | 2159470 выдан: опубликован: 20.11.2000 |
|
ПЕРЕДАЮЩАЯ СИСТЕМА НА ПРИНЦИПАХ РАЗЛИЧНОГО КОДИРОВАНИЯ Изобретение относится к радиотехнике и связи и может быть использовано в системах передачи и приема речевых и музыкальных сигналов. Технический результат - повышение помехоустойчивости и достоверности принимаемых сигналов. Сущность изобретения заключается в том, что в передающей системе для передачи речевых и музыкальных сигналов входной сигнал разделяется в кодере на две спектральные части. Эти спектральные части кодируются каждая своим собственным подкодером. Качество передачи может быть значительно улучшено путем кодирования спектральной части кодером во временной области и кодированием дополнительной спектральной части кодером в преобразованной области. 7 с. и 3 з.п.ф-лы, 8 ил., 3 табл. | 2144261 выдан: опубликован: 10.01.2000 |