способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы

Классы МПК:	G06F17/28 обработка или перевод текстов на естественном языке G10L15/06 создание эталонных шаблонов; обучение систем распознавания речи, например по характеристикам голоса говорящего
Автор(ы):	Низиенко Юрий Константинович (RU), Белиловский Виктор Абрамович (RU)
Патентообладатель(и):	Низиенко Юрий Константинович (RU), Белиловский Виктор Абрамович (RU)
Приоритеты:	подача заявки: 2008-09-19 публикация патента: 20.05.2011

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй. Техническим результатом является повышение точности преобразования входящего в передающий терминал аудиосигнала в речевой форме в кодированную текстовую форму на входном языке при обеспечении возможности применения в данном терминале запоминающего устройства с относительно небольшим объемом памяти. Технический результат достигается за счет следующего. Процесс электронного перевода кодовой формы текста (КФТ) на входном языке в КФТ на выходном языке организуют в два этапа. На первом этапе обеспечивают преобразования КФТ на входном языке в КФТ на промежуточном языке. На втором этапе обеспечивают преобразования КФТ на промежуточном языке в КФТ на выходном языке. При этом перевод текста в текст организуют как машинный поиск отдельных словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящихся в мобильной сети, например, «Интернет». Базу данных переводов мобильной сети постоянно пополняют посредством того, что текстовые формы, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляют в открытый доступ и предлагают для перевода, например, на коммерческой основе профессиональным переводчикам. Кроме того, перед началом использования терминала связи на нем однократно осуществляют верификацию речи владельца терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи. 5 з.п. ф-лы, 4 ил.

способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, патент № 2419142

Формула изобретения

1. Способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной системы, функционально являющегося передающим, вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; программно осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; программно обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, отличающийся тем, что процесс электронного перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организуют в два этапа; причем на первом этапе, который осуществляют посредством терминала связи, функционально являющегося передающим, обеспечивают преобразования кодовой формы текста на входном языке в кодовую форму текста на втором промежуточном языке, преимущественно английском; на втором этапе, который осуществляют посредством терминала связи, функционально являющегося принимающим, обеспечивают преобразования кодовой формы текста на втором промежуточном языке в кодовую форму текста на выходном языке; при этом перевод текста в текст как на первом, так и на втором из вышеуказанных этапов организуют как машинный поиск отдельных словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящимися в мобильной сети, например «Интернет»; кроме того, упомянутую базу данных переводов мобильной сети постоянно пополняют преимущественно в интерактивном режиме посредством того, что текстовые формы в виде отдельных словосочетаний, предложений или групп предложений, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляют с учетом частоты их использования в открытый доступ и предлагают для перевода, например, на коммерческой основе профессиональным переводчикам; а также перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи, для чего программным путем осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого терминала для обеспечения их программной адаптации относительно эталонных фонемов, заложенных в базе данных этого терминала.

2. Способ по п.1, отличающийся тем, что верификацию устной речи владельца терминала связи осуществляют следующим образом: владелец озвучивает заложенный в программу и/или произвольный текст; озвученный и введенный в запоминающее устройство терминала связи аналоговый аудиосигнал в речевой форме программным путем анализируют по характерным акустико-лингвистическим признакам и программно адаптируют их применительно к эталонному текстовому аналогу речи - фонему, заложенному в базе данных этого терминала; сохраняют информацию об отсутствующих в эталонной базе данных терминала характерных акустико-лингвистических признаках владельца; затем владелец озвучивает произвольный текст и проверяет его письменную форму, отображаемую на дисплее терминала связи; после чего осуществляют зацикливание этих двух методов верификации речи владельца в операционной системе терминала, для чего владелец терминала озвучивает текст с дисплея терминала связи, аналоговую версию которого программно преобразуют в письменную форму и сравнивают с исходным текстом на дисплее; при совпадении первоначального и полученного из аналоговой версии произнесенного владельцем текста процесс верификации данного текста завершается; при несовпадении указанных текстов программно обеспечивают переход к следующему тексту для верификации, заложенному в памяти этого терминала связи, и дублируют вышеописанный процесс верификации.

3. Способ по п.1, отличающийся тем, что в качестве передающего и принимающего терминала функционально используют один и тот же терминал связи.

4. Способ по п.1, отличающийся тем, что в качестве передающего и принимающего терминала функционально используют пространственно удаленные один от другого конструктивно идентичные терминалы связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».

5. Способ по п.1, отличающийся тем, что в качестве терминала связи используют мобильное электронное устройство, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».

6. Способ по п.1, отличающийся тем, что в качестве терминала связи используют мобильное электронное устройство, преимущественно персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».

Описание изобретения к патенту

Настоящее изобретение относится к области электроники, в частности к способам и системам (устройствам) для перевода фраз с первого языка на второй, в частности, но не исключительно, к таким системам, которые вырабатывают речевой аудиосигнал на выходе (на выходном, языке) из речевого аудиосигнала на входе (на входном, языке).

Длительное время идет поиск электронной системы, которая могла бы в автоматическом режиме осуществлять синхронный перевод, в частности устный, с одного языка на другой. Однако несмотря на огромные успехи в современном уровне развития вычислительной техники (в частности, средств и методов распознавания и синтеза речи за последние годы) такие системы обладают существенными недостатками в области верификации речи владельца передающего мобильного терминала и, как следствие, в части достоверности передаваемой информации после ее перевода и озвучивания на выходе принимающего терминала.

В области автоматического электронного перевода текста на первом языке в текст на втором языке были проведены интенсивные исследовательские работы с применением современных вычислительных систем и программного обеспечения. Однако помимо очень ограниченных применений (например, перевод прогнозов погоды) ранее отсутствовали электронные системы синхронного перевода речи с первого языка на второй, способные автоматически в режиме реального времени осуществлять точные переводы и, следовательно, заменять профессиональных переводчиков. Как правило, проблемы перевода речи усугубляются ошибками в распознавании речи (т.е. ее верификации) на основе дополнительной информации для верификации, содержащейся в акустико-лингвистических особенностях речи, характерных для каждого индивидуума (абонента связи).

Существующие пакеты автоматического электронного перевода текстов по тем или иным причинам неэффективны и не отвечают требованиям, предъявляемым к системам речевого перевода. Большая часть таких пакетов разработана в помощь профессиональным переводчикам и результат работы таких пакетов должен быть отредактирован, прежде чем он примет приемлемый вид на том языке, на который осуществляется перевод. Большинство таких пакетов является диалоговыми или интерактивными и работают в относительно медленном режиме пакетной обработки и ни один из них не способен работать в реальном масштабе времени с речевым вводом информации.

Кроме того, пакеты программ, использующиеся для текстового перевода, неподвижны, поскольку идиомы и другие исключения из правил вполне могут вызвать ошибку на выходе, т.е. пользователь не имеет полной гарантии, что полученный текст переведен правильно. Существующие системы, кроме того, весьма интенсивно используют центральный процессор, что делает их дорогими в эксплуатации и, следовательно, недоступными для широкого круга индивидуальных абонентов сетей мобильной связи.

Из уровня техники известен способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной системы (функционально являющегося передающим) вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим (RU № 2070734, 1996 г.).

Из уровня техники также известна электронная приемопередающая система с функцией синхронного перевода фраз из нескольких слов с одного языка на другой, включающая приемопередающую структуру входящего аналогового аудиосигнала в речевой форме на одном языке в выходящий аналоговый аудиосигнал в речевой форме на другом языке, которая содержит: энергонезависимое запоминающее устройство (преимущественно флэш-память); средства ввода речевой формы аналогового аудиосигнала на входном языке в передающий терминал связи упомянутой структуры; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через принимающий терминал связи (RU № 2070734, 1996 г.).

К недостаткам данных известных из уровня техники решений (как в отношении объекта изобретения «способ», так и в отношении объекта изобретения «устройство») следует отнести относительно низкие функциональные и технические характеристики, вследствие значительных погрешностей преобразования речевой формы вводимого в передающий терминал аудиосигнала в кодовую текстовую форму.

В качестве еще одного недостатка данных известных из уровня техники решений целесообразно отметить необходимость оснащения передающего терминала (при передачи информации на удаленный, принимающий терминал) запоминающим устройством с достаточно большим объемом памяти, в особенности при осуществлении приемопередачи с одного входного языка на несколько выходных языков, поскольку весь процесс текстового перевода с одного языка (входного) на другой (выходной) осуществляется в пределах операционной системы (микропроцессора) передающего терминала, вследствие чего в памяти данного терминала должна содержаться расширенная номенклатура словарей, в том числе и для редко используемых языков, например хинди.

Таким образом, основным техническим результатом, реализуемым посредством заявленных изобретений, является повышение точности преобразования входящего в передающий терминал аудиосигнала в речевой форме в кодированную текстовую форму на входном языке при обеспечении возможности применения в данном терминале запоминающего устройства с относительно небольшим объемом памяти, за счет необходимости перевода кодовой текстовой формы входного аудиосигнала всегда на один и тот же промежуточный английский язык.

Указанный технический результат в отношении объекта изобретения «способ» достигается посредством того, что в способе организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной приемопередающей системы, функционально являющегося передающим, вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; программно осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; программно обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, согласно изобретению в качестве электронной приемопередающей системы используют структуру с, по меньшей мере, двумя независимыми структурно идентичными терминалами связи; процесс электронного перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организуют в два этапа; причем на первом этапе, который осуществляют посредством терминала связи, функционально являющегося в данный момент времени передающим, обеспечивают преобразования кодовой формы текста на входном языке в кодовую форму текста на промежуточном английском языке; на втором этапе, который осуществляют посредством терминала связи, функционально являющегося в данный момент времени принимающим, обеспечивают преобразования кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном языке; причем перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи, для чего программным путем осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого терминала для обеспечения их программной адаптации относительно эталонных фонемов, заложенных в базе данных этого терминала.

В качестве передающего и принимающего терминалов функционально используют пространственно удаленные один от другого структурно идентичные терминалы связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».

Технический результат в отношении объекта изобретения «устройство» достигается посредством того, что в электронной приемопередающей системе с функцией синхронного перевода устной речи с одного языка на другой, включающую приемопередающую структуру входящего аналогового аудиосигнала в речевой форме на одном языке в выходящий аналоговый аудиосигнал в речевой форме на другом языке, которая содержит: энергонезависимое запоминающее устройство; средства ввода речевой формы аналогового аудиосигнала на входном языке в передающий терминал связи упомянутой структуры; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала сигнала на выходном языке через принимающий терминал связи, согласно изобретению приемопередающая структура включает, по меньшей мере, два независимых, пространственно удаленных, структурно идентичных терминала связи; структура терминала связи, функционально являющегося передающим, оснащена средством верификации устной речи владельца терминала относительно ее письменной формы, программно структурируемой посредством данного терминала; структура системы перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организована двухуровневой; причем первый уровень оснащен средством перевода кодовой формы текста на входном языке в кодовую форму текста на промежуточном английском языке, а второй уровень - средством перевода кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном языке.

Проведенный заявителем анализ уровня техники, включающий поиск по патентным и научно-техническим источникам информации и выявление источников, содержащих сведения об аналогах заявленных изобретений, позволил установить, что не обнаружены аналоги, характеризующиеся признаками и связями между ними, идентичными всем существенным признакам заявленных технических решений, а выбранный из выявленных аналогов прототип, как наиболее близкий по совокупности признаков аналог, позволил выявить совокупность существенных (по отношению к усматриваемому заявителем техническому результату) отличительных признаков в заявленных объектах изобретения, изложенных в формуле изобретения.

Следовательно, заявленные технические решения соответствуют условию патентоспособности «новизна» по действующему законодательству.

Для проверки соответствия заявленных изобретений требованию условию патентоспособности «изобретательский уровень» заявитель провел дополнительный поиск известных технических решений с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленных изобретений, результаты которого показывают, что заявленные изобретения не следует для специалиста явным образом из известного уровня техники, поскольку из уровня техники, определенного заявителем, не выявлено влияние предусматриваемых существенными признаками заявленных изобретений преобразований на достижение усматриваемого заявителем технического результата.

В частности, заявленными изобретениями не предусматриваются следующие преобразования известных объектов-прототипов:

- дополнение известного объекта каким-либо известным признаком, присоединяемым к нему по известным правилам, для достижения технического результата, в отношении которого установлено влияние именно таких дополнений;

- замена какого-либо признака известного объекта другим известным признаком для достижения технического результата, в отношении которого установлено влияние именно такой замены;

- исключение какого-либо признака известного объекта с одновременным исключением обусловленной наличием этого признака функции и достижением при этом обычного для такого исключения результата;

- увеличение количества однотипных признаков в известном объекте для усиления технического результата, обусловленного наличием в объекте именно таких признаков;

- выполнение известного объекта или его части из известного материала для достижения технического результата, обусловленного известными свойствами материала;

- создание объекта, включающего известные признаки, выбор которых и связь между ними осуществлены на основании известных правил и достигаемый при этом технический результат обусловлен только известными свойствами признаков этого объекта и связей между ними.

Следовательно, заявленные изобретения соответствует требованию условия патентоспособности «изобретательский уровень» по действующему законодательству.

Изобретения поясняется чертежами.

Фиг.1 - блок-схема 1-го терминала связи, функционирующего в режиме приема-передачи в паре со 2-м пространственно удаленным терминалом связи (тонкими линиями с прозрачными стрелками условно продублирован входящий со 2-го терминала канал связи).

Фиг.2 - блок-схема 2-го терминала связи, функционирующего в режиме приема-передачи в паре с 1-м пространственно удаленным терминалом связи.

Фиг.3 - алгоритм функционирования системы (средства) верификации устной речи владельца терминала.

Фиг.4 - алгоритм функционирования электронной приемопередающей системы с пространственно удаленными 1-м и 2-м структурно аналогичными терминалами связи.

На чертежах некоторые существенные блоки и средства коммуникации (такие как кнопочная панель, аккумулятор, флеш-накопитель /флеш-память/, цифровой микропроцессор и др.) условно не показаны, поскольку они являются общеизвестными и их функциональная принадлежность к рассматриваемым приемопередающим системам неоспорима, к тому же они не являются принципиальными объектами заявленных изобретений (см., например, RU № 2324296 C1).

На чертежах пунктиром условно изображены блоки и коммутационные связи, не являющиеся функционально необходимыми в рамках реализации настоящих изобретений.

На чертежах функциональные блоки, средства и системы обозначены следующими позициями:

1 - 1-й терминал связи;

2 - средство речевого ввода информации на 1-м, входном, языке (для 1-го терминала 1 связи);

3 - средство верификации речи на 1-м, входном, языке (для 1-го терминала 1 связи);

4 - средство распознавания речи на 1-м, входном, языке (для 1-го терминала 1 связи);

5 - устройство запоминающее (для 1-го терминала 1 связи);

6 - средство текстового перевода с 1-го языка (входного) на 2-й язык (промежуточный) - (для 1-го терминала 1 связи);

7 - преобразователь тексто-речевой для 1-го, входного, языка (для 1-го терминала 1 связи);

8 - синтезатор речи на 1-м, входном, языке (для 1-го терминала 1 связи);

9 - динамик (выход на 1-м, входном, языке для 1-го терминала 1 связи);

10 - средство альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);

11 - средство подтверждения альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);

12 - средство подтверждения речевого ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);

13 - 2-й терминал связи;

14 - средство речевого ввода информации на 3-м, выходном, языке (для 2-го терминала 13 связи)

15 - средство верификации речи на 3-м, выходном, языке (для 2-го терминала 13 связи);

16 - средство распознавания речи на 3-м, выходном, языке (для 2-го терминала 13 связи);

17 - запоминающее устройство (для 2-го терминала 13 связи);

18 - средство текстового перевода с 3-го (выходного) языка на 2-й (промежуточный) язык (для 2-го терминала 13 связи);

19 - преобразователь тексто-речевой (для 2-го терминала 13 связи);

20 - синтезатор речи на 3-м, выходном, языке (для 2-го терминала 13 связи);

21 - динамик (выход на 3-м языке, выходном, для 2-го терминала 13 связи);

22 - средство альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);

23 - средство подтверждения альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);

24 - средство подтверждения речевого ввода на 3-м, выходном, языке (для 2-го терминала 13 связи);

25 - средство альтернативного вывода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);

26 - микрофон.

Заявленный способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы характеризуется следующими необходимыми и достаточными (существенными) признаками.

Согласно заявленному способу в запоминающее устройство 5 (фиг.1), коммутационно связанное с аналого-цифровым преобразователем /АЦП/ 1-го терминала 1 связи электронной системы (функционально являющегося в данном рассмотрении - передающим), вводят входящий аналоговый аудиосигнал в речевой форме на входном языке. Затем посредством АЦП осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на 1-м, входном, языке, В процессе обмена информационными кодовыми сигналами (в текстовой форме) между 1-м терминалом 1 связи и вторым (принимающим) терминалом 13 обеспечивают электронный перевод кодовой текстовой формы на 1-м, входном, языке передающего 1-го терминала 1 в кодовую текстовую форму на 3-м, выходном, языке 2-го (принимающего) терминала 13. На конечном этапе приемопередачи преобразуют кодовую форму текста на 3-м, выходном, языке 2-го терминала 13 в аналоговый аудиосигнал в речевой форме на 3-м, выходном, языке этого 2-го терминала 13 (фиг.2), посредством синтезатора 20 речи и выводят речевую форму аналогового аудиосигнала на 3-м, выходном, языке через динамик 21 2-го терминала 13 связи (функционально являющегося, в рассматриваемом случае - принимающим).

Отличительными особенностями заявленного способа является следующее.

В качестве приемопередающей системы используют структуру с, по меньшей мере, двумя независимыми, структурно идентичными терминалами 1 и 13 связи.

Процесс электронного перевода кодовой формы текста на 1-м, входном, языке в кодовую форму текста на 3-м, выходном языке организуют в два этапа:

- на первом этапе (который осуществляют посредством терминала связи функционально являющегося в данный момент времени передающим) обеспечивают преобразования кодовой формы текста на входном (родном для владельца данного терминала) языке в кодовую форму текста на промежуточном английском языке;

- на втором этапе (который осуществляют посредством терминала связи, функционально являющегося в данный момент времени принимающим) обеспечивают преобразования кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном (родном для владельца данного терминала) языке.

Причем, перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи. Для этого осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого (передающего) терминала для осуществления программной адаптации их относительно эталонных фонемов, заложенных в базе данных этого (передающего) терминала.

Система автоматического перевода речь в речь структурно похожа на процесс профессионального перевода кинофильма. Так, вначале речь на языке оригинала переводят в текстовую форму также на языке оригинала, данный текст переводят в текстовую форму на языке проката фильма и затем актеры (носители языка проката фильма) озвучивают этот текст.

Совершенно очевидно, что процессы кодовых текстовых переводов согласно настоящему изобретению можно осуществлять и с использованием соответствующих баз данных из глобальной мировой сети «Интернет». Алгоритм подобной виртуальной коммутации терминала связи с упомянутыми базами данных широко известен, см., например, RU № 2324296 С1.

В программном плане такие части процесса, как преобразование речи в текст и текста в речь, в настоящее время достаточно развиты для коммерческого применения, постоянно совершенствуются и могут использоваться как готовые блоки программы переводчика.

Основная трудность программы заключается в переводе текста в текст.

В предпочтительном варианте целесообразно организовать перевод текста в текст как машинный поиск групп предложений или отдельных предложений из базы переводов, выполненных профессиональными переводчиками и хранящимися в сети «Интернет». При этом для постоянного пополнения соответствующей базы переводов предложения, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляются с учетом их частотности в открытый доступ и могут предлагаться, например, для перевода на коммерческой основе переводчикам.

При такой организации процесса перевод текста в текст будет выполнять целая армия переводчиков, связанная с пользователем сетью «Интернет», а электронно-вычислительная машина будет лишь проводить выбор соответствующего текста из базы заранее выполненных переводов. Предполагается наличие обратной связи пользователя с переводчиками, т.е. при неудовлетворительном переводе пользователь простым нажатием кнопки может послать соответствующую информацию в базу переводов.

В этом случае полнота базы переводов, их качество и скорость пополнения базы будут в основном зависеть от качества организации структуры Интернет-переводчиков, мотивации их активности и т.д.

В дальнейшем, по мере развития техники база переводов и программа-поисковик в каком-то виде при необходимости смогут храниться и автономно в мобильном терминале (телефоне) с функцией синхронного перевода «речь в речь».

В рамках настоящей заявки целесообразно раскрыть технический смысл терминов «процесс распознавания» и «процесс верификации» применительно к цифровой электронной технике (в частности, микропроцессорам, используемым в мобильных телефонных аппаратах /терминалах/ связи).

«Процесс распознавания» - процесс обработки системой (средством) распознавания введенного в компьютер некоего аудиосигнала, например, речевого с характерными акустико-лингвистическими признаками, в результате чего система распознавания приписывает этому аудиосигналу и/или его характерным признакам программный (компьютерный) идентификационный код.

«Процесс верификации» - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой сличение (определение адекватности) компьютерных кодов (символов) с аудиосигналом (например, в речевой форме) и/или с его характерными акустико-лингвистическими признаками, введенными в электронное устройство (например, компьютер, аппарат мобильной связи и т.п.).

Разумно верификацию устной речи владельца терминалов 1 и 13 связи осуществлять следующим образом:

- владелец озвучивает заложенный в программу и/или произвольный текст;

- озвученный и введенный в запоминающее устройство 5, 17 соответствующего терминала связи аналоговый сигнал в речевой форме анализируют по характерным акустико-лингвистическим признакам и программно адаптируют их применительно к эталонному текстовому аналогу речи, заложенному в памяти (базе данных) этого терминала;

- сохраняют информацию об отсутствующих в эталонной базе данных терминала характерных акустико-лингвистических признаках владельца;

- затем владелец озвучивает произвольный текст и проверяет его письменную форму, отображаемую на дисплее терминала связи;

- после чего осуществляют зацикливание этих двух методов верификации речи владельца между собой в операционной системе терминала, для чего владелец терминала озвучивает текст с дисплея терминала связи, аналоговую версию которого программно преобразуют в письменную форму и сравнивают с исходным текстом на дисплее;

- при совпадении первоначального и полученного из аналоговой версии произнесенного владельцем текста процесс верификации данного текста завершается;

- при несовпадении указанных текстов программно обеспечивают переход к следующему тексту для верификации, заложенному в памяти этого терминала связи, и дублируют вышеописанный процесс верификации.

Совершенно очевидно, что процесс верификации в заявленных изобретениях можно осуществлять и иными известными из уровня техники методами и средствами (см., например, патенты RU № 2200369 и № 2166207).

В качестве передающего и принимающего терминала 1 или 13 можно функционально использовать пространственно удаленные один от другого структурно идентичные терминалы 1 и 13 связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».

В качестве терминала 1 или 13 связи допустимо использовать мобильное электронное устройство, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».

В качестве терминала 1 или 13 связи допустимо также использовать мобильное электронное устройство, преимущественно, персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».

Оптимально, чтобы в передающей и принимающей структурах каждого терминала были бы предусмотрены дополнительные альтернативные средства ввода-вывода передаваемой информации в текстовой форме на соответствующих языках.

То есть структура терминалов 1 и 13 может быть дополнительно оснащена такими функциональными средствами, как: средство 10 альтернативного ввода информации в виде текста на 1-м, входном языке; средство 11 подтверждения альтернативного ввода информации в виде текста на 1-м, входном языке; средство подтверждения речевого ввода информации в виде речи на 1-м, входном языке; средство 25 альтернативного вывода информации в виде текста на 3-м, выходном, языке.

Одним из конкретных частных приложений технической реализации заявленного способа является электронная приемопередающая система с функцией синхронного перевода устной речи с одного языка на другой между, по меньшей мере, двумя независимыми, пространственно удаленными, структурно идентичными 1-м терминалом 1 и вторым терминалом 13 (фиг.1 и 2).

Данная система включает, по меньшей мере, два приемопередающих терминала 1 и 13 связи входящего аналогового аудиосигнала в речевой форме, каждый из которых содержит, соответственно: запоминающее устройство 5 (фиг.1) и 17 (фиг.2) с энергонезависимой памятью, преимущественно, флэш-памятью; средства 2 (фиг.1) и 14 (фиг.2) речевого ввода (с использованием микрофона 26) аналогового аудиосигнала в речевой форме на 1-м, входном (фиг.1) или 3-м, выходном (фиг.2) языке в соответствующий терминал 1 и 13 связи, функционально являющийся передающим; аналого-цифровой преобразователь (АЦП) для обработки речевой формы аналогового аудиосигнала (входящего через микрофон 26) в кодовую текстовую форму на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2); программно-организованную систему перевода кодовой формы текста на 1-м, входном, языке или на 3-м, выходном, языке в кодовую форму текста на 3-м, выходном, языке или на 1-м, входном, языке, соответственно; тексто-речевой преобразователь 7 (фиг.1) и 19 (фиг.2), функционально являющийся средством цифро-аналогового преобразования (ЦАП) и обработки текста на 3-м, выходном, языке (фиг.2) или на 1-м, входном, языке (фиг.1), соответственно, в аналоговый аудиосигнал в речевой форме; а также средства вывода речевой формы аналогового аудиосигнала на 1-м, входном, языке (фиг.1) или 3-м, выходном, языке (фиг.2), соответственно, через терминал связи 1 и 13, функционально являющийся на данный момент принимающим, с использованием синтезатора речи 8 и 20 на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2), соответственно.

Терминал связи 1 или 13, функционально являющийся передающим, оснащен средством 3 (фиг.1) и 15 (фиг.12 верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала 1 и 13 связи). Структура системы перевода программно организованной кодовой формы текста на 1-м, входном, языке в текст на 3-м, выходном, языке и текста на 3-м, выходном, языке в текст на 1-м, входном, языке организована двухуровневой. Причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на 1-м, входном, языке (фиг.1) или кодовой формы текста на 3-м, выходном, языке (фиг.2) в кодовую форму текста на общепринятом в мировой практике 2-м, промежуточном английском языке; а второй уровень входит в состав терминала связи, функционально являющегося на данный момент времени принимающим и оснащен средством преобразования кодовой формы текста на 2-м, промежуточном английском языке в кодовую форму текста на 3-м (фиг.2), выходном, языке или в кодовую форму текста на 1-м, входном, языке (фиг.1).

В электронной приемопередающей системе в качестве передающего и принимающего терминала 1 и 13 функционально могут использоваться два и более пространственно удаленных один от другого структурно идентичных терминала связи (фиг.1 и 2), виртуально скоммутированных посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет». В данном случае система функционирует как приемо-передатчик между удаленными абонентами связи с функцией синхронного перевода и ввода-вывода информации в речевой форме.

Структура электронной приемопередающей системы может предусматривать в передающем и принимающем терминалах дополнительные альтернативные средства 10, 11, 12 и 22, 23, 24 и 25 ввода-вывода информации в текстовой и/или речевой форме на соответствующих языках.

В электронной приемопередающей системе в качестве терминалов 1 и 13 связи могут быть использованы мобильные электронные устройства (преимущественно сотовый мобильный телефон), адаптированные к глобальной системе мобильной связи стандарта GSM и сети «Интернет».

В электронной приемопередающей системе в качестве терминалов 1 и 13 связи могут быть использованы мобильные электронные устройства (преимущественно персональный компьютер типа «ноутбук»), адаптированные к сети «Интернет».

Алгоритмы программной организации соответствующих структур рассматриваемых технических решений представлены на фиг.3 и 4.

Таким образом, согласно настоящим изобретениям обеспечивается возможность исключения наиболее проблемных средств (блоков) системы синхронного перевода («речь в речь»).

А именно исключены средства распознавания родной, но акустико-лингвистически озвученной различными (носителями родного языка) индивидами речи, и особенно чужой разноязычной и разновариантной (с акустико-лингвистической точки зрения) речи.

Взамен этого в каждом индивидуальном терминале связи предусмотрен блок верификации речи владельца, т.е. однократно настраиваемое владельцем и программно адаптируемое к эталонным данным (т.е. исходной базе данных, заложенной в энергонезависимую флеш-память) программно реализуемое средство преобразования устной речи владельца терминала в кодовую письменную форму (текст).

Средства перевода «текст в текст» достаточно хорошо известны из современного уровня техники, промышленно реализованы с высокой степенью достоверности электронной версии перевода и интенсивно развиваются на современном этапе развития электронной техники (например, система «Travados», система машинного (электронного) перевода «Promt»).

Системы озвучивания различных кодовых электронных текстов на различных языках также достаточно хорошо развиты. Таким образом, в заявленной архитектуре перевода снимается основная на сегодняшний день проблема в автоматизации процесса электронного синхронного перевода «речь в речь» и взамен предлагается архитектура перевода, основанная на использовании сравнительно простых и достаточно эффективно действующих на сегодняшний день унифицированных электронных блоков (функциональных средств).

Процесс осуществления всех переводов через один промежуточный английский язык, в целом существенно упрощает разработку задачи перевода, т.к. исключается разработка специальных программируемых средств и программного обеспечения для осуществления перекрестных переводов, обеспечивающих множественную комбинаторику совокупности различных языков и языковых диалектов.

Таким образом, согласно настоящим изобретениям для осуществления кодированного текста с одного языка на другой в соответствующем терминале связи для приемопередачи кодированной текстовой информации на множестве различных языков необходимо иметь для любого языка (из упомянутого множества) программный блок (программируемое средство) текстового перевода входящего (первого) языка на английский язык в текстовой форме и обратно.

Настоящие изобретения могут быть широко использованы в среде владельцев мобильных телефонов, в рамках реализации функций преобразования разговорной речи на языке владельца телефона (терминала) в озвученную разговорную речь и/или письменную информацию (текст) на языке его иностранного собеседника.

Для этого, как ранее указывалось, преобразователь устной речи владельца терминала настраивается на характерные акустико-лингвистические особенности голоса владельца, путем аудиовоспроизведения владельцем специальных и/или произвольных текстов, появляющихся на дисплее терминала связи в процессе верификации характерных признаков голоса владельца. Алгоритм процесса верификации подробно раскрыт в предыдущем описании и графически отображен на фиг.3.

Кодовое преобразование письменного текста с языка владельца терминала в письменный текст на языке собеседника проводится с помощью программ электронного машинного перевода, преимущественно, Translation Memory, например, компании «Trades». Из максимально полных и постоянно пополняемых баз переводов, хранящихся, например, в системе «Интернет» с использованием мощных процессоров, также находящихся в данной системе, может проводиться выборка текстов, максимально совпадающих с текстом перевода. При этом сначала проводится поиск предложения целиком или группы предложений, выделенных паузой при произнесении текста. Если предложения целиком или группы предложений в задействованных базах переводов нет, то проводится разбиение предложения или их группы на две, три и более частей, вплоть до отдельных слов и слогов до момента обнаружения в задействованной базе данных идентичного фонема (аналога). Однако вышеуказанное отсутствующее предложение в целом в дальнейшем должно быть дополнено в исходную базу переводов.

Второе преобразование кодовой текстовой формы с промежуточного английского языка в кодовую текстовую форму на языке собеседника (владельца второго терминала), если собеседник не владеет английским языком, проводится аналогично первому письменному преобразованию с использованием баз переводов.

В процессе преобразования кодовой текстовой формы сообщения на третьем выходном языке в выходной аудиосигнал в виде устной речи на языке владельца 2-го терминала может осуществляться преобразование голоса диктора программы озвучивания текста с целью приближения акустико-лингвистических особенностей голоса диктора к соответствующим характерным признакам голоса владельца 1-го терминала.

Таким образом, заявленные технические решения могут быть широко использованы в области электроники, в частности в способах и системах (устройствах) для перевода фраз с первого языка на второй, в частности, но не исключительно, в таких системах, которые вырабатывают речевой аудиосигнал на выходе (на выходном языке) из речевого аудиосигнала на входе (на входном языке).

Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленных технических решений следующей совокупности условий:

- объекты, воплощающие заявленные технические решения, при их осуществлении предназначены для использования в области электроники для реализации известными мобильными терминалами связи функции синхронного перевода речевой информации с одного языка на другой.

- для заявленных объектов в том виде, как они охарактеризованы в независимых пунктах нижеизложенной формулы, подтверждена возможность их осуществления с помощью вышеописанных в заявке или известных из уровня техники на дату приоритета средств и методов;

- объекты, воплощающие заявленные технические решения, при их осуществлении способны обеспечить достижение усматриваемого заявителем технического результата.

Следовательно, заявленные объекты соответствуют требованию условия патентоспособности «промышленная применимость» по действующему законодательству.

Класс G06F17/28 обработка или перевод текстов на естественном языке

сайты, переводимые пользователем после предоставления сайта - патент 2498403 (10.11.2013)
архитектура распознавания для генерации азиатских иероглифов - патент 2477518 (10.03.2013)

проверка ошибок сочетаний слов на базе сети интернет - патент 2458391 (10.08.2012)
гибкий перевод отображения - патент 2436146 (10.12.2011)
создание ресурса с использованием онтологий - патент 2422890 (27.06.2011)
адаптивный машинный перевод - патент 2382399 (20.02.2010)
способы и системы для перевода с одного языка на другой - патент 2357285 (27.05.2009)
перевод сообщений, передаваемых в электронной форме - патент 2332709 (27.08.2008)
система автоматизированного упорядочения неструктурированного информационного потока входных данных - патент 2312391 (10.12.2007)
поддержка множества языков в web-серверах для встроенных систем - патент 2295762 (20.03.2007)

Класс G10L15/06 создание эталонных шаблонов; обучение систем распознавания речи, например по характеристикам голоса говорящего

детектирование автоответчика путем распознавания речи - патент 2439716 (10.01.2012)
способ распознавания слов речи - патент 2296376 (27.03.2007)
способ распознавания фонем речи и устройство для реализации способа - патент 2268504 (20.01.2006)
способ автоматического распознавания человека с использованием акустических сигналов, снимаемых с тела человека - патент 2263358 (27.10.2005)
способ автоматической идентификации личности - патент 2161826 (10.01.2001)