способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
Классы МПК: | G10L19/08 определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов |
Автор(ы): | МОРИЯ Такехиро (JP), ХАРАДА Нобору (JP), КАМАМОТО Ютака (JP) |
Патентообладатель(и): | НИППОН ТЕЛЕГРАФ ЭНД ТЕЛЕФОН КОРПОРЕЙШН (JP) |
Приоритеты: |
подача заявки:
2011-01-07 публикация патента:
10.04.2014 |
Изобретение относится к способу кодирования и более конкретно к способу кодирования периода основного тона. Технический результат заключается в повышении эффективности компрессии периодов основного тона. В ходе кодирования вычисляются периоды основного тона для сигналов временной последовательности в заранее заданном временном интервале и выводится код, соответствующий таковым. В этом кодировании разрешающие способности для выражения периодов основного тона и/или режима кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, указывающему высокую или низкую периодичность и/или стационарность. В этом декодировании в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, индекс, включаемый во входной код или получаемый исходя из входного кода, соответствующего заранее заданному временному интервалу, условию, указывающему высокую периодичность и/или стационарность, режим декодирования для кода, включенного во входной код, соответствующего периодам основного тона, переключается для декодирования кода, соответствующего периодам основного тона, чтобы получать периоды основного тона, соответствующие заранее заданному временному интервалу. 14 н. и 18 з.п. ф-лы, 28 ил., 9 табл.
Формула изобретения
1. Способ кодирования, содержащий:
(A) этап получения периодов основного тона, соответствующих сигналам временной последовательности, включенных в заранее заданный временной интервал; и
(B) этап вывода кода, соответствующего периодам основного тона;
причем этап (B) содержит этап вывода кода, полученного посредством режима кодирования, который получает код, соответствующий периодам основного тона, выраженным с первой разрешающей способностью, в каждом первом временном интервале, если индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, не удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, и
вывода кода, полученного посредством режима кодирования, который получает код, соответствующий периодам основного тона, выраженным со второй разрешающей способностью, в каждом втором временном интервале, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность; и
вторая разрешающая способность выше первой разрешающей способности и/или второй временной интервал короче первого временного интервала.
2. Способ кодирования, содержащий:
(A) этап получения периодов основного тона, соответствующих сигналам временной последовательности, включенных в заранее заданный временной интервал; и
(B) этап вывода кода, соответствующего периодам основного тона;
причем разрешающие способности, используемые для выражения периодов основного тона, и/или режим кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность; и
этап (B) содержит этап вывода кода, соответствующего периодам основного тона, полученным путем кодирования периода основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, и путем кодирования с переменной длиной разности между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность.
3. Способ кодирования, содержащий:
(A) этап получения периодов основного тона, соответствующих сигналам временной последовательности, включенных в заранее заданный временной интервал; и
(B) этап вывода кода, соответствующего периодам основного тона;
причем разрешающие способности, используемые для выражения периодов основного тона, и/или режим кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность; и
этап (B) содержит этап вывода кода, соответствующего периодам основного тона, полученным путем кодирования периода основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, и путем кодирования с переменной длиной информации, полученной путем объединения разности между значением, соответствующим каждому периоду основного тона во множестве вторых заранее заданных временных интервалов, включенных в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим каждому периоду основного тона во временных интервалах, отличных от вторых заранее заданных временных интервалов, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность.
4. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности;
индекс включает в себя квантованный коэффициент усиления основного тона или значение, соответствующее таковому; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором квантованный коэффициент усиления основного тона или значение, соответствующее таковому, больше указанного значения.
5. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения кода векторно-квантованного коэффициента усиления, соответствующего комбинации квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления основного тона, и квантованного коэффициента усиления фиксированной кодовой книги, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги;
индекс включает в себя код векторно-квантованного коэффициента усиления; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором код векторно-квантованного коэффициента усиления соответствует комбинации квантованного коэффициента усиления основного тона, который больше указанного значения, или значения, которое соответствует квантованному коэффициенту усиления основного тона и которое больше указанного значения, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому.
6. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности, и квантованного коэффициента усиления фиксированной кодовой книги, соответствующего сигналам временной последовательности;
индекс включает в себя квантованный коэффициент усиления основного тона или значение, соответствующее таковому, и квантованный коэффициент усиления фиксированной кодовой книги или значение, соответствующее таковому; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором отношение квантованного коэффициента усиления основного тона или значения, соответствующего таковому, к квантованному коэффициенту усиления фиксированной кодовой книги или значению, соответствующему этому, больше указанного значения.
7. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения кода векторно-квантованного коэффициента усиления, соответствующего комбинации квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления основного тона, и квантованного коэффициента усиления фиксированной кодовой книги, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги;
индекс включает в себя код векторно-квантованного коэффициента усиления; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором код векторно-квантованного коэффициента усиления соответствует комбинации квантованного коэффициента усиления основного тона или значения, соответствующего таковому, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому, где отношение квантованного коэффициента усиления основного тона или значения, соответствующего таковому, к квантованному коэффициенту усиления фиксированной кодовой книги или значению, соответствующему таковому, больше указанного значения.
8. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности, и квантованного коэффициента усиления фиксированной кодовой книги, соответствующего сигналам временной последовательности;
индекс включает в себя квантованный коэффициент усиления основного тона или значение, соответствующее таковому, и квантованный коэффициент усиления фиксированной кодовой книги или значение, соответствующее таковому; и
условие, которое указывает низкую периодичность и/или низкую стационарность, включает в себя условие, в котором квантованный коэффициент усиления основного тона или значение, соответствующее таковому, меньше первого указанного значения, и квантованный коэффициент усиления фиксированной кодовой книги или значение, соответствующее таковому, меньше второго указанного значения.
9. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения кода векторно-квантованного коэффициента усиления, соответствующего комбинации квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления основного тона, и квантованного коэффициента усиления фиксированной кодовой книги, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги;
индекс включает в себя код векторно-квантованного коэффициента усиления; и
условие, которое указывает низкую периодичность и/или низкую стационарность, включает в себя условие, в котором квантованный коэффициент усиления основного тона, соответствующий коду векторно-квантованного коэффициента усиления, или значение, соответствующее квантованному коэффициенту усиления основного тона, меньше первого указанного значения, и квантованный коэффициент усиления фиксированной кодовой книги, соответствующий коду векторно-квантованного коэффициента усиления, или значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги, меньше второго указанного значения.
10. Способ кодирования по одному из пп.1-3,
в котором этап (A) дополнительно содержит этап получения кода векторно-квантованного коэффициента усиления, соответствующего комбинации квантованного коэффициента усиления основного тона, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления основного тона, и квантованного коэффициента усиления фиксированной кодовой книги, соответствующего сигналам временной последовательности, или значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги;
индекс включает в себя код векторно-квантованного коэффициента усиления; и
режим кодирования переключается в соответствии с кодом векторно-квантованного коэффициента усиления при обращении к таблице, в которой каждый код векторно-квантованного коэффициента усиления связан с разрешающей способностью, используемой для выражения периода основного тона, и/или режимом кодирования периода основного тона.
11. Способ кодирования по одному из пп.1-3,
в котором индекс включает в себя индекс, который указывает отношение величины сигналов временной последовательности к величине остатков предсказания, полученных путем применения анализа с линейным предсказанием к сигналам временной последовательности; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором индекс, который указывает отношение величины сигналов временной последовательности к величине остатков предсказания, полученных путем применения анализа с линейным предсказанием к сигналам временной последовательности, больше заданного значения.
12. Способ кодирования по одному из пп.1-3,
в котором индекс включает в себя величину разности между значением, соответствующим периоду основного тона во временном интервале, включенном в заранее заданный временной интервал, и значением, соответствующим периоду основного тона в прошлом временном интервале, перед временным интервалом, включенным в заранее заданный временной интервал; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором величина разности между значением, соответствующим периоду основного тона во временном интервале, включенном в заранее заданный временной интервал, и значением, соответствующим периоду основного тона в прошлом временном интервале перед временным интервалом, включенным в заранее заданный временной интервал, меньше заданного значения.
13. Способ декодирования, содержащий:
прием кода, соответствующего заранее заданному временному интервалу;
причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периодам основного тона, причем код, соответствующий периодам основного тона, декодируют с помощью режима декодирования, который получает в каждом первом временном интервале каждый из периодов основного тона, выраженный с первой разрешающей способностью, если индекс, указывающий уровень периодичности и/или стационарности, причем индекс включен в или получается из кода, соответствующего заранее заданному временному интервалу, не удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность;
код, соответствующий периодам основного тона, декодируют с помощью режима декодирования, который получает в каждом втором временном интервале каждый из периодов основного тона, выраженный со второй разрешающей способностью, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность; и
вторая разрешающая способность выше первой разрешающей способности и/или второй временной интервал короче первого временного интервала.
14. Способ декодирования, содержащий:
прием кода, соответствующего заранее заданному временному интервалу; и
декодирование кода, соответствующего периодам основного тона, чтобы получить периоды основного тона, соответствующие заранее заданному временному интервалу, причем
режим декодирования кода, соответствующего периодам основного тона, переключают в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, причем индекс включен в код или получается из кода, соответствующего заранее заданному временному интервалу, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, и код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периодам основного тона,
если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, код, соответствующий периоду основного тона в первом заранее заданном временном интервале, декодируют для получения периода основного тона в первом заранее заданном временном интервале, причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периоду основного тона; во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, код, соответствующий разности между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, и значением, соответствующим периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, декодируют, чтобы получить разность, причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий упомянутой разности; и
упомянутая разность и значение, соответствующее периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, используют для получения периода основного тона во втором заранее заданном временном интервале.
15. Способ декодирования, содержащий:
прием кода, соответствующего заранее заданному временному интервалу; и
декодирование кода, соответствующего периодам основного тона, чтобы получить периоды основного тона, соответствующие заранее заданному временному интервалу, причем
режим декодирования кода, соответствующего периодам основного тона, переключают в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, причем индекс включен в код или получается из кода, соответствующего заранее заданному временному интервалу, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, и код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периодам основного тона,
если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, код, соответствующий периоду основного тона в первом заранее заданном временном интервале, декодируют для получения периода основного тона в первом заранее заданном временном интервале, причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периоду основного тона; и
во множестве вторых заранее заданных временных интервалов, включенных в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, код, соответствующий информации, полученной путем объединения разностей, каждая из которых является разностью между значением, соответствующим периоду основного тона в каждом из вторых заранее заданных временных интервалов, и значением, соответствующим периоду основного тона в каждом временном интервале, отличном от вторых заранее заданных временных интервалов, декодируют для получения упомянутой разности, где код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий информации, полученной путем объединения разностей; и
каждая из разностей и значение, соответствующее периоду основного тона в каждом временном интервале, отличном от вторых заранее заданных временных интервалов, используют для получения периода основного тона в каждом из вторых заранее заданных временных интервалов.
16. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя квантованный коэффициент усиления основного тона или значение, соответствующее таковому; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором квантованный коэффициент усиления основного тона или значение, соответствующее таковому, больше указанного значения.
17. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя код векторно-квантованного коэффициента усиления, соответствующий комбинации квантованного коэффициента усиления основного тона или значения, соответствующего таковому, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором код векторно-квантованного коэффициента усиления соответствует комбинации квантованного коэффициента усиления основного тона, который больше указанного значения, или значения, которое соответствует квантованному коэффициенту усиления основного тона и которое больше указанного значения, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому.
18. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя квантованный коэффициент усиления основного тона или значение, соответствующее таковому, и квантованный коэффициент усиления фиксированной кодовой книги или значение, соответствующее таковому; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором отношение квантованного коэффициента усиления основного тона или значения, соответствующего таковому, к квантованному коэффициенту усиления фиксированной кодовой книги или значению, соответствующему таковому, больше указанного значения.
19. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя код векторно-квантованного коэффициента усиления, соответствующий комбинации квантованного коэффициента усиления основного тона или значения, соответствующего таковому, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором код векторно-квантованного коэффициента усиления соответствует комбинации квантованного коэффициента усиления основного тона или значения, соответствующего таковому, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому, причем отношение квантованного коэффициента усиления основного тона или значения, соответствующего таковому, к квантованному коэффициенту усиления фиксированной кодовой книги или значению, соответствующему таковому, больше указанного значения.
20. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя квантованный коэффициент усиления основного тона или значение, соответствующее таковому, и квантованный коэффициент усиления фиксированной кодовой книги или значение, соответствующее таковому; и
условие, которое указывает низкую периодичность и/или низкую стационарность, включает в себя условие, в котором квантованный коэффициент усиления основного тона или значение, соответствующее таковому, меньше первого указанного значения, и квантованный коэффициент усиления фиксированной кодовой книги или значение, соответствующее таковому, меньше второго указанного значения.
21. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя код векторно-квантованного коэффициента усиления, соответствующий комбинации квантованного коэффициента усиления основного тона или значения, соответствующего таковому, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому; и
условие, которое указывает низкую периодичность и/или низкую стационарность, включает в себя условие, в котором квантованный коэффициент усиления основного тона, соответствующий коду векторно-квантованного коэффициента усиления, или значение, соответствующее квантованному коэффициенту усиления основного тона, меньше первого указанного значения, и квантованный коэффициент усиления фиксированной кодовой книги, соответствующий векторно-квантованному коду коэффициента усиления, или значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги, меньше второго указанного значения.
22. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя код векторно-квантованного коэффициента усиления, соответствующий комбинации квантованного коэффициента усиления основного тона или значения, соответствующего таковому, и квантованного коэффициента усиления фиксированной кодовой книги или значения, соответствующего таковому; и
режим декодирования переключается в соответствии с кодом векторно-квантованного коэффициента усиления при обращении к таблице, в которой каждый код векторно-квантованного коэффициента усиления связан с разрешающей способностью, используемой для выражения периода основного тона и/или режима декодирования периода основного тона.
23. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя значение оценки усиления по предсказанию, вычисленное путем использования коэффициентов линейного предсказания, полученных из кода, или коэффициентов, соответствующих коэффициентам линейного предсказания; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором значение оценки усиления по предсказанию больше указанного значения.
24. Способ декодирования по одному из пп.13-15,
в котором индекс включает в себя величину разности между значением, соответствующим периоду основного тона во временном интервале, включенном в заранее заданный временной интервал, и значением, соответствующим периоду основного тона в прошлом временном интервале перед временным интервалом, включенным в заранее заданный временной интервал; и
условие, которое указывает высокую периодичность и/или высокую стационарность, включает в себя условие, в котором величина разности между значением, соответствующим периоду основного тона во временном интервале, включенном в заранее заданный временной интервал, и значением, соответствующим периоду основного тона в прошлом временном интервале перед временным интервалом, включенным в заранее заданный временной интервал, меньше указанного значения.
25. Кодер, содержащий:
блок поиска, который получает периоды основного тона, соответствующие сигналам временной последовательности, включенные в заранее заданный временной интервал; и
блок кодирования параметров, который выводит код, соответствующий периодам основного тона;
причем блок кодирования параметров выводит код, полученный посредством режима кодирования, который получает код, соответствующий периодам основного тона, выраженным с первой разрешающей способностью, в каждом первом временном интервале, если индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, не удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, и
выводит код, полученный посредством режима кодирования, который получает код, соответствующий периодам основного тона, выраженным со второй разрешающей способностью, в каждом втором временном интервале, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность; и
вторая разрешающая способность выше первой разрешающей способности и/или второй временной интервал короче первого временного интервала.
26. Кодер, содержащий:
блок поиска, который получает периоды основного тона, соответствующие сигналам временной последовательности, включенные в заранее заданный временной интервал; и
блок кодирования параметров, который выводит код, соответствующий периодам основного тона;
причем разрешающие способности, используемые для выражения периодов основного тона, и/или режим кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, и
блок кодирования параметров выводит код, соответствующий периодам основного тона, полученным путем кодирования периода основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, и путем кодирования с переменной длиной разности между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность.
27. Кодер, содержащий:
блок поиска, который получает периоды основного тона, соответствующие сигналам временной последовательности, включенные в заранее заданный временной интервал; и
блок кодирования параметров, который выводит код, соответствующий периодам основного тона;
причем разрешающие способности, используемые для выражения периодов основного тона, и/или режим кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, и
блок кодирования параметров выводит код, соответствующий периодам основного тона, полученным путем кодирования периода основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, и путем кодирования с переменной длиной информации, полученной путем объединения разности между значением, соответствующим каждому периоду основного тона во множестве вторых заранее заданных временных интервалов, включенных в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим каждому периоду основного тона во временных интервалах, отличных от вторых заранее заданных временных интервалов, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность.
28. Декодер, в котором входной код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периодам основного тона, причем код, соответствующий периодам основного тона, декодируется с помощью режима декодирования, который получает в каждом первом временном интервале каждый из периодов основного тона, выраженный с первой разрешающей способностью, если индекс, указывающий уровень периодичности и/или стационарности, причем индекс включен во входной код или получается из входного кода, соответствующего заранее заданному временному интервалу, не удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность;
код, соответствующий периодам основного тона, декодируется с помощью режима декодирования, который получает в каждом втором временном интервале каждый из периодов основного тона, выраженный со второй разрешающей способностью, если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность; и
вторая разрешающая способность выше первой разрешающей способности и/или второй временной интервал короче первого временного интервала.
29. Декодер, в котором согласно тому, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, причем индекс включен во входной код или получается из входного кода, соответствующего заранее заданному временному интервалу, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, режим декодирования для включенного во входной код кода, соответствующего периодам основного тона, переключается, чтобы декодировать код, соответствующий периодам основного тона, для получения периодов основного тона, соответствующих заранее заданному временному интервалу,
если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, код, соответствующий периоду основного тона в первом заранее заданном временном интервале, декодируется для получения периода основного тона в первом заранее заданном временном интервале, причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периоду основного тона;
во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, код, соответствующий разности между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, и значением, соответствующим периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, декодируется, чтобы получить разность, причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий упомянутой разности; и
упомянутая разность и значение, соответствующее периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, используются для получения периода основного тона во втором заранее заданном временном интервале.
30. Декодер, в котором согласно тому, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, причем индекс включен во входной код или получается из входного кода, соответствующего заранее заданному временному интервалу, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, режим декодирования для включенного во входной код кода, соответствующего периодам основного тона, переключается, чтобы декодировать код, соответствующий периодам основного тона, для получения периодов основного тона, соответствующих заранее заданному временному интервалу,
если индекс удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, код, соответствующий периоду основного тона в первом заранее заданном временном интервале, декодируется для получения периода основного тона в первом заранее заданном временном интервале, причем код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий периоду основного тона; и
во множестве вторых заранее заданных временных интервалов, включенных в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, код, соответствующий информации, полученной путем объединения разностей, каждая из которых является разностью между значением, соответствующим периоду основного тона в каждом из вторых заранее заданных временных интервалов, и значением, соответствующим периоду основного тона в каждом временном интервале, отличном от вторых заранее заданных временных интервалов, декодируется для получения упомянутой разности, где код, соответствующий заранее заданному временному интервалу, включает в себя код, соответствующий информации, полученной путем объединения разностей; и
каждая из разностей и значение, соответствующее периоду основного тона в каждом временном интервале, отличном от вторых заранее заданных временных интервалов, используется для получения периода основного тона в каждом из вторых заранее заданных временных интервалов.
31. Считываемый компьютером носитель записи с сохраненной на нем программой, предписывающей компьютеру исполнять обработку по способу кодирования по одному из пп.1-3.
32. Считываемый компьютером носитель записи с сохраненной на нем программой, предписывающей компьютеру исполнять обработку по способу декодирования по одному из пп.13-15.
Описание изобретения к патенту
Настоящее изобретение относится к способу кодирования и более конкретно к способу кодирования периода основного тона.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Традиционные системы для кодирования сигналов временной последовательности, таких как речевые сигналы и звуковые сигналы с помощью небольшого числа битов, включают в себя систему кодирования, которая получает периоды основного тона для целевых сигналов, подлежащих кодированию, и выполняет кодирование (см., например, Непатентную литературу 1). Система линейного предсказания с кодовым возбуждением (CELP), которая используется для мобильных телефонов и т.п., будет описана в виде примера традиционной системы кодирования, в которой осуществляется получение периодов основного тона и выполняется кодирование.
На фиг.1 показана блок-схема, иллюстрирующая пример традиционной системы CELP.
Кодер 91 принимает сигналы временной последовательности, x(n)(n=0,...,L-1; L является целым числом, равным или большим 2), такие как речевые сигналы и звуковые сигналы, разделенные на единицы кадров, которые являются заранее заданными временными интервалами. Блок 911 анализа с линейным предсказанием выполняет анализ с линейным предсказанием для включенных в текущий кадр сигналов x(n)(n=0,...,L-1) временной последовательности в соответственные моменты времени n=0,...,L-1, чтобы сформировать информацию линейного предсказания «LPC-инфо» для идентификации полюсного синтезирующего фильтра 915, используемого для текущего кадра. Например, блок 911 анализа с линейным предсказанием вычисляет коэффициенты линейного предсказания, (m)(m=1,...,P; P представляет порядок линейного предсказания, являющийся положительным целым числом), для сигналов x(n)(n=0,...,L-1) временной последовательности в текущем кадре, преобразовывает коэффициенты (m)(m=1,...,P) линейного предсказания в LSP-коэффициенты линейных спектральных пар и выводит квантованные значения LSP-коэффициентов линейных спектральных пар в качестве информации линейного предсказания LPC-info.
Фиксированная кодовая книга 914 выводит компоненты c(n)(n=0,...,L-1) сигнала, образуемые из одного или нескольких сигналов, имеющих каждый значение, образуемое из ненулевого отдельного импульса и его знака «плюс» или «минус», и одного или нескольких сигналов, имеющих каждый значение нуль, под управлением блока 913 поиска. Адаптивная кодовая книга 912 хранит сигналы возбуждения, сформированные в прошлые моменты во времени, и адаптивная кодовая книга 912 выводит адаптивные компоненты сигнала, v(n)(n=0,...,L-1), полученные путем использования сигналов возбуждения, задержанных в соответствии с периодами T основного тона, полученными блоком 913 поиска. Сигналы возбуждения для текущего кадра, соответствующие компонентам c(n)(n=0,...,L-1) сигнала из фиксированной кодовой книги 914 и адаптивным компонентам v(n)(n=0,...,L-1) сигнала из адаптивной кодовой книги 912, можно выразить, как изложено ниже:
u(n)=gp ×v(n)+gc×c(n) (n=0,...,L-1) (1)
Здесь gp представляет коэффициент усиления основного тона, задаваемый адаптивным компонентам v(n) сигнала, и g c представляет коэффициент усиления фиксированной кодовой книги, задаваемый компонентам c(n) сигнала.
Блок 913 поиска осуществляет поиск периодов T основного тона, компонентов c(n)(n=0,...,L-1) сигнала, коэффициентов gp усиления основного тона и коэффициентов gc усиления фиксированной кодовой книги с тем, чтобы минимизировать значения, полученные путем применения перцепционного взвешивающего фильтра 916 к разностям между входными сигналами временной последовательности, x(n)(n=0,...,L-1; n будет именоваться точкой выборки), и синтезированными сигналами x (n)(n=0,...,L-1), полученными путем применения полюсного синтезирующего фильтра 915, идентифицированного информацией линейного предсказания LPC-info, к сигналам u(n)(n=0,...,L-1) возбуждения. Блок 913 поиска выводит параметры возбуждения, которые включают в себя периоды T основного тона, индексы Cf кодов (в кодовой книге), идентифицирующие компоненты c(n)(n=0,...,L-1) сигнала, коэффициенты gp усиления основного тона и коэффициенты gc усиления фиксированной кодовой книги.
При этом информация линейного предсказания, LPC info, обновляется в каждом кадре, и периоды T основного тона, индексы Cf кодов, коэффициенты gp усиления основного тона и коэффициенты gc усиления фиксированной кодовой книги обновляются в каждом подкадре, включенном в кадр. Если в каждом кадре имеется один подкадр, количество информации, такой как параметры возбуждения, является небольшим, но временные изменения сигналов x(n)(n=0,...,L-1) временной последовательности не могут отслеживаться, вызывая большое искажение кодирования. Противоположный эффект получается, если каждый кадр содержит большое число подкадров. Слишком большое число подкадров обуславливает, что улучшение качества становится насыщенным, и только увеличивают количество информации. В описанном ниже примере один кадр разделяется на четыре равных подкадра. Индексы Cf кодов, полученные в первом, втором, третьем и четвертом подкадрах, отсчитываемых сверху кадра (именуемых первым, вторым, третьим и четвертым подкадрами), выражены в виде Cf1, Cf2, Cf3 и Cf4. Коэффициенты gp усиления основного тона и коэффициенты gc усиления фиксированной кодовой книги, полученные в первом, втором, третьем и четвертом подкадрах, выражаются соответственно как gp1, gp2, gp3 и gp4 и gc1, gc2 , gc3 и gc4, и коэффициенты усиления основного тона и коэффициенты усиления фиксированной кодовой книги все вместе называются коэффициентами усилениями возбуждения. Периоды T основного тона, получаемые в первом, втором, третьем и четвертом подкадрах, выражены в виде T1, T2, T 3 и T4. Период T основного тона выражается просто целым кратным интервалу между точками выборки, n (целочисленное разрешение) или комбинацией целого кратного интервалу между точками n выборки и дробного значения (дробное разрешение). При дробном разрешении, в котором дробное значение выражается двумя битами, например, имеются четыре выражения для периодов T основного тона: Tint-1/4, Tint, Tint+1/4, T int+1/2 (Tint является целым числом). Если адаптивные компоненты v(n) сигнала выражаются с использованием периодов T основного тона с дробным разрешением, то используется интерполирующий фильтр для выполнения взвешенного усреднения множества сигналов возбуждения, задержанных в соответствии с периодами T основного тона.
Параметры возбуждения, которые включают в себя периоды T основного тона, индексы Cf кодов, коэффициенты gp усиления основного тона и коэффициенты gc усиления фиксированной кодовой книги, вводятся на блок 917 кодирования параметров, и блок 917 кодирования параметров формирует битовый поток BS, составленный из кодов, соответствующих параметрам, и выводит его. Коэффициенты gp усиления основного тона и коэффициенты gc усиления фиксированной кодовой книги могут кодироваться посредством векторного квантования, которое выбирает оптимальные коды для пар из коэффициентов усиления основного тона и коэффициентов усиления фиксированной кодовой книги.
На фиг.2A представлен вид, показывающий примерную структуру битового потока BS, при использовании периодов T основного тона с дробным разрешением, и на фиг.2B представлен вид, иллюстрирующий коды, соответствующие периодам T основного тона при дробном разрешении. На фиг.3 представлен вид, иллюстрирующий разрешающие способности для выражения периода T основного тона (разрешающие способности периода).
При использовании периодов T основного тона с дробным разрешением, как показано на фиг.2A и 2B, формируются коды, соответствующие целочисленным частям и дробным частям периодов T=T1, T2 , T3, T4 основного тона. В примере, показанном на фиг.2A и 2B, девять битов назначены периодам основного тона в первом и третьем подкадрах, и значения для периодов T1 и T3 основного тона в первом и третьем подкадрах (отличия от наименьшего значения для периодов основного тона) кодируются отдельно системой кодирования, независимой от периодов основного тона для других подкадров (частей периода основного тона). Независимое кодирование периода основного тона для данного подкадра системой кодирования, независимой от периодов основного тона для других подкадров, называется независимым кодированием в каждом подкадре. Обычно является предпочтительным выражать более короткий период T основного тона с дробным разрешением. В примере, показанном на фиг.3, если целочисленная часть периода T основного тона равна минимальному значению Tmin или больше него и меньше T , период T основного тона выражается с дробным разрешением, в котором дробное значение выражается двумя битами (четверное дробное разрешение); если целочисленная часть периода T основного тона имеет значение от T до TB, период T основного тона выражается с дробным разрешением, в котором дробное значение выражается одним битом (двойное дробное разрешение); и если целочисленная часть периода T основного тона имеет значение от TB до максимального значения Tmax, период T основного тона выражается так же, как целое кратное интервалу между точками выборки n (целочисленное разрешение).
Во втором и четвертом подкадрах (фиг.2A и 2B) разности между целочисленными частями периодов T2 и T4 основного тона во втором и четвертом подкадрах и целочисленными частями периодов T1 и T3 основного тона в первом и третьем подкадрах отдельно кодируются четырьмя битами (целочисленные части разности), и значения после десятичной запятой (дробные части) периодов T2 и T4 основного тона кодируются отдельно двумя битами (четверное дробное разрешение), независимо от значений разности целочисленных частей. Поиск периодов T2 и T4 основного тона осуществлялся в диапазоне, в котором разности между их целочисленными частями и целочисленными частями периодов T1 и T3 основного тона соответственно могут кодироваться четырьмя битами. Другими словами, поиск периодов T2 и T4 основного тона осуществлялся в диапазоне так, чтобы значения соответствующих целочисленных частей находились в диапазоне от значений целочисленных частей периодов T1 и T 3 основного тона минус 8 до значений целочисленных частей периодов T1 и T3 основного тона плюс 7 соответственно.
Битовый поток BS, выводимый из блока 917 кодирования параметров в кодере 91 (фиг.1), вводится на блок 927 декодирования параметров в декодере 92. Блок 927 декодирования параметров декодирует битовый поток BS и выводит индексы Cf=Cf1, Cf2, Cf3 , Cf4 кодов, коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона, коэффициенты gc =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги, периоды T=T 1 , T2 , T3 , T4 основного тона и информацию линейного предсказания LPC info, полученные путем декодирования.
Фиксированная кодовая книга 924 выводит компоненты c (n)(n=0,...,L-1) сигнала, идентифицированные индексами Cf кодов, и адаптивная кодовая книга 922 выводит адаптивные компоненты v (n)(n=0,...,L-1) сигнала, идентифицированные периодами T основного тона. Затем сигналы u (n)(n=0,...,L-1) возбуждения, которые являются суммами произведений, полученных путем умножения компонентов c (n)(n=0,...,L-1) сигнала на коэффициенты gc усиления фиксированной кодовой книги, и произведений, полученных путем умножения адаптивных компонентов v (n)(n=0,...,L-1) сигнала на коэффициенты gp усиления основного тона, добавляются к адаптивной кодовой книге 922. Полюсный синтезирующий фильтр 925, идентифицированный информацией линейного предсказания LPC info, применяется к сигналам u (n)(n=0,...,L-1) возбуждения, и выводятся синтезированные сигналы x (n)(n=0,...,L-1), сгенерированные в качестве результата.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
ЛИТЕРАТУРА
НЕПАТЕНТНАЯ ЛИТЕРАТУРА
Непатентная литература 1: Проект партнерства систем связи 3-го поколения (3GPP), Техническое описание (TS) 26.090, "AMR speech code; Transcoding functions" (Речевой код(ек) AMR; функции транскодирования), Версия 4.0.0(2001-03))
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
ТЕХНИЧЕСКИЕ ЗАДАЧИ ИЗОБРЕТЕНИЯ
В традиционной системе CELP кодирование выполняется фиксированным числом битов, назначаемых коду для периодов основного тона в каждом кадре. Это не ограничивается системой CELP, а также используется в других традиционных системах, где осуществляется получение периодов основного тона для целевых сигналов, подлежащих кодированию, и выполняется кодирование.
В настоящем изобретении разработан способ кодирования периодов основного тона, чтобы повысить эффективность компрессии.
СРЕДСТВО ДЛЯ РЕШЕНИЯ ТЕХНИЧЕСКИХ ЗАДАЧ ИЗОБРЕТЕНИЯ
В способе кодирования по настоящему изобретению вычисляются периоды основного тона, соответствующие сигналам временной последовательности, включенные в заранее заданный временной интервал, и выводится код, соответствующий периодам T основного тона. В этом кодировании разрешающие способности, используемые, чтобы выражать периоды основного тона и/или режим кодирования периода основного тона, переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность.
В декодировании, соответствующем этому кодированию, в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, который включен во входной код или получен исходя из входного кода, соответствующего заранее заданному временному интервалу, условию, которое указывает высокую периодичность и/или высокую стационарность, или условию, которое указывает низкую периодичность и/или низкую стационарность, режим декодирования кода, включенного во входной код, соответствующий периодам основного тона, переключается для декодирования кода, соответствующего периодам основного тона, чтобы получить периоды основного тона, соответствующие заранее заданному временному интервалу.
ЭФФЕКТЫ ИЗОБРЕТЕНИЯ
В настоящем изобретении в системе, в которой осуществляется получение периодов основного тона для целевых сигналов, подлежащих кодированию, и затем выполняется кодирование, поскольку разрешающие способности, используемые, чтобы выражать периоды основного тона и/или режим кодирования периода основного тона, переключаются в соответствии с уровнем периодичности или стационарности сигналов временной последовательности, эффективность компрессии периодов основного тона может быть повышена.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 - блок-схема, иллюстрирующая пример традиционной системы CELP;
фиг.2A - вид, показывающий примерную структуру битового потока BS при использовании периодов T основного тона, имеющих дробное разрешение;
фиг.2B - вид, иллюстрирующий коды, соответствующие периодам T основного тона, имеющим дробное разрешение;
фиг.3 - вид, иллюстрирующий способ кодирования дробной части периода основного тона;
фиг.4 - блок-схема, иллюстрирующая кодер и декодер согласно вариантам осуществления;
фиг.5 - блок-схема, иллюстрирующая блок кодирования параметров согласно вариантам осуществления;
фиг.6 - блок-схема, иллюстрирующая блок декодирования параметров согласно вариантам осуществления;
фиг.7A - блок-схема, иллюстрирующая способ кодирования по вариантам осуществления;
фиг.7B - блок-схема, иллюстрирующая способ декодирования по вариантам осуществления;
фиг.8A и 8B - виды, иллюстрирующие примерные структуры кодов для периодов основного тона;
фиг.9A - вид, иллюстрирующий примерные структуры кодов, соответствующих периодам основного тона;
фиг.9B - вид, иллюстрирующий (неравномерные) коды переменной длины, соответствующие целочисленным частям периодов основного тона во втором и четвертом подкадрах;
фиг.10A - вид, показывающий примерный способ кодирования периода основного тона согласно третьему варианту осуществления, когда сигналы временной последовательности являются стационарными (периодическими);
фиг.10B и 10C - виды, показывающие примеры кода X 3 для периода основного тона в третьем подкадре;
фиг.11 - вид, показывающий примерную взаимосвязь между кадрами и суперкадром;
фиг.12A и 12B - виды, показывающие примерный способ кодирования периода основного тона согласно четвертому варианту осуществления, когда сигналы временной последовательности являются стационарными (периодическими);
фиг.13 - блок-схема, иллюстрирующая способ кодирования согласно пятому варианту осуществления;
фиг.14 - блок-схема, иллюстрирующая способ декодирования согласно пятому варианту осуществления;
фиг.15A - вид, иллюстрирующий модификацию способа кодирования периода основного тона;
фиг.15B - вид, иллюстрирующий коды переменной длины, соответствующие целочисленным частям периодов основного тона во втором и четвертом подкадрах;
фиг.16A-16C - виды, иллюстрирующие модификации способа кодирования периода основного тона; и
фиг.17A - вид, иллюстрирующий модификацию способа кодирования периода основного тона;
фиг.17B - вид, иллюстрирующий коды переменной длины, соответствующие целочисленным частям периодов основного тона во втором и четвертом подкадрах.
ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Теперь варианты осуществления настоящего изобретения будут описаны со ссылкой на чертежи. Настоящее изобретение может применяться в целом к системам кодирования, которые получают периоды основного тона для целевых сигналов, подлежащих кодированию, и которые выполняют кодирование. Пример применения настоящего изобретения к системе CELP будет описан ниже. В описанном ниже примере один кадр разделен на четыре равных подкадрах, но это не будет ограничивать настоящее изобретение. В основном будут описываться отличия от описания, приведенного ранее, и уже описанные элементы не будут описываться снова.
Первый вариант осуществления
Первый вариант осуществления настоящего изобретения будет описан следующим.
В кадре, в котором сигналы x(n)(n=0,...,L-1) временной последовательности имеют низкую стационарность (являются нестационарными), сигналы x(n)(n=0,...,L-1) временной последовательности также имеют низкую периодичность (являются непериодическими), и периодические компоненты вносят лишь небольшой вклад в полный код. Следовательно, более низкая разрешающая способность, используемая, чтобы выражать период T основного тона, или более низкая частота кодирования (частота, с которой кодируется кадр) не снижают намного качество кодирования (качество декодированного синтезированного сигнала по отношению к сигналам временной последовательности, подлежащим кодированию). В первом варианте осуществления, следовательно, разрешающие способности, используемые, чтобы выражать периоды T основного тона, и частота кодирования снижаются в нестационарных (непериодических) кадрах. Это уменьшает средний объем кода на один кадр. В результате, может быть снижена средняя битовая скорость передачи или может быть повышено качество путем назначения уменьшенного количества информации, например, чтобы увеличить длину кодов для компонентов сигнала из фиксированной кодовой книги.
Конфигурация
На фиг.4 показана блок-схема, иллюстрирующая кодер и декодер согласно вариантам осуществления. На фиг.5 показана блок-схема, иллюстрирующая блок кодирования параметров из вариантов осуществления. На фиг.6 показана блок-схема, иллюстрирующая блок декодирования параметров из вариантов осуществления.
Как показано на фиг.4-6 в качестве примеров, кодер 11 в первом варианте осуществления отличается от традиционного кодера 91 тем, что блок 917 кодирования параметров заменен блоком 117 кодирования параметров. Декодер 12 в первом варианте осуществления отличается от традиционного декодера 92 тем, что блок 927 декодирования параметров заменен блоком 127 декодирования параметров.
Как показано на фиг.5 в виде примера, блок 117 кодирования параметров в настоящем варианте осуществления включает в себя блок 117a квантования коэффициентов усиления, блок 117b определения, переключатели 117c и 117f, блоки 117d и 117e кодирования периода основного тона и блок 117g синтеза. Как показано на фиг.6 в виде примера, блок 127 декодирования параметров в настоящем варианте осуществления включает в себя блок 127b определения, переключатели 127c и 127f, блоки 127d и 127e декодирования периода основного тона и блок 127g разделения.
Кодер 11 и декодер 12 в настоящем варианте осуществления являются особыми устройствами, сконфигурированными путем загрузки программ и данных в специализированные компьютеры или известные компьютеры, которые включают в себя центральный процессор (ЦП, CPU), оперативное запоминающее устройство (ОЗУ, RAM), постоянное запоминающее устройство (ПЗУ, ROM) и т.п. По меньшей мере, некоторые из блоков обработки в кодере 11 и декодере 12 могут быть сконфигурированы аппаратными средствами, такими как интегральная схема.
Способ кодирования
На фиг.7A показана блок-схема, иллюстрирующая способ кодирования согласно вариантам осуществления. В основном будут описаны отличия от традиционного способа.
Информация линейного предсказания, LPC info, сформированная для текущего кадра блоком 911 анализа с линейным предсказанием, индексы Cf=Cf1, Cf2, Cf3, Cf4 кодов, коэффициенты gp=gp1 , gp2, gp3, gp4 усиления основного тона и коэффициенты gc=gc1, gc2 , gc3, gc4 усиления фиксированной кодовой книги и периоды T=T1, T2, T3 , T4 основного тона, сформированные блоком 913 поиска для подкадров от первого до четвертого, включенных в текущий кадр, вводятся на блок 117 кодирования параметров (фиг.5).
Блок 117a квантования коэффициентов усиления в блоке 117 кодирования параметров квантует коэффициенты gp =gp1, gp2, gp3, gp4 усиления основного тона и коэффициенты gc=gc1 , gc2, gc3, gc4 усиления фиксированной кодовой книги и выводит коды, такие как индексы, идентифицирующие квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона, и коды, такие как индексы, идентифицирующие квантованные коэффициенты gc =gc1 ,gc2 ,gc3 ,gc4 усиления фиксированной кодовой книги.
Коэффициенты gp=gp1, gp2, gp3, gp4 усиления основного тона и коэффициенты gc =gc1, gc2, gc3, gc4 усиления фиксированной кодовой книги могут квантоваться отдельно. Альтернативно комбинация коэффициента усиления основного тона и коэффициента усиления фиксированной кодовой книги может квантоваться векторно. В векторном квантовании комбинации коэффициента усиления основного тона и коэффициента усиления фиксированной кодовой книги код, такой как индекс, назначается комбинации квантованного значения коэффициента усиления основного тона (квантованный коэффициент усиления основного тона) и квантованного значения коэффициента усиления фиксированной кодовой книги (квантованный коэффициент усиления фиксированной кодовой книги). Комбинация квантованного коэффициента усиления основного тона и квантованного коэффициента усиления фиксированной кодовой книги, полученная посредством такого векторного квантования, называется вектором квантованного коэффициента усиления, и код, полученный посредством векторного квантования, называется кодом векторно-квантованного (VQ) коэффициента усиления (код VQ коэффициента усиления). В таком векторном квантовании один код VQ коэффициента усиления может назначаться каждой комбинации квантованного значения коэффициента усиления основного тона и квантованного значения коэффициента усиления фиксированной кодовой книги, соответствующей одному и тому же подкадру; один код VQ коэффициента усиления может назначаться каждой комбинации квантованных значений коэффициентов усиления основного тона и квантованных значений коэффициентов усиления фиксированной кодовой книги, соответствующей каждому подкадру из множества подкадров; или один код VQ коэффициента усиления может назначаться каждой комбинации квантованных значений коэффициентов усиления основного тона и квантованных значений коэффициентов усиления фиксированной кодовой книги, соответствующей одному и тому же кадру.
В таком векторном квантовании, например, используется таблица (двумерная кодовая книга), чтобы идентифицировать код VQ коэффициента усиления, соответствующий комбинации квантованного значения усиления основного тона и квантованного значения фиксированной кодовой книги. Примером двумерной кодовой книги является таблица, в которой комбинация квантованного значения усиления основного тона и квантованного значения коэффициента усиления фиксированной кодовой книги связывается с кодом VQ коэффициента усиления. Другим примером двумерной кодовой книги является таблица, в которой комбинация квантованного значения коэффициента усиления основного тона и квантованного значения для значения, соответствующего коэффициенту усиления фиксированной кодовой книги, связывается с кодом VQ коэффициента усиления. Примером значения, соответствующего коэффициенту усиления фиксированной кодовой книги, является поправочный множитель, представляющий отношение значения оценки коэффициента усиления фиксированной кодовой книги в текущем подкадре (или кадре), предсказанного на основе энергии компонентов сигнала из фиксированной кодовой книги 914 в прошлом подкадре (или кадре), к коэффициенту усиления фиксированной кодовой книги в текущем подкадре (или кадре). Примером поправочного множителя является , включенный в документ "3.9 Quantization of the gains" (3.9 Квантование коэффициентов усиления) в Справочной литературе 1 "Рекомендации G.729 Международного союза электросвязи - сектора телекоммуникаций (ITU-T)", "Coding of Speech at 8 kbit/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP)" (Кодирование речи со скоростью 8 Кбит/сек с использованием линейного предсказания с кодовым возбуждением по алгебраической кодовой книге). Например, коэффициент gCj усиления фиксированной кодовой книги в подкадре j(j=1,...,4), поправочный множитель и значение pgcj оценки коэффициента усиления фиксированной кодовой книги в подкадре j(j=1,...,4) имеют отношение, как выражено ниже:
gcj= ×pgcj
Двумерную кодовую книгу может образовывать одиночная таблица или может образовывать множество таблиц, подобно двухкаскадной сопряженной структурированной кодовой книге в Справочной литературе 1. Если двумерная кодовая книга образована множеством таблиц, код VQ коэффициента усиления, соответствующий комбинации квантованного значения коэффициента усиления основного тона и квантованного значения коэффициента усиления фиксированной кодовой книги, соответствует комбинации индексов, определенных в таблицах, составляющих двумерную кодовую книгу, по отношению к комбинации квантованного значения коэффициента усиления основного тона и квантованного значения коэффициента усиления фиксированной кодовой книги, например (этап S111).
Блок 117b определения затем определяет, являются ли стационарными сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре (этап S112). Определение на этапе S112 основывается на том, удовлетворяет ли индекс, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, условию, в котором сигналы временной последовательности считаются являющимися высокостационарными. Примерные способы конкретного определения будут описаны ниже.
Конкретный случай 1 этапа S112
В конкретном случае 1 этапа S112 в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, используется индекс, который указывает отношение величины (амплитуды) сигналов временной последовательности, x(n)(n=0,...,L-1), к амплитуде остатков предсказания, полученных посредством анализа с линейным предсказанием сигналов x(n)(n=0,...,L-1) временной последовательности. В качестве условия, указывающего высокую стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, используется условие, в котором индекс, указывающий, что отношение амплитуды сигналов x(n)(n=0,...,L-1) временной последовательности к амплитуде остатков (остаточного сигнала) предсказания, полученных посредством анализа с линейным предсказанием сигналов x(n)(n=0,...,L-1) временной последовательности, больше указанного значения. Это происходит потому, что высокоэффективное линейное предсказание возможно в стационарном кадре, остатки предсказания становятся малыми, повышая отношение амплитуды сигналов x(n)(n=0,...,L-1) временной последовательности к амплитуде остатков предсказания.
Примером индекса, который указывает отношение амплитуды сигналов x(n)(n=0,...,L-1) временной последовательности к амплитуде остатков предсказания, полученных посредством анализа с линейным предсказанием сигналов x(n)(n=0,...,L-1) временной последовательности, является значение оценки усиления по предсказанию, которым является отношение энергии сигналов x(n)(n=0,...,L-1) временной последовательности к энергии остатков предсказания, как изложено ниже:
В Уравнении (2) km является коэффициентом PARCOR m-го порядка, определенного исходя из информации линейного предсказания LPC info. В этом случае, например, информация линейного предсказания LPC info вводится на блок 117b определения, и блок 117b определения определяет, является ли значение E оценки усиления по предсказанию, полученное исходя из информации линейного предсказания LPC info, больше указанного значения. Если значение оценки E усиления по предсказанию больше указанного значения, сигналы x(n)(n=0,...,L-1) временной последовательности для текущего кадра определяются являющимися стационарными; иначе сигналы x(n)(n=0,...,L-1) временной последовательности для текущего кадра определяются не являющимися стационарными (являющимися нестационарными).
Альтернативно может выполняться определение путем использования усиления по предсказанию, отношения абсолютных значений сигналов x(n)(n=0,...,L-1) временной последовательности к абсолютным значениям остатков предсказания или значения оценки отношения абсолютных значений сигналов x(n)(n=0,...,L-1) временной последовательности к абсолютным значениям остатков предсказания вместо значения E оценки усиления по предсказанию.
Имеет ли индекс значение больше указанного - может определяться путем проверки, удовлетворяется ли условие "индекс" > "указанное значение". Альтернативно, имеет ли индекс значение больше указанного, может определяться путем проверки, удовлетворяется ли условие "индекс" ("указанное значение"+"константа"). В этом случае указанное значение может задаваться в виде пороговой величины обработки или ("указанное значение"+"константа") может задаваться в виде пороговой величины обработки. То же применяется к описанному ниже определению, больше ли индекс указанного значения.
Конкретный случай 2 этапа S112
В конкретном случае 2 этапа S112 квантованный коэффициент усиления основного тона используется в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности. В качестве условия, указывающего, что сигналы x(n)(n=0,..., L-1) временной последовательности имеют высокую стационарность, используется условие, в котором квантованный коэффициент усиления основного тона имеет значение больше указанного. Это происходит потому, что в стационарном кадре периоды основного тона имеют высокую периодичность, и коэффициенты усиления основного тона являются большими.
В этом случае, например, квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона вводятся на блок 117b определения, и блок 117b определения определяет, является ли среднее квантованных коэффициентов gp =gp1 , gp2 , gp3 , gp4 усиления основного тона больше указанного значения. Если среднее квантованных коэффициентов gp =gp1 , gp2 , gp3 , gp4 усиления основного тона больше указанного значения, сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре определяются являющимися стационарными; иначе сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре определяются не являющимися стационарными (являющимися нестационарными). Вместо среднего квантованных коэффициентов gp =gp1 , gp2 , gp3 , gp4 усиления основного тона в определении можно использовать среднее значение квантованных коэффициентов усиления основного тона (среднее gp1 и gp3 , например) в некоторых подкадрах или квантованный коэффициент усиления основного тона (gp1 , например) в одном подкадре. Определение на основании квантованного коэффициента усиления основного тона в одном подкадре улучшится по рабочей характеристике, если одно наименьшее из квантованных коэффициентов усиления основного тона для всех подкадров в кадре используется для определения. Альтернативно сигналы могут определяться являющимися стационарными, если все квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона больше указанного значения, и сигналы могут определяться не являющимися стационарными (являющимися нестационарными), если по меньшей мере часть квантованных коэффициентов gp =gp1 , gp2 , gp3 , gp4 усиления основного тона не больше указанного значения. Альтернативно сигналы могут определяться являющимися стационарными, если заранее заданное число квантованных коэффициентов g p =gp1 ,gp2 ,gp3 ,gp4 усиления основного тона не больше указанного значения; иначе сигналы могут быть определены не являющимися стационарными (являющимися нестационарными).
Конкретный случай 3 этапа S112
В конкретном случае 3 этапа S112 в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, используется отношение между значением, соответствующим квантованному коэффициенту усиления основного тона, и значением, соответствующим квантованному коэффициенту усиления фиксированной кодовой книги. Пример критерия определения, использующего такой индекс, будет показан ниже. Критерий определения основывается на факте, что в стационарном кадре периоды основного тона имеют высокую периодичность, и отношение значения, соответствующего коэффициенту усиления основного тона, к значению, соответствующему коэффициенту усиления фиксированной кодовой книги, является большим.
Критерий определения: если отношение значения, соответствующего квантованному коэффициенту усиления основного тона, к значению, соответствующему квантованному коэффициенту усиления фиксированной кодовой книги, не меньше указанного значения или если отношение значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, к значению, соответствующему квантованному коэффициенту усиления основного тона, не больше указанного значения, то определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности являются стационарными. Примеры значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, включают сам квантованный коэффициент усиления фиксированной кодовой книги и квантованное значение поправочного множителя, описанного ранее. Примеры значения, соответствующего квантованному коэффициенту усиления основного тона, включают сам квантованный коэффициент усиления основного тона, среднее квантованных коэффициентов усиления основного тона и значение слабо монотонно возрастающей функции квантованного коэффициента усиления основного тона.
В этом случае, например, комбинация значения, соответствующего квантованному коэффициенту усиления основного тона, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, вводится на блок 117b определения, и блок 117b определения определяет, в соответствии с критерием определения, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими). Например, блок 117b определения выполняет это определение путем использования комбинации значения, соответствующего квантованному коэффициенту усиления основного тона, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги в одном подкадре (первом подкадре, например), чтобы определить, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими). Альтернативно блок 117b определения может выполнять определение в каждом подкадре путем использования комбинации значения, соответствующего квантованному коэффициенту усиления основного тона, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, в множестве подкадров, включенных в один кадр, в соответствии с критерием определения, и определение, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими), может осуществляться в соответствии с результатами определения. Если результаты всех определений, выполненных путем использования комбинаций значений, соответствующих квантованным коэффициентам усиления основного тона, и значений, соответствующих квантованным коэффициентам усиления фиксированной кодовой книги, в подкадрах указывают, что сигналы являются стационарными (периодическими), то может быть определено, что сигналы x(n)(n=0,...,L-1) временной последовательности являются стационарными (периодическими). Альтернативно если результаты определений, выполненных путем использования комбинаций значений, соответствующих квантованным коэффициентам усиления основного тона, и значений, соответствующих квантованным коэффициентам усиления фиксированной кодовой книги в заранее заданном или большем числе подкадров, указывают, что сигналы являются стационарными (периодическими), то может быть определено, что сигналы x(n)(n=0,...,L-1) временной последовательности являются стационарными (периодическими). Если критерий определения не удовлетворяется, то определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности не являются стационарными (являются нестационарными).
Конкретный случай 4 этапа S112
В конкретном случае 4 этапа S112 значение, соответствующее квантованному коэффициенту усиления основного тона, и значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги, используются в качестве индексов, которые указывают уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, и сравниваются с первым указанным значением и вторым указанным значением соответственно.
В стационарном кадре периоды основного тона обычно имеют высокую периодичность, и коэффициенты усиления основного тона являются высокими. В кадре в восходящей части речи, однако, периоды основного тона обычно имеют низкую периодичность от предшествующего кадра, и коэффициенты усиления основного тона являются низкими, но периоды основного тона имеют высокую периодичность внутри кадра. В кадре в восходящей части речи значения pgCj оценок коэффициентов фиксированной кодовой книги для текущего кадра, оцененных путем использования предыдущего кадра, являются малыми. Поскольку квантованные коэффициенты gc усиления фиксированной кодовой книги для текущего кадра определяются в виде gc = gc^×pgcj ( gc^ являются квантованными поправочными множителями), gc^ (значения, соответствующие квантованным коэффициентам усиления фиксированной кодовой книги) становятся большими в кадре в восходящей части речи. Следовательно, даже при малых значениях, соответствующих коэффициентам усиления основного тона, если значения, соответствующие квантованным коэффициентам усиления фиксированной кодовой книги, являются большими, кадр может рассматриваться являющимся стационарным. Напротив, при малых значениях, соответствующих коэффициентам усиления основного тона, если значения, соответствующие квантованным коэффициентам усиления фиксированной кодовой книги, являются малыми, кадр может рассматриваться не являющимся стационарным. Примеры критериев определения, использующих эти индексы, будут показаны ниже.
Критерий 1 определения: если значение, соответствующее квантованному коэффициенту усиления основного тона, меньше первого указанного значения и если значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги, меньше второго указанного значения, сигналы x(n)(n=0,...,L-1) временной последовательности определяются не являющимися стационарными (являющимися нестационарными).
Критерий 2 определения: если значение, соответствующее квантованному коэффициенту усиления основного тона, меньше первого указанного значения и если значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги, больше второго указанного значения, сигналы x(n)(n=0,...,L-1) временной последовательности определяются являющимися стационарными.
Примеры значений, соответствующих квантованным коэффициентам усиления основного тона, включают в себя сами квантованные коэффициенты усиления основного тона, среднее квантованных коэффициентов усиления основного тона и значения слабо монотонно возрастающей функции квантованных коэффициентов усиления основного тона. Примером квантованных коэффициентов усиления основного тона является g^ p (квантованные коэффициенты усиления адаптивной кодовой книги) в Непатентной литературе 1. Примеры значений, соответствующих квантованным коэффициентам усиления фиксированной кодовой книги, включают в себя сами квантованные коэффициенты усиления фиксированной кодовой книги и квантованные поправочные множители gc^. Примером квантованных поправочных множителей gc^ является gc^ (оптимальные значения для gc) в Непатентной литературе 1.
В этом случае, например, комбинация значения, соответствующего квантованному коэффициенту усиления основного тона, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, вводится на блок 117b определения, и блок 117b определения определяет, в соответствии с критерием 1 или 2 определения, не являются ли сигналы x(n)(n=0,...,L-1) временной последовательности нестационарными (непериодическими) (альтернативно, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими)). Блок 117b определения выполняет это определение путем использования комбинации значения, соответствующего квантованному коэффициенту усиления основного тона в данном подкадре (первом подкадре, например), и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, например, и определяет, не являются ли сигналы x(n)(n=0,...,L-1) временной последовательности нестационарными (непериодическими) (альтернативно, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими)). Альтернативно блок 117b определения выполняет определение на основании критерия 1 или 2 определения путем использования комбинации значения, соответствующего квантованному коэффициенту усиления основного тона в каждом подкадре из множества подкадров, включенных в тот же кадр, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, например, и определяет соответственно, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими). Если результаты всех определений, выполненных путем использования комбинаций значений, соответствующих квантованным коэффициентам усиления основного тона, и значений, соответствующих квантованным коэффициентам усиления фиксированной кодовой книги, в подкадрах указывают, что сигналы являются стационарными (периодическими), сигналы x(n)(n=0,...,L-1) временной последовательности могут быть определены являющимися стационарными (периодическими).
Альтернативно, если результаты определения, выполненного путем использования комбинаций значений, соответствующих квантованным коэффициентам усиления основного тона, и значений, соответствующих квантованным коэффициентам усиления фиксированной кодовой книги, в заданном или большем числе подкадров указывают, что сигналы являются стационарными (периодическими), сигналы x(n)(n=0,...,L-1) временной последовательности могут быть определены являющимися стационарными (периодическими). Другое условие может быть добавлено к критерию 1 или 2 определения, и фактическая разность может быть добавлена к критериям определения.
Конкретный случай 5 этапа S112
Конкретный случай 5 этапа S112 используется, если комбинация коэффициента усиления основного тона и коэффициента усиления фиксированной кодовой книги векторно квантуется, и комбинация квантованного коэффициента усиления основного тона и квантованного коэффициента усиления фиксированной кодовой книги связывается с кодом VQ коэффициента усиления на этапе S111. В этом случае код VQ коэффициента усиления используется в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности. Например, определение, выполняемое в конкретных случаях 2, 3 или 4 этапа S112, выполняется путем использования кода VQ коэффициента усиления в качестве индекса. Примерный способ определения, использующий код VQ коэффициента усиления в качестве индекса, будет описан ниже.
Как описано ранее, код VQ коэффициента усиления взаимно-однозначно соответствует комбинации квантованного значения коэффициента усиления основного тона и квантованного значения коэффициента усиления фиксированной кодовой книги или комбинации квантованного значения коэффициента усиления основного тона и квантованного значения для значения, соответствующего коэффициенту усиления фиксированной кодовой книги. Следовательно, каждый результат определения в конкретных случаях 2-4 этапа S112, описанных выше, может быть связан с кодом VQ коэффициента усиления. Более конкретно, в конкретном случае 2 этапа S112, поскольку определение выполняется путем использования квантованного коэффициента усиления основного тона в качестве индекса, код VQ коэффициента усиления, соответствующий квантованному коэффициенту усиления основного тона (значению, соответствующему квантованному коэффициенту усиления основного тона), используемый в качестве индекса, может быть связан с результатом определения. В конкретном случае 3 этапа S112, поскольку определение выполняется путем использования в качестве индекса отношения между значением, соответствующим квантованному коэффициенту усиления основного тона, и значением, соответствующим квантованному коэффициенту усиления фиксированной кодовой книги, то код VQ коэффициента усиления, соответствующий отношению, используемый в качестве индекса, и результат определения могут быть связаны друг с другом. В конкретном случае 4 этапа S112, поскольку определение выполняется путем использования в качестве индекса значения, соответствующего квантованному коэффициенту усиления основного тона, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, то код VQ коэффициента усиления, соответствующий комбинации значения, соответствующего квантованному коэффициенту усиления основного тона, и значения, соответствующего квантованному коэффициенту усиления фиксированной кодовой книги, используемый в качестве индекса, и результат определения могут быть связаны друг с другом. Следовательно, является возможным, что определения, не являются ли сигналы стационарными (являются нестационарными), выполняются заранее на основании любого из конкретных вариантов 2-4 этапа S112, описанных ранее, и таблица, связывающая такие результаты определения с кодами VQ коэффициентов усиления, соответствующими результатам определения, сохраняется в блоке 117b определения. Блок 117b определения может получать результат определения, соответствующий вводимому коду VQ коэффициента усиления, с помощью обращения к таблице. Альтернативно, поскольку разрешающие способности, используемые, чтобы выражать периоды основного тона и/или режим кодирования периода основного тона, определяются в соответствии с таким результатом определения, таблица, связывающая коды VQ коэффициентов усиления с разрешающими способностями, используемыми, чтобы выражать периоды основного тона и/или режимы кодирования периода основного тона, может сохраняться в блоке 117b определения. Затем блок 117b определения может получить разрешающую способность, используемую для выражения периода основного тона и/или режима кодирования периода основного тона, соответствующую вводимому коду VQ коэффициента усиления, с помощью обращения к таблице (конец описания конкретных вариантов 1-5 этапа S112).
Если на этапе S112 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, не удовлетворяет условию, которое указывает высокую стационарность сигналов x(n)(n=0,...,L-1) временной последовательности (если определяется, что сигналы являются нестационарными), переключатель 117c посылает периоды T=T1, T2, T3 , T4 основного тона на блок 117d кодирования периода основного тона под управлением блока 117b определения. Блок 117d кодирования периода основного тона выводит код, полученный путем кодирования, в каждом первом временном интервале, период основного тона выражен с первой разрешающей способностью, как будет описано далее (этап S113). Если на этапе S112 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, удовлетворяет условию, которое указывает высокую стационарность сигналов x(n)(n=0,...,L-1) временной последовательности (если определяется, что сигналы являются стационарными), переключатель 117c посылает периоды основного тона T=T1, T2 , T3, T4 на блок 117e кодирования периода основного тона под управлением блока 117b определения (фиг.5). Блок 117e кодирования периода основного тона выводит код, полученный путем кодирования, в каждом втором временном интервале, период основного тона выражен со вторым разрешением. Второе разрешение выше первого разрешения и/или второй временной интервал короче первого временного интервала. Например, блок 117e кодирования периода основного тона формирует код CT, соответствующий периоду T основного тона для текущего кадра, и выводит его (этап S114) таким же образом, как в традиционном случае (см. фиг.2A и 2B).
Конкретный случай 1 этапов S113 и S114
На этапе S113 (нестационарные) для этого случая блок 117d кодирования периода основного тона ограничивает разрешающие способности, используемые, чтобы выражать периоды основного тона T=T1, T2, T3, T4 целочисленным разрешением (первое разрешение), кодирует периоды T основного тона отдельно в каждом подкадре, и формирует код CT, соответствующий периодам T основного тона для текущего кадра. На фиг.8A представлен вид, иллюстрирующий примерную структуру кода CT, соответствующего периодам T основного тона для текущего кадра, формируемым на этапе S113. В примере, показанном на фиг.8A, периоды основного тона T=T1, T2, T3, T4 выражены с целочисленным разрешением в подкадрах от первого до четвертого, и каждый период из периодов T=T1, T2, T3, T 4 основного тона кодируется шестью битами (целочисленная часть периода основного тона).
На этапе S114 (стационарные) для этого случая блок 117e кодирования периода основного тона использует дробное разрешение (второе разрешение) или целочисленное разрешение в качестве разрешающих способностей, используемых, чтобы выражать периоды T1 и T3 основного тона, и кодирует их отдельно в соответствующих подкадрах. Блок 117e кодирования периода основного тона также кодирует разности между целочисленными частями периодов T2 и T4 основного тона, выраженных с дробным разрешением (второе разрешение), и целочисленными частями периодов T1 и T3 основного тона. Блок 117e кодирования периода основного тона дополнительно кодирует значения после десятичной точки (дробные части) периодов T2 и T4 основного тона отдельно двумя битами (см. фиг.2B).
Конкретный случай 2 для этапов S113 и S114
На этапе S113 (нестационарные) для этого случая блок 117d кодирования периода основного тона получает код, соответствующий периодам T основного тона в каждом временном интервале (первый временной интервал), составленном из множества подкадров, и формирует код CT, соответствующий периодам T основного тона для текущего кадра. Это означает, что код формируется путем использования общего периода T основного тона для множества подкадров (частота кодирования периода основного тона является сниженной). На фиг.8B представлен вид, иллюстрирующий примерную структуру кода C T, соответствующего периодам T основного тона для текущего кадра, формируемого на этапе S113. В примере, показанном на фиг.8B, один из кодов, полученный путем кодирования периодов T1 и T2 основного тона, выраженных с целочисленным разрешением, используется в качестве кода для периода T основного тона и для первого подкадра, и для второго подкадра, и один из кодов, полученный путем кодирования периодов T3 и T4 основного тона, выраженный с целочисленным разрешением, используется в качестве кода для периода T основного тона и для третьего подкадра, и для четвертого подкадра.
На этапе S114 (стационарные) для этого случая блок 117e кодирования периода основного тона кодирует каждый период из периодов T1, T2 , T3, T4 основного тона в каждом подкадре (второй временной интервал). В примере, показанном на фиг.2B, значения периодов T1 и T3 основного тона кодируются отдельно в каждом подкадре, кодируются разности между целочисленными частями периодов T2 и T4 основного тона и целочисленными частями периодов T1 и T3 основного тона, и значения после десятичной точки (дробные части) периодов T2 и T4 основного тона кодируются отдельно двумя битами (см. фиг.2B; конец описания конкретных вариантов 1 и 2 для этапов S113 и S114).
Код CT, соответствующий периодам T основного тона для текущего кадра, выводимый из блоков 117d или 117e кодирования периода основного тона, посылается на блок 117g синтеза посредством переключателя 117f под управлением блока 117b определения. Блок 117g синтеза формирует битовый поток BS путем объединения информации линейного предсказания LPC info, индексов Cf=C f1, Cf2, Cf3, Cf4 кодов, кода CT, соответствующего периодам T основного тона текущего кадра, кодов, представляющих квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона, и кодов, представляющих квантованные коэффициенты gc =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги, и выводит битовый поток. Битовый поток BS может включать в себя индексы, такие как коды VQ коэффициентов усиления вместо кодов, представляющих квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона, и кодов, представляющих квантованные коэффициенты gc =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги (этап S115).
Способ декодирования
На фиг.7B показана блок-схема, иллюстрирующая способ декодирования по вариантам осуществления. В основном будут описаны отличия от традиционного способа.
Битовый поток BS вводится на блок 127 декодирования параметров (фиг.6) в декодере 12. Блок 127 декодирования параметров декодирует битовый поток BS, чтобы сформировать исходя из битового потока BS, или отделяет от него информацию линейного предсказания LPC info, индексы Cf=Cf1, Cf2, Cf3, Cf4 кодов, код C T, соответствующий периодам T основного тона для текущего кадра, квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона и квантованные коэффициенты g c =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги и выводит их. Квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона и квантованные коэффициенты g c =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги получают путем декодирования кодов, представляющих квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона, и кодов, представляющих квантованные коэффициенты усиления gc =gc1 , gc2 , gc3 , gc4 фиксированной кодовой книги, включенных в битовый поток BS, или кодов VQ коэффициентов усиления, включенных в битовый поток BS (этап S121).
Затем, чтобы идентифицировать режим декодирования для кода CT, блок 127b определения определяет, являлись ли сигналы x(n)(n=0,...,L-1) временной последовательности, соответствующие битовому потоку BS текущего кадра, стационарными или нет (этап S122). Определение на этапе S122 основывается на том, удовлетворяет ли индекс, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, условию, в котором сигналы временной последовательности считаются являющимися высокостационарными. Определение выполняется путем использования того же способа, как используется на этапе S112, выполняемом кодером 11.
Если в кодере 11 используется конкретный случай 1 этапа S112
В этом случае блок 127b определения также использует индекс, который указывает отношение амплитуды сигналов x(n)(n=0,...,L-1) временной последовательности к амплитуде остатков предсказания, полученных путем анализа с линейным предсказанием сигналов x(n)(n=0,...,L-1) временной последовательности (предсказанное значение E усиления по предсказанию, например), в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности. Условие, указывающее, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными, является условием, в котором индекс, указывающий отношение амплитуды сигналов x(n)(n=0,...,L-1) временной последовательности к амплитуде остатков предсказания, полученных путем анализа с линейным предсказанием сигналов x(n)(n=0,...,L-1) временной последовательности, имеет значение выше указанного значения. Подробности определения являются одинаковыми с описанными в конкретном случае 1 этапа S112.
Если в кодере 11 используется конкретный случай 2 этапа S112
В этом случае блок 127b определения также использует квантованный коэффициент усиления основного тона в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности. В качестве условия, указывающего, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными, используется условие, в котором квантованный коэффициент усиления основного тона имеет значение выше указанного значения. Подробности определения являются одинаковыми с описанными в конкретном случае 2 этапа S112.
Если в кодере 11 используется конкретный случай 3 этапа S112
В этом случае блок 127b определения также использует отношение между значением, соответствующим квантованному коэффициенту усиления основного тона, и значением, соответствующим квантованному коэффициенту усиления фиксированной кодовой книги, в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности. Подробности определения являются одинаковыми с описанными в конкретном случае 3 этапа S112.
Если в кодере 11 используется конкретный случай 4 этапа S112
В этом случае блок 127b определения также использует значение, соответствующее квантованному коэффициенту усиления основного тона, и значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги в качестве индексов, которые указывают уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, и сравнивает их с первым указанным значением и вторым указанным значением соответственно. Подробности определения являются одинаковыми с описанными в конкретном случае 4 этапа S112.
Если в кодере 11 используется конкретный случай 5 этапа S112
В этом случае блок 127b определения использует каждый код из кодов VQ коэффициентов усиления, включенных в битовый поток BS, в качестве индекса, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности. Подробности определения являются одинаковыми с описанными в конкретном случае 5 этапа S112. Например, таблица, связывающая результаты определения, описанные в конкретном случае 5 этапа S112, с кодами VQ коэффициентов усиления, соответствующими результатам определения, сохраняется в блоке 127b определения, и блок 127b определения получает результат определения, соответствующий вводимому коду VQ коэффициента усиления, с помощью обращения к таблице. Как описано ранее, разрешающие способности, используемые, чтобы выражать периоды основного тона и/или режим кодирования периода основного тона, определяются в соответствии с результатом определения, и соответствующий режим декодирования также определяется. Следовательно, блок 127b определения может также хранить таблицу, связывающую коды VQ коэффициентов усиления с разрешающими способностями, используемыми, чтобы выражать периоды основного тона и/или режим декодирования периода основного тона. В этом случае блок 127b определения может получить разрешающие способности, используемые, чтобы выражать периоды основного тона и/или режим декодирования периода основного тона, соответствующие вводимому коду VQ коэффициента усиления, с помощью обращения к таблице (конец описания конкретных случаев этапа S122).
Способ декодирования для кода CT переключается в соответствии с результатом определения на этапе S122.
Если на этапе S122 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если определяется, что сигналы были нестационарными), переключатель 127f посылает код CT текущего кадра на блок 127d декодирования периода основного тона под управлением блока 127b определения. Блок 127d декодирования периода основного тона декодирует код CT посредством декодирования, соответствующего кодированию, выполняемому в блоке 117d кодирования периода основного тона (фиг.5), и выводит периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра (этап S123). Конкретные случаи обработки на этапе S123 описываются ниже.
Если в кодере 11 используется конкретный случай 1 этапа S113
В этом случае блок 127d декодирования периода основного тона извлекает из кода CT периоды T 1 , T2 , T3 и T4 основного тона для подкадров от первого до четвертого, выраженные с целочисленным разрешением (первое разрешение), и выводит их.
Если в кодере 11 используется конкретный случай 2 этапа S113
В этом случае блок 127d декодирования периода основного тона извлекает из кода CT каждый период основного тона для каждого временного интервала (первого временного интервала), составленного из множества подкадров, и выводит их. Другими словами, код, соответствующий периодам T основного тона, декодируется в режиме декодирования, который получает каждый период основного тона для каждого первого временного интервала. В примере, показанном на фиг.8B, где полным для первого и второго подкадров является первый временной интервал и полным для третьего и четвертого подкадров является первый временной интервал, один и тот же период T1 основного тона извлекается в качестве периодов T1 и T2 основного тона для первого и второго подкадров, и один и тот же период T3 основного тона извлекается в качестве периодов T3 и T4 основного тона для третьего и четвертого подкадров, и периоды T1 , T2 , T3 и T4 основного тона являются выходными (конец описания конкретных случаев этапа S123).
Если на этапе S122 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными, переключатель 127c посылает код CT текущего кадра на блок 127e декодирования периода основного тона под управлением блока 127b определения (фиг.6). Блок 127e декодирования периода основного тона декодирует код CT посредством декодирования, соответствующего кодированию, выполняемому в блоке 117e кодирования периода основного тона (фиг.5), и выводит периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра (этап S124). Блок 127e декодирования периода основного тона декодирует код, полученный путем кодирования, в каждом втором временном интервале, причем период основного тона выражен со вторым разрешением. Другими словами, код, соответствующий периодам основного тона, декодируется согласно режиму декодирования, который получает каждый период основного тона, выраженный со вторым разрешением, для каждого второго временного интервала. Например, блок 127e декодирования периода основного тона декодирует код CT для текущего кадра и выводит периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра таким же образом, как в традиционном случае. Конкретный случай этапа S124 будет описан ниже.
Если в кодере 11 используется конкретный случай 1 или 2 этапа S114
В этом случае блок 127e декодирования периода основного тона извлекает из кода C T период T1 основного тона для первого подкадра и период T3 основного тона для третьего подкадра и выводит их. Блок 127e декодирования периода основного тона также извлекает из кода CT разность между целочисленной частью периода основного тона для второго подкадра и целочисленной частью периода основного тона для первого подкадра, разность между целочисленной частью периода основного тона для четвертого подкадра и целочисленной частью периода основного тона для третьего подкадра, дробную часть периода основного тона для второго подкадра и дробную часть периода основного тона для четвертого подкадра.
Блок 127e декодирования периода основного тона, кроме того, получает период T2 основного тона второго подкадра путем сложения целочисленной части периода основного тона первого подкадра, полученной исходя из периода T1 основного тона первого подкадра, разность между целочисленной частью периода основного тона второго подкадра и целочисленной частью периода основного тона первого подкадра и дробную часть периода основного тона второго подкадра и выводит период T 2 основного тона второго подкадра.
Блок 127e декодирования периода основного тона дополнительно получает период T4 основного тона четвертого подкадра путем добавления целочисленной части периода основного тона для третьего подкадра, полученной исходя из периода T3 основного тона третьего подкадра, разность между целочисленной частью периода основного тона для четвертого подкадра и целочисленной частью периода основного тона для третьего подкадра и дробную часть периода основного тона для четвертого подкадра и выводит период T4 основного тона четвертого подкадра (конец описания конкретного случая этапа S124).
Декодированные периоды T =T1 , T2 , T3 , T4 основного тона текущего кадра выводятся переключателем 127c под управлением блока 127b определения. Блок 127 декодирования параметров выводит информацию линейного предсказания LPC info, индексы Cf=Cf1, Cf2, Cf3 , Cf4 кодов, квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона и квантованные коэффициенты g c =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги. Затем декодер 12 формирует синтезированные сигналы x (n)(n=0,...,L-1) и выводит сигналы таким же образом, как в традиционном случае.
Первая модификация первого варианта осуществления
В модификации первого варианта осуществления, описанного выше, в зависимости от того, определяются ли сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре как стационарные или нестационарные на этапе S112, блок 913 поиска (фиг.4) в кодере 11 может изменять диапазон поиска периодов T основного тона для будущего кадра, поступающего после текущего кадра. Например, если сигналы определяются как нестационарные, диапазон поиска периодов основного тона может быть сделан более узким, чем диапазон поиска, используемый, если сигналы определяются как стационарные, поскольку адаптивные компоненты сигнала вносят небольшой вклад.
Прежде чем блок 913 поиска осуществляет поиск периодов T основного тона для текущего кадра, определение, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности текущего кадра стационарными или нестационарными, может осуществляться путем использования значения E оценки усиления по предсказанию, сформированного путем использования информации линейного предсказания LPC info, сформированной для текущего кадра, и диапазон поиска периодов T основного тона в текущем кадре может быть изменен соответственно. Например, диапазон поиска, используемый, если сигналы определяются являющимися нестационарными, может быть сделан более узким, чем диапазон поиска, используемый, если сигналы определяются являющимися стационарными.
Альтернативно блок 913 поиска может выполнять обработку на текущем кадре еще раз после определения на этапе S112, являются ли сигналы стационарными или нестационарными, и диапазон поиска периодов T основного тона задается в соответствии с результатом.
Если сигналы определяются являющимися нестационарными и если периоды T основного тона кодируются в каждом временном интервале, составленном из множества подкадров (частота кодирования является сниженной), как в конкретном случае 2 этапа S113, частота вычисления периодов T основного тона посредством блока 913 поиска может быть снижена в кадре, в котором осуществлено определение нестационарности. Например, если один период основного тона кодируется для множества подкадров, только один период основного тона должен вычисляться для множества подкадров.
Вторая модификация первого варианта осуществления
В модификации первого варианта осуществления, описанной выше, в зависимости от того, определяются ли сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре как стационарные или нестационарные на этапе S112, блок 913 поиска (фиг.4) в кодере 11 может изменять разрешающие способности для периодов T основного тона, подлежащих вычислению в будущем кадре, поступающем после текущего кадра. Например, если сигналы определяются являющимися нестационарными, могут вычисляться периоды T основного тона, выраженные с целочисленным разрешением, и если сигналы определяются являющимися стационарными, могут вычисляться периоды T основного тона, выраженные с дробным разрешением.
Прежде чем блок 913 поиска вычисляет периоды T основного тона для текущего кадра, определение, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности для текущего кадра стационарными или нестационарными, может осуществляться путем использования значения E оценки усиления по предсказанию, сформированного с использованием информации линейного предсказания LPC info, сформированной для текущего кадра, и в соответствии с результатом можно выбирать, вычисляются ли периоды T основного тона для текущего кадра с целочисленным разрешением или с дробным разрешением. Например, если сигналы определяются являющимися нестационарными, могут вычисляться периоды T основного тона, выраженные с целочисленным разрешением, и если сигналы определяются являющимися стационарными, могут вычисляться периоды T основного тона, выраженные с дробным разрешением.
Альтернативно блок 913 поиска может выполнять обработку на текущем кадре еще раз, после определения на этапе S112, являются ли сигналы стационарными или нестационарными, и разрешающие способности для периодов T основного тона, подлежащих вычислению блоком 913 поиска, задаются в соответствии с результатом.
Третья модификация первого варианта осуществления
В модификации первого варианта осуществления число битов, назначаемых индексу Cf кода, может изменяться в соответствии с тем, определяются ли на этапе S112 сигналы x(n)(n=0,...,L-1) временной последовательности для текущего кадра как стационарные или нестационарные. Например, если сигналы определяются являющимися нестационарными, поскольку объем кода CT, соответствующего периодам T основного тона, становится меньше, чем используемый при определении сигналов являющимися стационарными, если особое значение придается улучшению качества при сходной битовой скорости, чем снижению битовой скорости, качество кодирования может быть повышено путем назначения индексу Cf кода числа битов, эквивалентного уменьшенному объему кода CT, соответствующего периодам T основного тона.
Четвертая модификация первого варианта осуществления
Вместо определения, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными или нет, и переключения разрешающих способностей, используемых для выражения периодов основного тона или режима кодирования периода основного тона соответственно, может определяться, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности периодическими или нет, и разрешающие способности, используемые, чтобы выражать периоды основного тона или режим кодирования периода основного тона, могут переключаться соответственно. Для обработки в этом случае "стационарный" заменяется "периодическим" и "нестационарный" заменяется "непериодическим" в описании, приведенном выше. Определение, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности периодическими или нет, также может осуществляться путем определения, имеют ли коэффициенты усиления по предсказанию или квантованные коэффициенты усиления основного тона значения больше указанного. Разрешающие способности используемые, чтобы выражать периоды основного тона и/или режим кодирования периода основного тона, могут переключаться в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, которое указывает высокую периодичность и/или высокую стационарность.
Пятая модификация первого варианта осуществления
В качестве индекса, используемого, чтобы определять, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности стационарными (периодическими) или нет, может использоваться разность между значением, соответствующим периоду основного тона для любого временного интервала, включенного в заранее заданный временной интервал (период основного тона или целочисленную часть периода основного тона, например), и значением, соответствующим периоду основного тона прошлого временного интервала перед временным интервалом, включенным в заранее заданный временной интервал. Если разность меньше указанного значения, сигналы могут быть определены являющимися стационарными (периодическими), иначе сигналы могут быть определены являющимися нестационарными (непериодическими). Определение, имеет ли индекс значение меньше указанного, может осуществляться путем определения, удовлетворяется ли условие "индекс" < "указанное значение", или путем определения, удовлетворяется ли условие "индекс" ("указанное значение" - "константа"). В этом случае указанное значение может задаваться в качестве пороговой величины обработки, и ("указанное значение" - "константа") также может задаваться в качестве пороговой величины обработки.
Шестая модификация первого варианта осуществления
Битовый поток BS может включать в себя дополнительную информацию для идентификации элементов, выбранных кодером 11, в соответствии с результатом определения относительно стационарности или периодичности (таких как разрешающие способности для периодов основного тона и режима кодирования). В этом случае декодер 12 может определять элементы (такие как разрешающие способности для периодов основного тона и режима декодирования), подлежащие выбору в соответствии с результатом определения относительно стационарности или периодичности, на основе дополнительной информации, включенной в битовый поток BS.
Второй вариант осуществления
Второй вариант осуществления является модификацией первого варианта осуществления или его модификаций от первой до шестой. Различиями между вторым вариантом осуществления и первым вариантом осуществления или его модификаций от первой до шестой являются подробности режима кодирования и режима декодирования периода основного тона, которые переключаются в соответствии с тем, являются ли сигналы временной последовательности стационарными (периодическими) или нет.
В сигналах временной последовательности, таких как речевые сигналы, периоды основного тона чуть изменяются в стационарном (периодическом) кадре, и весьма возможно, что разностью между периодами основного тона для подкадров, включенных в кадр, является нулевое или малое значение. Следовательно, в стационарном кадре эффективно применять кодирование с переменной длиной (слова) к разности между периодами основного тона для подкадров. Напротив, в кадре, который не является стационарным (периодическим), поскольку такие разности имеют значительную неравномерность, кодирование с переменной длиной не является эффективным во многих случаях.
Следовательно, в обработке кодирования периода основного тона согласно второму варианту осуществления, если индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, период основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, кодируется, и разность между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим периоду основного тона во временном интервале, отличном от второго заранее заданного временного интервала, кодируется с переменной длиной. В примерном случае, описанном ниже, "заранее заданный временной интервал" означает кадр, "первый заранее заданный временной интервал" означает первый и третий подкадры, "второй заранее заданный временной интервал" означает второй и четвертый подкадры, и "значение, соответствующее периоду основного тона", означает целочисленную часть периода основного тона. Однако этот пример не ограничивает настоящее изобретение.
Конфигурация
Конфигурации кодера 21 и декодера 22 согласно второму варианту осуществления будут описаны ниже со ссылкой на фиг.4-6.
Как показано на фиг.4 в виде примера, кодер 21 по второму варианту осуществления отличается от кодера 11 по первому варианту осуществления тем, что блок 117 кодирования параметров заменен блоком 217 кодирования параметров. Декодер 22 по второму варианту осуществления отличается от декодера 12 по первому варианту осуществления тем, что блок 127 декодирования параметров заменен блоком 227 декодирования параметров.
Как показано на фиг.5 в виде примера, блок 217 кодирования параметров по второму варианту осуществления отличается от блока 117 кодирования параметров по первому варианту осуществления тем, что блок 117d кодирования периода основного тона заменен блоком 217d кодирования периода основного тона, и блок 117e кодирования периода основного тона заменен блоком 217e кодирования периода основного тона. Как показано на фиг.6 в виде примера, блок 227 декодирования параметров по второму варианту осуществления отличается от блока 127 декодирования параметров по первому варианту осуществления тем, что блок 127d декодирования периода основного тона заменен блоком 227d декодирования периода основного тона, и блок 127e декодирования периода основного тона заменен блоком 227e декодирования периода основного тона.
Способ кодирования
Способ кодирования по второму варианту осуществления будет описан ниже со ссылкой на фиг.7A.
В способе кодирования по второму варианту осуществления описанный ниже этап S213 исполняется вместо этапа S113 по первому варианту осуществления, и описанный ниже этап S214 исполняется вместо этапа S114 по первому варианту осуществления. Другие этапы могут быть одинаковыми с таковыми в первом варианте осуществления или его модификациях. Только обработка по этапу S213 и этапу S214 настоящего варианта осуществления будет описана ниже.
Обработка по этапу S213
Если на этапе S112 определяется, что сигналы являются нестационарными (непериодическими), переключатель 117c посылает периоды T=T1, T2, T3 , T4 основного тона на блок 217d кодирования периода основного тона (фиг.5) под управлением блока 117b определения. Блок 217d кодирования периода основного тона формирует код C T, соответствующий периодам T основного тона для текущего кадра путем использования, например, такого же способа (конкретный случай 1 этапа S213), как в традиционном случае (фиг.2A и 2B), или такого же способа (конкретный случай 2 этапа S213), как на этапе S113 (фиг.8) первого варианта осуществления, и выводит код (этап S213).
Обработка по этапу S214
Если на этапе S112 определяется, что сигналы являются стационарными (периодическими), переключатель 117c посылает периоды T=T1, T2, T3, T 4 основного тона на блок 217e кодирования периода основного тона под управлением блока 117b определения. Блок 217e кодирования периода основного тона кодирует периоды T1 и T 3 основного тона (разности от (значения) минимального периода основного тона) для первого и третьего подкадров (первые заранее заданные временные интервалы) таким же образом, как в традиционном случае (фиг.2A, фиг.2B и фиг.3) в каждом подкадре отдельно. Блок 217e кодирования периода основного тона также применяет кодирование с переменной длиной к разности TD(1,2) между целочисленной частью периода T2 основного тона (значение, соответствующее периоду основного тона) для второго подкадра (второй заранее заданный временной интервал) и целочисленной частью периода T 1 основного тона для первого подкадра (временной интервал, отличный от второго заранее заданного временного интервала) и применяет кодирование с переменной длиной к разности TD(3,4) между целочисленной частью периода T4 основного тона для четвертого подкадра (второй заранее заданный временной интервал) и целочисленной частью периода T3 основного тона для третьего подкадра (временной интервал, отличный от второго заранее заданного временного интервала). Разностью TD( , ) может быть либо (целочисленная часть периода T основного тона) - (целочисленная часть периода T основного тона), либо (целочисленная часть периода T основного тона) - (целочисленная часть периода T основного тона), но необходимо использовать одно из них и в кодере, и в декодере. Дробные части периодов T 2 и T4 основного тона для второго и четвертого подкадров кодируются каждый с помощью фиксированного числа битов (например, двумя битами).
Как описано выше, блок 217e кодирования периода основного тона кодирует периоды T 1 и T3 основного тона для первого и третьего подкадров в каждом подкадре отдельно, применяет кодирование с переменной длиной к разностям TD(1,2) и TD(3,4) и кодирует дробные части периодов T2 и T4 основного тона фиксированным числом битов, чтобы сформировать код CT, соответствующий периодам T=T1, T2, T3, T 4 основного тона для текущего кадра, и выводит его (этап S214). Способ кодирования с переменной длиной, применяемый к разности TD(1,2) и разности TD(3,4) в настоящем варианте осуществления, будет описан ниже в виде примера.
Конкретный случай 1 способа кодирования с переменной длиной
В этом случае, если (абсолютная) величина разности TD(1,2) и величина разности TD(3,4) являются обе нулевыми, специальный бит (такой как "0") назначается в качестве кодов, соответствующих разности TD(1,2) и разности TD(3,4); и в других ситуациях общее число в четыре бита, которое включает один бит (такой как "1"), указывающий "другие ситуации", и три бита, указывающие разность TD(1,2), и общее число в четыре бита, которое включает в себя один бит (такой как "1"), указывающий "другие ситуации", и три бита, указывающие разность TD(3,4), назначаются в качестве кодов, соответствующих разности TD(1,2) и разности TD(3,4).
Конкретный случай 2 способа кодирования с переменной длиной
В этом случае, если разностью TD(1,2) и разностью TD(3,4) является 1, нуль или +1, то используются коды, полученные путем применения кодирования с переменной длиной к разности TD(1,2) и разности TD(3,4); и в других ситуациях в качестве кода используются один бит (такой как "1"), указывающий "другие ситуации", и четыре бита, указывающие разность. Например, кодирование с переменной длиной применяется к разности TD(1,2) и разности TD(3,4), как показано ниже.
Таблица 1 | ||||
Код | Разность | Число битов | Ожидаемая частота | Математическое ожидание длины кода |
"01" | 0 | 2 | 0,25 | 0,5 |
"000" | -1 | 3 | 0,125 | 0,375 |
"001" | +1 | 3 | 0,125 | 0,375 |
"1"+"XXXX" | Другие | 1+4 | 0,5 | 2,5 |
3,75 |
В случае Таблицы 1, поскольку количество информации увеличивается на 25%, если разности являются отличными от -1, 0, или +1, число битов не уменьшается при высокой частоте, где разность является отличной от -1, 0 или +1. Если кодом является "1"+"XXXX", поскольку три значения в - 1, 0 и +1 не обозначаются среди этих 16 разностей, соответствующих XXXX, является возможным обозначать с помощью XXXX эти 13 разностей и использовать оставшиеся три кода для другого назначения, такого как флаги для специальной обработки. Альтернативно является возможным дополнительно снизить средний объем кода путем использования таблицы соответствия, выполненной заранее для 13(=16-3) разностей, обозначаемых "1"+"XXXX", чтобы выражать тремя битами только две разности, которые происходят весьма часто, и четырьмя битами - остальные 11 разностей.
Конкретный случай 3 способа кодирования с переменной длиной
В этом случае информация, полученная путем объединения разностей, кодируется с переменной длиной, где каждой из разностей является разность между значением, соответствующим каждому из периодов основного тона из множества вторых заранее заданных временных интервалов, включенных в заранее заданный временной интервал, отличный от первых заранее заданных временных интервалов, и значением, соответствующим каждому из периодов основного тона во временных интервалах, отличных от вторых заранее заданных временных интервалов, включенных в заранее заданный временной интервал. Как описано ранее, в описанном ниже примерном случае "заранее заданный временной интервал" означает кадр, "первые заранее заданные временные интервалы" означают первый и третий подкадры, "вторые заранее заданные временные интервалы" означают второй и четвертый подкадры и "значение, соответствующее периоду основного тона" означает целочисленную часть периода основного тона.
В этом случае, если разность TD(1,2) и разность TD(3,4) обе являются нулем, специальный однобитовый код (условного) обозначения (такой как "1") назначается в качестве кода, соответствующего разности TD(1,2) и разности TD(3,4). Имеются четыре состояния, в которых либо разность TD(1,2), либо разность TD(3,4) является нулем, а другая является или +1, или -1. В текущем случае общее число в четыре бита, которые включают в себя двухбитовый код обозначения (такой как "00"), указывающий, что имеет место одно из четырех состояний, и два бита ("00", "01", "10", или "11"), идентифицирующих какое-либо из четырех состояний, назначаются в качестве кода, соответствующего разности TD(1,2) и разности TD(3,4). В других ситуациях общее число в десять битов, которые включают в себя двухбитовый код обозначения (такой как "01"), указывающий другие ситуации, четыре бита, выражающие разность TD(1,2), и четыре бита, выражающие разность TD(3,4), назначаются в качестве кода, соответствующего разности TD(1,2) и разности TD(3,4). Например, разность TD(1,2) и разность TD(3,4) совместно кодируются с переменной длиной, как описано ниже.
Таблица 2 | ||
Разность TD(1,2) | Разность TD(3,4) | Код |
0 | 0 | "1" |
0 | +1 | "0000" |
0 | -1 | "0001" |
+1 | 0 | "0010" |
-1 | 0 | "0011" |
Другие | "01"+"XXXXXXXX" |
Конкретный случай 4 способа кодирования с переменной длиной
В этом случае, если разность TD(1,2) и разность TD(3,4), описанные ранее, обе являются нулем, специальный двухбитовый код обозначения (такой как "01") назначается в качестве кода, соответствующего разности TD(1,2) и разности TD(3,4). Имеются четыре состояния, в которых или разность TD(1,2), или разность TD(3,4) является нулем, а другая является или +1, или -1; и имеются два состояния, в которых либо разность TD(1,2), либо разность TD(3,4) является -1, а другая является +1. В текущем случае общее число в четыре или пять битов, которые включают в себя двухбитовый код обозначения (такой как "00"), указывающий, что имело место одно состояние из общего числа в шесть состояний, и два или три бита (такие как "00", "01", "100", "101", "110" или "111"), идентифицирующие каждое состояние, назначаются в качестве кода, соответствующего разности TD(1,2) и разности TD(3,4). В других ситуациях общее число в девять битов, которые включают в себя однобитовый код обозначения (такой как "1"), указывающий другие ситуации, четыре бита, выражающие разность TD(1,2), и четыре бита, выражающие разность TD(3,4), назначаются в качестве кода, соответствующего разности TD(1,2) и разности TD(3,4). Например, разность TD(1,2) и разность TD(3,4) совместно кодируются с переменной длиной, как описано на фиг.9A и 9B и ниже в виде примера.
Таблица 3 | ||
Разность TD(1,2) | Разность TD(3,4) | Код |
0 | 0 | "01" |
0 | +1 | "0000" |
0 | -1 | "0001" |
+1 | 0 | "00100" |
-1 | 0 | "00101" |
+ 1 | -1 | "00110" |
-1 | +1 | "00111" |
Другие | "1"+"XXXXXXXX" |
В Таблице 3 длины кода для кода ("00110"), назначаемого, если разностью TD(1,2) является +1 и разностью TD(3,4) является -1 и кода ("00111"), назначаемого, если разностью TD(1,2) является -1, и разностью TD(3,4) является +1, больше длины кода для кода ("0000" или "0001), назначаемого, если разностью TD(1,2) является нуль и разностью TD(3,4) является или +1, или -1. Это происходит потому, что частота является малой для варианта, где разностью TD(1,2) является +1 и разностью TD(3,4) является -1, и для варианта, где разностью TD(1,2) является -1 и разностью TD(3,4) является +1.
Ожидаемая частота каждого состояния показана ниже в виде примера.
Таблица 4 | |||
Код | Число битов | Ожидаемая частота | Математическое ожидание длины кода TD(1,2) и TD(3,4) |
"01" | 2 | 0,25 | 0,25 |
"000"+Z | 3+1 | 0,25 | 1,0 |
"001"+YY | 3+2 | 0,1 | 0,5 |
"1"+"XXXXXXXX" | 1+8 | 0,4 | 3,6 |
5,35 |
При выполнении кодирования в виде назначения, показанного в Таблице 3, при ожидаемой частоте, указанной в Таблице 4, математическое ожидание длины кода для кода, соответствующего разностям TD(1,2) и TD(3,4), составляет 5,35 битов в среднем, каковое является сокращением в 2,65 битов от полной длины кода в 8 битов, получаемой при кодировании каждой из разностей TD(1,2) и TD(3,4) четырьмя битами. Эта ожидаемая частота предназначена для кадров, имеющих высокую стационарность (например, для 40% от всех кадров). В кадрах с низкой стационарностью разности TD(1,2) и TD(3,4) имеют малое расхождение, и их распределения являются широкими. Следовательно, если кодирование выполняется только при стационарных сигналах в принятии решения на этапе S112, описанном ранее, может быть получен эффект высокой компрессии в кодировании с переменной длиной. Если условие на этапе S112 (условие для определения, что сигналы являются стационарными) делается слишком строгим, поскольку снижается частота, с которой применяется кодирование с переменной длиной, эффект снижения объема информации является ограниченным. Напротив, если условие на этапе S112 (условие для определения, что сигналы являются стационарными) делается слишком нестрогим, эффект высокой компрессии, обусловленный кодированием с переменной длиной, не получается, приводя к возможности увеличения среднего числа битов от такового в традиционном случае в некоторых частных случаях. Следовательно, необходимо надлежащим образом настраивать условие (использующееся) на этапе S112.
Способ декодирования
Способ декодирования по второму варианту осуществления будет описан ниже со ссылкой на фиг.7B.
В способе декодирования по второму варианту осуществления этап S223, описанный ниже, исполняется вместо этапа S123 по первому варианту осуществления, и описанный ниже этап S224 исполняется вместо этапа S124 по первому варианту осуществления. Остальные этапы могут быть одинаковыми с таковыми в первом варианте осуществления или его модификациях. Только обработка по этапу S223 и этапу S224 настоящего варианта осуществления будет описана ниже.
Обработка по этапу S223
Если на этапе S122 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если определено, что сигналы были нестационарными), переключатель 127f посылает код CT текущего кадра на блок 227d декодирования периода основного тона под управлением блока 127b определения. Блок 227d декодирования периода основного тона декодирует код CT в обработке декодирования, соответствующей обработке кодирования, исполняемой блоком 217d кодирования периода основного тона (фиг.5), и выводит периоды T =T1 , T2 , T3 , T4 основного тона (этап S223). Например, при исполнении кодером 21 обработки для конкретного случая 1 этапа S213, чтобы формировать код CT для текущего кадра (см. фиг.2A и 2B), периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра формируются исходя из кода CT таким же способом, как в традиционном случае. Альтернативно, например, при исполнении кодером 21 обработки для конкретного случая 2 этапа S213, чтобы формировать код C T для текущего кадра, периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра формируются на основе кода CT в обработке по этапу S123 первого варианта осуществления, которая соответствует обработке конкретного случая 2.
Обработка по этапу S224
Если на этапе S122 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если определено, что сигналы были стационарными), переключатель 127f посылает код CT для текущего кадра на блок 227e декодирования периода основного тона под управлением блока 127b определения. Блок 227e декодирования периода основного тона декодирует код CT в обработке декодирования, соответствующей обработке кодирования, исполняемой блоком 217e кодирования периода основного тона (фиг.5), и выводит периоды основного тона T =T1 ,T2 ,T3 ,T4 для текущего кадра (этап S224).
Третий вариант осуществления
Третий вариант осуществления является модификацией первого варианта осуществления, его модификацией от первой до шестой, или второго варианта осуществления. Различиями между третьим вариантом осуществления и первым вариантом осуществления, модификациями от первой до шестой такового, и вторым вариантом осуществления являются подробности режима кодирования и режима декодирования периода основного тона, которые переключаются в соответствии с тем, являются ли сигналы временной последовательности стационарными (периодическими) или нет.
Если сигналы являются высокостационарными (периодическими), другими словами, если квантованные коэффициенты усиления основного тона и коэффициенты усиления по предсказанию больше указанных значений, или если разности TD(1,2) и TD(3,4) меньше указанных значений, разность между периодом T1 основного тона для первого подкадра и периодом T3 основного тона для третьего подкадра также является малой во многих случаях. Следовательно, в обработке кодирования по настоящему варианту осуществления, если сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими), разность TD(1,3) между значением, соответствующим периоду T3 основного тона (например, целочисленной частью периода T3 основного тона), и значением, соответствующим, периоду основного тона T 1 (например, целочисленной частью периода T1 основного тона), кодируется с переменной длиной.
Другими словами, также в обработке кодирования периода основного тона согласно третьему варианту осуществления, если индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, кодируется период основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, и разность между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим периоду основного тона во временном интервале, включенном в заранее заданный временной интервал, отличный от второго заранее заданного временного интервала, кодируется с переменной длиной. В настоящем варианте осуществления, "заранее заданный временной интервал" означает кадр, "первый заранее заданный временной интервал" означает первый подкадр, "второй заранее заданный временной интервал" означает третий подкадр, "временной интервал, отличный от второго заранее заданного временного интервала" означает первый подкадр, и "значение, соответствующее периоду основного тона" означает целочисленную часть периода основного тона. Однако эти назначения не ограничивают настоящее изобретение. В нижеследующем описании в основном будут описаны отличия от первого варианта осуществления, его модификаций от первой до шестой и второго варианта осуществления.
Конфигурация
Конфигурации кодера 31 и декодера 32 согласно третьему варианту осуществления описываются ниже со ссылкой на фиг.4-6.
Как показано на фиг.4 в виде примера, кодер 31 по третьему варианту осуществления отличается от кодера 11 по первому варианту осуществления тем, что блок 117 кодирования параметров заменен блоком 317 кодирования параметров. Декодер 32 по третьему варианту осуществления отличается от декодера 12 по первому варианту осуществления тем, что блок 127 декодирования параметров заменен блоком 327 декодирования параметров.
Как показано на фиг.5 в виде примера, блок 317 кодирования параметров по третьему варианту осуществления отличается от блока 117 кодирования параметров по первому варианту осуществления тем, что блок 117b определения заменен блоком 317b определения, блок 117d кодирования периода основного тона заменен блоком 317d кодирования периода основного тона, и блок 117e кодирования периода основного тона заменен блоком 317e кодирования периода основного тона. Как показано на фиг.6 в виде примера, блок 327 декодирования параметров по третьему варианту осуществления отличается от блока 127 декодирования параметров по первому варианту осуществления тем, что блок 127b определения заменен блоком 327b определения, блок 127d декодирования периода основного тона заменен блоком декодирования периода основного тона 327d и блок 127e декодирования периода основного тона заменен блоком 327e декодирования периода основного тона.
Способ кодирования
Способ кодирования по третьему варианту осуществления будет описан ниже со ссылкой на фиг.7A.
В способе кодирования по третьему варианту осуществления этап S312, описанный ниже, исполняется вместо этапа S112 из первого варианта осуществления; этап S313, описанный ниже, исполняется вместо этапа S113 из первого варианта осуществления; и этап S314, описанный ниже, исполняется вместо этапа S114 из первого варианта осуществления. Другие этапы могут быть одинаковыми с таковыми в первом варианте осуществления или его модификациях. Только обработка по этапу S312, этапу S313 и этапу S314 по настоящему варианту осуществления будет описана ниже.
Обработка по этапу S312
На этапе S312 блок 317b определения определяет, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре стационарными (периодическими) или нет (этап S312). Определение на этапе S312 может выполняться таким же образом, как таковое на этапе S112 из первого варианта осуществления. В третьем варианте осуществления будет описан случай, в котором величина разности между значением, соответствующим периоду основного тона для временного интервала, включенного в заранее заданный временной интервал, и значением, соответствующим периоду основного тона прошлого временного интервала прежде временного интервала, включенного в заранее заданный временной интервал, используется в качестве индекса; если индекс меньше указанного значения, определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности являются стационарными (периодическими); и в противном случае определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности являются нестационарными (непериодическими). В нижеследующем случае величина разности TD(1,2) и/или величина разности TD(3,4) используется в качестве индекса, и определяется, являются ли сигналы временной последовательности стационарными (периодическими) или нет.
Конкретный случай 1 этапа S312
В конкретном случае 1 этапа S312 периоды T1 и T 2 основного тона вводятся на блок 317b определения. Блок 317b определения использует в качестве индекса величину разности TD(1,2), которая является разностью между целочисленными частями периодов T1 и T2 основного тона и определяет, имеет ли индекс значение меньше указанного. Если величина разности TD(1,2) меньше указанного значения, то определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются стационарными (периодическими); и в противном случае определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются нестационарными (непериодическими).
Определение, является ли "индекс < указанного значения", может использоваться, чтобы определять, имеет ли индекс значение меньше указанного; или определение, является ли "индекс (указанное значение - константа)", может использоваться, чтобы определять, имеет ли индекс значение меньше указанного. В этих случаях указанное значение может использоваться в качестве пороговой величины обработки или (указанное значение - константа) может использоваться в качестве пороговой величины обработки. То же самое применяется к определению, имеет ли индекс значение меньше указанного, для других случаев, подлежащих описанию ниже. Вместо разности TD(1,2), которая является разностью между целочисленными частями периодов T1 и T2 основного тона, разность TD(3,4), являющаяся разностью между целочисленными частями периодов T3 и T4 основного тона, может использоваться в качестве индекса.
Конкретный случай 2 этапа S312
В конкретном случае 2 этапа S312 периоды T1,T2,T3 и T4 основного тона вводятся на блок 317b определения. Блок 317b определения использует в качестве индексов величину разности TD(1,2) и величину разности TD(3,4) и определяет, имеют ли обе значение меньше указанного. Если и величина разности TD(1,2), и величина разности TD(3,4) меньше указанного значения, то определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются стационарными (периодическими); и в противном случае определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются нестационарными (непериодическими).
Конкретный случай 3 этапа S312
Также в конкретном случае 3 этапа S312 периоды T1,T 2,T3,T4 основного тона вводятся на блок 317b определения. Блок 317b определения определяет, является ли разность TD(1,2) меньше указанного значения A и является ли разность TD(3,4) меньше указанного значения B. Если эти условия удовлетворяются, то определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются стационарными (периодическими); и в противном случае определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются нестационарными (непериодическими).
Конкретный случай 4 этапа S312
Также в конкретном случае 4 этапа S312 периоды T1, T2 , T3 и T4 основного тона вводятся на блок 317b определения. Блок 317b определения определяет, является ли разность TD(1,2) больше указанного значения A1 и меньше указанного значения A2 и является ли разность TD(3,4) больше указанного значения B1 и меньше указанного значения B2. Если эти условия удовлетворяются, определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются стационарными (периодическими); и в противном случае определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются нестационарными (непериодическими).
Конкретный случай 5 этапа S312
Комбинация одного из определений, используемых в конкретных случаях 1-4 этапа S312, и одного из определений на этапе S112 из первого варианта осуществления может использоваться, чтобы определять, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре стационарными (периодическими) или нет.
Обработка по этапу S313
Если на этапе S312 определяется, что сигналы являются нестационарными (непериодическими), переключатель 117c посылает периоды T=T1, T2 , T3, T4 основного тона на блок 317d кодирования периода основного тона (фиг.5) под управлением блока 317b определения. Блок 317d кодирования периода основного тона формирует код C T, соответствующий периодам T основного тона текущего кадра, путем использования, например, такого же способа (конкретный случай 1 этапа S313), как в традиционном случае (фиг.2A и 2B), или такого же способа (конкретный случай 2 этапа S313), как на этапе S113 (фиг.8B) первого варианта осуществления, и выводит код (этап S313).
Обработка по этапу S314
Если на этапе S312 определяется, что сигналы являются стационарными (периодическими), переключатель 117c посылает периоды T=T1, T2, T3, T 4 основного тона на блок 317e кодирования периода основного тона под управлением блока 317b определения. На фиг.10A-10C показаны примерные способы кодирования периода основного тона в третьем варианте осуществления, если сигналы временной последовательности являются стационарными (периодическими).
Как показано в виде примера на фиг.10A, блок 317e кодирования периода основного тона кодирует разность TD(1,2) между целочисленной частью периода T2 основного тона во втором подкадре и целочисленной частью периода T1 основного тона в первом подкадре и разность TD(3,4) между целочисленной частью периода T4 основного тона в четвертом подкадре и целочисленной частью периода T3 основного тона в третьем подкадре (целочисленные части разности) отдельно и кодирует отдельно значения после десятичной точки периодов T2 и T4 (дробные части) основного тона. Кроме того, блок 317e кодирования периода основного тона кодирует период T1 основного тона первого подкадра в каждом подкадре отдельно. Способом кодирования для первого, второго и четвертого подкадров может быть, например, такой же, как в традиционном случае. Кроме того, в зависимости от разности TD(1,3) блок 317e кодирования периода основного тона либо применяет кодирование с переменной длиной к разности TD(1,3) между целочисленной частью периода T3 основного тона для третьего подкадра и целочисленной частью периода T1 основного тона для первого подкадра (фиг.10B), либо кодирует период T3 основного тона третьего подкадра в каждом подкадре отдельно (фиг.10C), чтобы формировать код X3 для периода T3 основного тона для третьего подкадра (фиг.10A). Если разность TD(1,3) кодируется с переменной длиной, дробная часть периода T3 основного тона кодируется числом битов, соответствующим величине целочисленной части периода T3 основного тона. Например, если целочисленная часть периода T3 основного тона равна минимальному значению Tmin или больше него и меньше T , блок 317e кодирования периода основного тона кодирует дробную часть двумя битами; если целочисленная часть периода T3 основного тона имеет значение от T до TB, блок 317e кодирования периода основного тона кодирует дробную часть одним битом; и если целочисленная часть периода T3 основного тона имеет значение, равное TB или больше него и до максимального значения T max, блок 317e кодирования периода основного тона не кодирует дробную часть (фиг.10B). При вышеупомянутой обработке блок 317e кодирования периода основного тона формирует код CT , соответствующий периодам T=T1, T2, T 3, T4 основного тона, и выводит код. Примерный способ кодирования для периода T3 основного тона будет описан ниже.
Конкретный случай 1 способа кодирования для периода T3 основного тона
В этом случае, если описанная выше разность TD(1,3) является нулем, однобитовый код обозначения (такой как "1") назначается в качестве кода, соответствующего разности TD(1,3). Если разностью TD(1,3) является либо -1, либо +1, трехбитовый код обозначения (такой как "000" или "001") назначается в качестве кода, соответствующего разности TD(1,3). Если разностью TD(1,3) является другое значение, формируется код общим числом в девять битов, составленный из двухбитового кода обозначения (такого как "01"), указывающего, что разностью TD(1,3) является другое значение, и семи битов, соответствующих периоду T3 основного тона. Например, период T 3 основного тона кодируется, как показано ниже в виде примера.
Таблица 5 | ||||
Код | Разность TD(1,3) | Число битов | Ожидаемая частота | Математическое ожидание длины кода |
"1" | 0 | 1 | 0,5 | 0,5 |
"000" | -1 | 3 | 0,1 | 0,3 |
"001" | +1 | 3 | 0,1 | 0,3 |
"01"+"VVVVVVV" | Другие | 9 | 0,3 | 2,7 |
3,8 |
При ожидаемой частоте, указанной в Таблице 5, математическое ожидание длины кода для кода, используемого для выражения периода T3 основного тона, может быть уменьшено на 3,2 бита с 7 битов в традиционном случае. Ожидаемую частоту в Таблице 5 получают, если на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), только если величина разности TD(1,2) меньше 1 (если разность TD(1,2) равна нулю). В текущем случае ожидается, что частотой кадров, где на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), является 25% от полной, и объем кода, используемый для выражения периода T3 основного тона, снижается на 0,8 бита в среднем.
Конкретный случай 2 способа кодирования для периода T3 основного тона
В этом случае, если описанная выше разность TD(1,3) является нулем, однобитовый код обозначения (такой как "1"), который указывает, что разностью TD(1,3) является нуль, назначается в качестве кода, соответствующего разности TD(1,3). Если разностью TD(1,3) является либо -1, либо +1, трехбитовый код обозначения (такой как "000" или "001") назначается в качестве кода, соответствующего разности TD(1,3). Если разность TD(1,3) является отличной от нуля, -1 и +1, и может быть выражена четырьмя битами или менее, код, общим числом в семь битов, составленный из трехбитового кода обозначения (такого как "010"), указывающего, что разность TD(1,3) является отличной от нуля, -1 и +1, и может быть выражена четырьмя битами или менее, и четырех битов, выражающих разность TD(1,3), назначается разности TD(1,3). Если разность TD(1,3) является другим значением, формируется код общим числом в 10 битов, составленный из трехбитового кода обозначения (такого как "001"), указывающего, что разностью TD(1,3) является другое значение, и семи битов, соответствующих периоду T 3 основного тона. Например, период T3 основного тона кодируется, как показано ниже в виде примера.
Таблица 6 | ||||
Код | Разность TD(1,3) | Число битов | Ожидаемая частота | Математическое ожидание длины кода |
"1" | 0 | 1 | 0,30 | 0,3 |
"000" | -1 | 3 | 0,15 | 0,45 |
"001" | +1 | 3 | 0,15 | 0,45 |
"010"+"XXXX" | в пределах 4 битов | 7 | 0,20 | 1,4 |
"011"+"VVVVVVV" | Другие | 10 | 0,20 | 2,00 |
4,6 |
При ожидаемой частоте, указанной в Таблице 6, математическое ожидание длины кода для кода, используемого для выражения периода T3 основного тона, может быть уменьшено на 2,4 бита с 7 битов в традиционном случае. Ожидаемую частоту в Таблице 6 получают, если на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), только если величина разности TD(1,2) меньше 2 (если разностью TD(1,2) является 0, -1 или 1). В текущем случае ожидается, что частотой кадров, где на этапе S312, описанном выше, определяется, что сигналы являются стационарными (периодическими), является 50%, и объем кода, используемый для выражения периода T3 основного тона, снижается на 1,2 бита в среднем.
Конкретный случай 3 способа кодирования для периода T3 основного тона
В этом случае используется такой же способ назначения кода, как в конкретном случае 2 способа кодирования для периода T3 основного тона. Однако на этапе S312, описанном выше, определяется, что сигналы являются стационарными (периодическими), только если и величина разности TD(1,2), и величина разности TD(3,4) меньше 2 (если разностями TD(1,2) и TD(3,4) является 0, -1, или 1). В этом случае ожидаемая частота составляет, как показано ниже.
Таблица 7 | ||||
Код | Разность TD(1,3) | Число битов | Ожидаемая частота | Математическое ожидание длины кода |
"1" | 0 | 1 | 0,50 | 0,5 |
"000" | -1 | 3 | 0,15 | 0,45 |
"001" | +1 | 3 | 0,15 | 0,45 |
"010"+"XXXX" | в пределах 4 битов | 7 | 0,1 | 0,7 |
"011"+"VVVVVVV" | Другие | 10 | 0,1 | 1,00 |
3,1 |
При ожидаемой частоте, указанной в Таблице 7, математическое ожидание длины кода для кода, используемого для выражения периода T3 основного тона, может быть уменьшено на 3,9 бита с 7 битов в традиционном случае. В текущем случае ожидается, что частота кадров, где на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), составляет 24%, и объем кода, используемый для выражения периода T3 основного тона, снижается на 0,95 бита в среднем.
Конкретный случай 4 способа кодирования для периода T 3 основного тона
В этом случае, если описанная выше разность TD(1,3) является нулем, однобитовый код обозначения (такой как "1"), который указывает, что разностью TD(1,3) является нуль, назначается в качестве кода, соответствующего разности TD(1,3). Если разностью TD(1,3) является -1, двухбитовый код обозначения (такой как "01") назначается в качестве кода, соответствующего разности TD(1,3). Если разностью TD(1,3) является +1, трехбитовый код обозначения (такой как "000") назначается в качестве кода, соответствующего разности TD(1,3). Если разность TD(1,3) является другим значением, формируется код общим числом в 10 битов, составленный из трехбитового кода обозначения (такого как "001"), указывающего, что разностью TD(1,3) является другое значение, и семи битов, соответствующих периоду T3 основного тона. Например, период T 3 основного тона кодируется, как показано в виде примера ниже.
Таблица 8 | ||||
Код | Разность TD(1,3) | Число битов | Ожидаемая частота | Математическое ожидание длины кода |
"1" | 0 | 1 | 0,50 | 0,5 |
"01" | -1 | 2 | 0,15 | 0,3 |
"000" | +1 | 3 | 0,15 | 0,45 |
"001"+"VVVVVVV" | Другие | 10 | 0,2 | 2 |
3,25 |
При ожидаемой частоте, указанной в Таблице 8, математическое ожидание длины кода для кода, используемого для выражения периода T3 основного тона, может быть снижено на 3,75 бита с 7 битов в традиционном случае. Ожидаемая частота в Таблице 8 получается, если на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), только если и величина разности TD(1,2), и величина разности, TD(3,4) меньше 2 (если разностью TD(1,2) и разностью TD(3,4) является 0, -1, или 1), и что сигналы являются стационарными (периодическими), только если коэффициент усиления основного тона для T2 и коэффициент усиления основного тона для T4 - оба равны или больше 0,7. В текущем случае ожидается, что частота кадров, где на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), составляет 24%, и объем кода, используемый для выражения периода T3 основного тона снижается на 0,95 бита в среднем.
Конкретный случай 5 способа кодирования для периода T3 основного тона
В этом случае используется такой же способ назначения кода, как в конкретном случае 4 способа кодирования для периода T3 основного тона. Однако на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), только если и коэффициент усиления основного тона для T2, и коэффициент усиления основного тона для T4 равны или больше 0,7 независимо от разностей TD(1,2) и TD(3,4). В этом случае ожидаемой частотой является, как показано ниже.
Таблица 9 | ||||
Код | Разность TD(1,3) | Число битов | Ожидаемая частота | Математическое ожидание длины кода |
"01" | 0 | 2 | 0,3 | 0,6 |
"001" | -1 | 3 | 0,1 | 0,3 |
"000" | +1 | 3 | 0,1 | 0,3 |
"1+"VVVVVVV" | Другие | 8 | 0,5 | 4 |
5,2 |
При ожидаемой частоте, указанной в Таблице 9, математическое ожидание длины кода для кода, используемого для выражения периода T3 основного тона, может быть уменьшено на 1,8 бита с 7 битов в традиционном случае. В текущем случае ожидается, что частота кадров, где на описанном выше этапе S312 определяется, что сигналы являются стационарными (периодическими), составляет 40%, и объем кода, используемый для выражения периода T3 основного тона, снижается на 0,72 бита в среднем.
Способ декодирования
Способ декодирования по третьему варианту осуществления будет описан ниже со ссылкой на фиг.7B.
В способе декодирования по третьему варианту осуществления этап S322, описанный ниже, исполняется вместо этапа S122 первого варианта осуществления; этап S323, описанный ниже, исполняется вместо этапа S123 из первого варианта осуществления; и этап S324, описанный ниже, исполняется вместо этапа S124 из первого варианта осуществления. Другие этапы могут быть одинаковыми с таковыми в первом варианте осуществления или его модификациях. Только обработка для этапов S322, S323 и S324 настоящего варианта осуществления будет описана ниже.
Обработка по этапу S322
На этапе S322 блок 327b определения (фиг.6) в декодере 32 (фиг.4) определяет, являлись ли сигналы x(n)(n=0,...,L-1) временной последовательности, соответствующие битовому потоку BS, в текущем кадре стационарными (этап S322). Определение на этапе S322 выполняется путем определения, удовлетворяет ли индекс, который указывает уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными. Для этого определения информация (LPC info, CT, gp и прочая), необходимая для определения и вывода из блока 127g разделения, вводится на блок 327b определения, и используется такой же способ, как на этапе S312, выполняемом кодером 31. Если для определения используются разности TD(1,2) и TD(3,4) в качестве индексов, если они были кодированы с переменной длиной, они подлежат декодированию и использованию для определения на этапе S322.
Обработка по этапу S323
Если на этапе S322 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если сигналы были нестационарными), переключатель 127f посылает код CT текущего кадра на блок декодирования периода основного тона 327d под управлением блока 327b определения. Блок декодирования периода основного тона 327d декодирует код CT в обработке декодирования, соответствующей обработке кодирования, выполняемой блоком 317d кодирования периода основного тона (фиг.5), и выводит периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра (этап S323).
Обработка по этапу S324
Если на этапе S322 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если сигналы были стационарными), переключатель 127f посылает код CT текущего кадра на блок 327e декодирования периода основного тона под управлением блока 327b определения. Блок 327e декодирования периода основного тона декодирует код CT в обработке декодирования, соответствующей обработке кодирования, выполняемой блоком 317e кодирования периода основного тона (фиг.5), и выводит периоды T =T1 , T2 , T3 , T4 основного тона для текущего кадра (этап S324).
Первая модификация третьего варианта осуществления
В обработке кодирования по третьему варианту осуществления, если определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются высокостационарными, разность TD(1,3) между целочисленной частью периода T3 основного тона третьего подкадра, включенного в текущий кадр, и целочисленной частью периода T1 основного тона в первом подкадре кодируется с переменной длиной. Если определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются высокостационарными, однако вместо разности TD(1,3) разность TD (2,3) между целочисленной частью периода T3 основного тона третьего подкадра, включенного в текущий кадр, и целочисленной частью периода T2 основного тона во втором подкадре может кодироваться с переменной длиной. Если период T2 основного тона кодируется в виде разности TD(1,2) между целочисленными частями, как показано на фиг.2B, значение, полученное путем сложения целочисленной части периода T1 основного тона с разностью TD(1,2), используется в качестве целочисленной части периода T2 основного тона.
Вторая модификация третьего варианта осуществления
В третьем варианте осуществления, если определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются высокостационарными, разность TD(1,3) между целочисленной частью периода T3 основного тона для третьего подкадра, включенного в текущий кадр, и целочисленной частью периода T1 основного тона в первом подкадре кодируется с переменной длиной. Однако вместо применения кодирования с переменной длиной к разности TD(1,3) между целочисленными частями кодирование может выполняться так, что разность между значением, полученным путем удаления двух младших битов периода T3 основного тона для третьего подкадра, который включает дробную часть, и значением, полученным путем удаления двух младших битов периода T1 основного тона в первом подкадре, который включает дробную часть, кодируется с переменной длиной; и два младших бита периода T3 основного тона кодируются вместо дробной части периода T3 основного тона. В этом случае, если целочисленная часть периода T3 основного тона равна или больше минимального значения Tmin и меньше T , кодируются два бита дробной части периода T 3 основного тона; если целочисленная часть периода T 3 основного тона имеет значение от T до TB, кодируются младший значащий бит целочисленной части и один бит дробной части периода T3 основного тона; и если целочисленная часть периода T3 основного тона имеет значение от TB до максимального значения Tmax, кодируются два младших бита целочисленной части периода T3 основного тона.
Третья модификация третьего варианта осуществления
В третьем варианте осуществления, если определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются высокостационарными, разность TD(1,3) между целочисленной частью периода T3 основного тона для третьего подкадра, включенного в текущий кадр, и целочисленной частью периода T 1 основного тона в первом подкадре кодируется с переменной длиной. Если определяется, что сигналы x(n)(n=0,...,L-1) временной последовательности в текущем кадре являются высокостационарными, однако, полная длина кода для кода, полученного путем применения кодирования с переменной длиной к разности TD(1,3) и коду дробной части периода T3 основного тона, может сравниваться с длиной кода для кода, полученного путем кодирования периода T3 основного тона (целочисленной части и дробной части) в каждом подкадре отдельно, чтобы выбрать тот код, который имеет эффект наибольшей компрессии, в качестве кода для периода T 3 основного тона третьего подкадра.
Если код, полученный путем кодирования периода T3 основного тона (целочисленной части и дробной части) в каждом подкадре отдельно, выбирается в качестве кода для периода T3 основного тона третьего подкадра, полная длина кода для кода, полученного путем применения кодирования с переменной длиной к разности TD(3,1) между целочисленной частью периода T1 основного тона первого подкадра, включенного в текущий кадр, и целочисленной частью периода T3 основного тона в третьем подкадре и код дробной части периода T1 основного тона могут сравниваться с длиной кода для кода, полученного путем кодирования периода T1 основного тона (целочисленной части и дробной части) в каждом подкадре отдельно, чтобы выбрать тот код, который имеет эффект наибольшей компрессии, в качестве кода для периода T1 основного тона первого подкадра.
Сравнение длины кода, описанное выше, может выполняться путем фактического вычисления кодов, подлежащих сравнению, и использования длин кода для кодов, или путем использования предсказания длин кодов. Если добавляется дополнительный бит фиксированной длины, указывающий, какой код был выбран, длина кода этого дополнительного бита, также принимается во внимание для сравнения.
Четвертый вариант осуществления
В четвертом варианте осуществления, разность между значениями, соответствующими периодам основного тона в подкадрах, включенных в различные кадры, и разность кодируются с переменной длиной. Как показано в виде примера на фиг.11, в некоторых случаях выполняется некоторая обработка (такая как долгосрочный прогноз или краткосрочный прогноз) в каждом суперкадре, составленном из множества кадров. В таком случае подкадры, включенные в тот же суперкадр, могут иметь высокую стационарность или высокую периодичность. Даже различные суперкадры могут иметь высокую стационарность. В таком случае разность между периодом основного тона для первого подкадра в текущем кадре и периодом основного тона для третьего подкадра или четвертого подкадра в прошлом кадре, находящемся перед (обнаруженным прежде) текущим кадром, становится малой во многих случаях. В настоящем варианте осуществления получают разность между значениями, соответствующими периодам основного тона в подкадрах, включенных в различные кадры, и разность кодируют с переменной длиной, чтобы уменьшить длину кода.
Другими словами, также в обработке кодирования периода основного тона по четвертому варианту осуществления, если индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, удовлетворяет условию, которое указывает высокую периодичность и/или высокую стационарность, кодируется период основного тона в первом заранее заданном временном интервале, включенном в заранее заданный временной интервал, и разность между значением, соответствующим периоду основного тона во втором заранее заданном временном интервале, включенном в заранее заданный временной интервал, отличный от первого заранее заданного временного интервала, и значением, соответствующим периоду основного тона во временном интервале, включенном в заранее заданный временной интервал, отличный от второго заранее заданного временного интервала, кодируется с переменной длиной. Следует отметить, что "заранее заданный временной интервал" означает кадр, "первый заранее заданный временной интервал" означает подкадр в прошлом кадре, находящемся перед текущим кадром, "второй заранее заданный временной интервал" означает первый подкадр в текущем кадре, "временной интервал, отличный от второго заранее заданного временного интервала" означает подкадр в прошлом кадре, находящемся перед текущим кадром, и "значение, соответствующее периоду основного тона", будет означать целочисленную часть периода основного тона. Для простоты описания ниже будет описан пример, в котором "первый заранее заданный временной интервал" означает третий подкадр в кадре непосредственно перед текущим кадром, "второй заранее заданный временной интервал" означает первый подкадр в текущем кадре, и "временной интервал, отличный от второго заранее заданного временного интервала" означает третий подкадр в кадре непосредственно перед текущим кадром. Однако эти назначения не ограничивают настоящее изобретение. В нижеследующем описании в основном будут описаны отличия от вариантов осуществления, описанных выше.
Конфигурация
Конфигурации кодера 41 и декодера 42 согласно четвертому варианту осуществления описываются ниже со ссылкой на фиг.4-6.
Как показано на фиг.4 в виде примера, кодер 41 по четвертому варианту осуществления отличается от кодера 11 по первому варианту осуществления тем, что блок 117 кодирования параметров заменен блоком 417 кодирования параметров. Декодер 42 по четвертому варианту осуществления отличается от декодера 12 по первому варианту осуществления тем, что блок 127 декодирования параметров заменен блоком 427 декодирования параметров.
Как показано на фиг.5 в виде примера, блок 417 кодирования параметров по четвертому варианту осуществления отличается от блока 117 кодирования параметров по первому варианту осуществления тем, что блок 117b определения заменен блоком 317b определения, блок 117d кодирования периода основного тона заменен блоком 417d кодирования периода основного тона, и блок 117e кодирования периода основного тона заменен блоком 417e кодирования периода основного тона. Как показано на фиг.6 в виде примера, блок 427 декодирования параметров по четвертому варианту осуществления отличается от блока 127 декодирования параметров по первому варианту осуществления тем, что блок 127b определения заменен блоком 327b определения, блок 127d декодирования периода основного тона заменен блоком 427d декодирования периода основного тона, и блок 127e декодирования периода основного тона заменен блоком 427e декодирования периода основного тона.
Способ кодирования
Способ кодирования по четвертому варианту осуществления будет описан ниже со ссылкой на фиг.7A.
В способе кодирования по четвертому варианту осуществления этап S312, описанный ранее, исполняется вместо этапа S112 первого варианта осуществления; этап S413, описанный ниже, исполняется вместо этапа S113 первого варианта осуществления; и этап S414, описанный ниже, исполняется вместо этапа S114 первого варианта осуществления. Другие этапы могут быть одинаковыми с таковыми в первом варианте осуществления или его модификациях. Только обработка по этапу S413 и этапу S414 настоящего варианта осуществления будет описана ниже.
Обработка по этапу S413
Если на этапе S312 определяется, что сигналы являются нестационарными (непериодическими), переключатель 117c посылает периоды T=T 1, T2, T3, T4 основного тона на блок 417d кодирования периода основного тона (фиг.5) под управлением блока 317b определения. Блок 417d кодирования периода основного тона формирует код CT, соответствующий периодам T основного тона для текущего кадра, путем использования, например, такого же способа (конкретный случай 1 этапа S413), как в традиционном случае (фиг.2A и 2B), или такого же способа (конкретный случай 2 этапа S413), как на этапе S113 (фиг.8B) первого варианта осуществления, и выводит код (этап S413).
Обработка по этапу S414
Если на этапе S312 определяется, что сигналы являются стационарными (периодическими), переключатель 117c посылает периоды T=T 1,T2,T3,T4 основного тона на блок 417e кодирования периода основного тона под управлением блока 317b определения. На фиг.12A и 12B показан примерный способ кодирования периода основного тона согласно четвертому варианту осуществления при стационарных (периодических) сигналах временной последовательности.
Как показано в виде примера на фиг.12B, блок 417e кодирования периода основного тона кодирует разность TD(1,2) между целочисленной частью периода T2 основного тона во втором подкадре текущего кадра (фиг.12B) и целочисленной частью периода T1 основного тона в первом подкадре текущего кадра и разность TD(3,4) между целочисленной частью периода T4 основного тона в четвертом подкадре текущего кадра и целочисленной частью периода T3 основного тона в третьем подкадре текущего кадра (целочисленные части разности) отдельно и кодирует значения после десятичной точки для периодов T2 и T4 (дробные части) основного тона отдельно. Кроме того, блок 417e кодирования периода основного тона кодирует период T3 основного тона для третьего подкадра текущего кадра в каждом подкадре отдельно. Способ кодирования для второго, третьего и четвертого подкадров может быть, например, таким же, как в традиционном случае.
Кроме того, блок 417e кодирования периода основного тона вычисляет разность TD(3 ,1) между целочисленной частью периода T1 основного тона в первом подкадре текущего кадра (фиг.12B) и целочисленной частью периода T3 основного тона в третьем подкадре кадра (фиг.12A) (находящегося) непосредственно перед текущим кадром, который вводился прошлым на блок 417e кодирования периода основного тона. В зависимости от разности TD(3 ,1) блок 417e кодирования периода основного тона либо применяет кодирование с переменной длиной к разности TD(3 ,1), либо кодирует период T1 основного тона для первого подкадра текущего кадра в каждом подкадре отдельно, чтобы формировать код X1 для периода T1 основного тона в первом подкадре текущего кадра (фиг.12B). Эта обработка является такой же, как в третьем варианте осуществления за исключением того, что разность TD(1,3) заменена разностью TD(3 ,1). Вместо разности TD(3 ,1) может использоваться разность TD(4 ,1) от целочисленной части периода T4 основного тона в четвертом подкадре кадра непосредственно перед текущим кадром. В этом случае, если период T4 основного тона в четвертом подкадре кадра непосредственно перед текущим кадром кодировался с использованием разности TD(3 ,4 ) между целочисленными частями периодов T3 и T4 основного тона в третьем и четвертом подкадрах кадра непосредственно перед текущим кадром, T4 получают путем сложения разности TD(3 ,4 ) с периодом основного тона T3 и вычисляют TD(4 ,1).
Способ декодирования
Способ декодирования по четвертому варианту осуществления будет описан ниже со ссылкой на фиг.7B. В способе декодирования по четвертому варианту осуществления этап S322, описанный ранее, исполняется вместо этапа S122 первого варианта осуществления; этап S423, описанный ниже, исполняется вместо этапа S123 первого варианта осуществления; и этап S424, описанный ниже, исполняется вместо этапа S124 первого варианта осуществления. Другие этапы могут быть одинаковыми с таковыми в первом варианте осуществления или его модификациях. Только обработка для этапов S423 и S424 настоящего варианта осуществления будет описана ниже.
Обработка по этапу S423
Если на этапе S322 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если сигналы были нестационарными), переключатель 127f посылает код CT текущего кадра на блок 427d декодирования периода основного тона под управлением блока 327b определения. Блок 427d декодирования периода основного тона декодирует код CT в обработке декодирования, соответствующей обработке кодирования, исполняемой блоком 417d кодирования периода основного тона (фиг.5), и выводит периоды T =T1 , T2 , T3 , T4 основного тона текущего кадра (этап S423).
Обработка по этапу S424
Если на этапе S322 определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, соответствующих битовому потоку BS, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (если сигналы были стационарными), переключатель 127f посылает код CT текущего кадра на блок 427e декодирования периода основного тона под управлением блока 327b определения. Блок 427e декодирования периода основного тона декодирует код CT в обработке декодирования, соответствующей обработке кодирования, исполняемой блоком 417e кодирования периода основного тона (фиг.5), и выводит периоды T =T1 ,T2 ,T3 ,T4 основного тона для текущего кадра (этап S424).
Пятый вариант осуществления
Может обеспечиваться комбинация вышеописанных вариантов осуществления. Пятый вариант осуществления является таким примером.
Конфигурация
Конфигурации кодера 51 и декодера 52 согласно пятому варианту осуществления описываются ниже со ссылкой на фиг.4-6.
Как показано на фиг.4 в виде примера, кодер 51 по пятому варианту осуществления отличается от кодера 11 по первому варианту осуществления тем, что блок 117 кодирования параметров заменен блоком 517 кодирования параметров. Декодер 52 по пятому варианту осуществления отличается от декодера 12 по первому варианту осуществления тем, что блок 127 декодирования параметров заменен блоком 527 декодирования параметров.
Как показано на фиг.5 в виде примера, блок 517 кодирования параметров по пятому варианту осуществления отличается от блока 117 кодирования параметров по первому варианту осуществления тем, что блок 117b определения заменен блоком 517b определения, блок 117d кодирования периода основного тона заменен блоком 517d кодирования периода основного тона и блок 117e кодирования периода основного тона заменен блоком 517e кодирования периода основного тона. Как показано на фиг.6 в виде примера, блок 527 декодирования параметров по пятому варианту осуществления отличается от блока 127 декодирования параметров по первому варианту осуществления тем, что блок 127b определения заменен блоком 527b определения, блок 127d декодирования периода основного тона заменен блоком 527d декодирования периода основного тона и блок 127e декодирования периода основного тона заменен блоком 527e декодирования периода основного тона.
Способ кодирования
На фиг.13 показана блок-схема, иллюстрирующая способ кодирования по пятому варианту осуществления.
После исполнения обработки по этапу S111 блок 517b определения в блоке 517 кодирования параметров (фиг.5) определяет в обработке определения по этапу S112, описанной ранее, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности текущего кадра стационарными (периодическими) или нет.
Если в этом определении определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими) (если определяется, что сигналы являются нестационарными или непериодическими), переключатель 117c посылает периоды T 2 и T4 основного тона на блок 517d кодирования периода основного тона под управлением блока 517b определения. Блок 517d кодирования периода основного тона устанавливает разрешающую способность, используемую для выражения каждого из периодов T 2 и T4 основного тона, в целочисленное разрешение только и кодирует периоды T2 и T4 основного тона в каждом подкадре отдельно (этап S513).
Напротив, если определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими) (если определяется, что сигналы являются стационарными или периодическими), переключатель 117c посылает периоды T1,T2 ,T3 и T4 основного тона на блок 517e кодирования периода основного тона под управлением блока 517b определения. Блок 517e кодирования периода основного тона кодирует разности между целочисленными частями периодов T2 и T4 основного тона и целочисленные части периодов T1 и T3 основного тона, выраженные с дробным разрешением, и кодирует отдельно значения после десятичной точки периодов T2 и T4 основного тона двумя битами (этап S514).
Затем блок 517b определения в блоке 517 кодирования параметров определяет в обработке определения по этапу S312, описанной ранее, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности для текущего кадра стационарными (периодическими) или нет.
Если в этом определении определяется, что сигналы временной последовательности являются нестационарными или непериодическими, переключатель 117c посылает периоды T1 и T3 основного тона на блок 517d кодирования периода основного тона под управлением блока 517b определения. Блок 517d кодирования периода основного тона устанавливает разрешающую способность, используемую для выражения каждого из периодов T1 и T3 основного тона в целочисленное разрешение только и кодирует периоды T1 и T3 основного тона в каждом подкадре отдельно (этап S516).
Напротив, если в этом определении определяется, что сигналы временной последовательности являются стационарными или периодическими, переключатель 117c посылает периоды T 1 и T3 основного тона на блок 517e кодирования периода основного тона под управлением блока 517b определения. Блок 517e кодирования периода основного тона кодирует периоды T1 и T3 основного тона таким же образом, как на этапе S314 (или S414) по третьему варианту осуществления (или по четвертому варианту осуществления).
Затем исполняется обработка по этапу S115, описанная в первом варианте осуществления.
На фиг.14 показана блок-схема, иллюстрирующая способ декодирования по пятому варианту осуществления.
После исполнения обработки по этапу S121 блок 527b определения в блоке 527 декодирования параметров (фиг.6) определяет в обработке определения по этапу S122, описанной ранее, являются ли сигналы x(n)(n=0,...,L-1) временной последовательности, соответствующие битовому потоку BS текущего кадра, стационарными (периодическими) или нет.
Если в этом определении определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими) (если определяется, что сигналы были нестационарными или непериодическими), переключатель 127f посылает код CT на блок 527d декодирования периода основного тона под управлением блока 527b определения. Блок 527d декодирования периода основного тона исполняет обработку декодирования, соответствующую таковой по этапу S513, чтобы вычислить периоды T2 и T4 основного тона для второго и четвертого подкадров (этап S523).
Напротив, если определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими) (если определяется, что сигналы были стационарными или периодическими), переключатель 127f посылает код CT на блок 527e декодирования периода основного тона под управлением блока 527b определения. Блок 527e декодирования периода основного тона исполняет обработку декодирования, соответствующую таковой по этапу S514, чтобы вычислить периоды T2 и T4 основного тона для второго и четвертого подкадров (этап S524).
Затем блок 527b определения определяет в обработке определения по этапу S322, описанной ранее, являются ли сигналы временной последовательности x(n)(n=0..., L-l), соответствующие битовому потоку BS текущего кадра, стационарными (периодическими) или нет.
Если в этом определении определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, не удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими) (если определяется, что сигналы были нестационарными или непериодическими), переключатель 127f посылает код CT на блок 527d декодирования периода основного тона под управлением блока 527b определения. Блок 527d декодирования периода основного тона исполняет обработку декодирования, соответствующую таковой по этапу S516, чтобы вычислить периоды T1 и T3 основного тона для первого и третьего подкадров (этап S526).
Напротив, если определяется, что индекс, который указывает стационарность сигналов x(n)(n=0,...,L-1) временной последовательности, удовлетворяет условию, указывающему, что сигналы x(n)(n=0,...,L-1) временной последовательности являются высокостационарными (периодическими) (если определяется, что сигналы были стационарными или периодическими), переключатель 127f посылает код CT на блок 527e декодирования периода основного тона под управлением блока 527b определения. Блок 527e декодирования периода основного тона исполняет обработку декодирования, соответствующую таковой по этапу S314 (или этапу S414), чтобы вычислить периоды T1 и T3 основного тона для первого и третьего подкадров.
Поскольку в вышеописанной обработке используется кодирование с переменной длиной в зависимости от других параметров, является необходимым задавать конфигурацию битового потока, которая позволяет уникальное декодирование. Среди элементов битового потока, показанного в виде примера на фиг.2A, необходимо сделать возможным декодировать сначала коды, отличные от таковых для периодов основного тона, и затем декодировать коды периодов T2 и T4 основного тона на основании декодированных квантованных коэффициентов усиления основного тона и информации линейного предсказания. Затем осуществляется получение периодов T1 и T3 основного тона путем декодирования в зависимости также от периодов T2 и T4 основного тона.
Шестой вариант осуществления
Если битовый поток BS каждого кадра передается в виде пакетов, требуется, чтобы длина кода (длина в битах) одного кадра была фиксированной. В пакетной передаче не имеется ограничения на конфигурацию битов в кадре. В шестом варианте осуществления длина кода одного кадра является фиксированной, и дополнительные биты в кадре используются, чтобы повысить качество кодирования в кадре.
Конфигурация
Конфигурации кодера 61 и декодера 62 согласно шестому варианту осуществления описываются ниже со ссылкой на фиг.4-6.
Как показано на фиг.4 в виде примера, кодер 61 по шестому варианту осуществления отличается от кодера 11 по первому варианту осуществления тем, что блок 913 поиска заменен блоком 613 поиска, фиксированная кодовая книга 914 заменена фиксированной кодовой книгой 614, блок 117 кодирования параметров заменен блоком 617 кодирования параметров и добавлен блок 611 назначения битов. Декодер 62 по шестому варианту осуществления отличается от декодера 12 по первому варианту осуществления тем, что блок 127 декодирования параметров заменен блоком 627 декодирования параметров.
Способ кодирования
Блок 613 поиска (фиг.4) получает периоды T1, T2 и T3 основного тона (целочисленные части и дробные части) для подкадров от первого до третьего, включенных в текущий кадр, таким же образом, как в традиционном случае, определяет компоненты сигнала, c(n), образуемые из одного или нескольких сигналов, имеющих значение, образуемое ненулевым отдельным импульсом, считанным из фиксированной кодовой книги 614, и его знаком плюс или минус, и одного или нескольких сигналов, имеющих значение нуль, идентифицирует индексы Cf1, Cf2 и Cf3 кодов, выражающие эти компоненты c(n) сигнала, и получает коэффициенты gp1 , gp2 и gp3 усиления основного тона и коэффициенты gc1, gc2 и gc3 усиления фиксированной кодовой книги. Фиксированная кодовая книга 614 содержит некоторое число отдельных импульсов для каждого подкадра, позиции (потенциальные позиции) отдельных импульсов, разрешаемых в каждом подкадре, и знак плюс или минус (кандидат на знак плюс или минус), разрешаемый для каждого отдельного импульса (см. "5.7 Algebraic codebook" (5.7 Алгебраическая кодовая книга) в Непатентной литературе 1, например). Блок 613 поиска определяет компоненты c(n) сигнала в диапазоне, указанном в фиксированной кодовой книге 614, и идентифицирует индексы Cf1, Cf2 и Cf3 кодов. Конкретно блок 613 поиска выбирает позиции указанного числа отдельных импульсов из позиций, разрешаемых в подкадрах от первого до третьего, выбирает знак плюс или минус для отдельного импульса в каждой позиции из разрешаемого знака плюс или минус и идентифицирует индексы Cf1, Cf2 и Cf3 кодов, выражающие выбранное содержимое. Чем больше число отдельных импульсов для каждого подкадра, тем больше становится число битов в индексе кода, повышая разрешающую способность кодирования. В настоящем варианте осуществления такие установки в фиксированной кодовой книге 614 являются фиксированными для подкадров от первого до третьего. Другими словами, число отдельных импульсов для каждого подкадра, позиции отдельных импульсов, разрешаемые в каждом подкадре, и знак плюс или минус, разрешаемый для каждого отдельного импульса, являются одинаковыми в подкадрах от первого до третьего.
Коэффициенты gp1, gp2 и gp3 усиления основного тона и коэффициенты усиления gc1 , gc2 и gc3 фиксированной кодовой книги для подкадров от первого до третьего вводятся на блок 617a квантования коэффициентов усиления (фиг.5) в блоке 617 кодирования параметров. Блок 617a квантования коэффициентов усиления применяет векторное квантование к этим элементам в каждом подкадре, чтобы сформировать код VQ коэффициента усиления, соответствующий комбинации квантованного значения коэффициента усиления основного тона и квантованного значения коэффициента усиления фиксированной кодовой книги в каждом подкадре. Чем больше число битов, используемое для выражения кода VQ коэффициента усиления (именуемое числом битов кода VQ коэффициента усиления), тем короче может делаться интервал квантования (шаг квантования) и тем больше может делаться диапазон для коэффициента усиления основного тона или коэффициента усиления фиксированной кодовой книги, к которому может применяться векторное квантование, повышая качество кодирования. В настоящем варианте осуществления число битов кода VQ коэффициента усиления фиксируется заранее для подкадров от первого до третьего (например, семь битов (которые могут выражать 128 комбинаций квантованных значений коэффициентов усиления основного тона и коэффициентов усиления фиксированной кодовой книги или значений, соответствующих коэффициентам усиления фиксированной кодовой книги)). Блок 617a квантования коэффициентов усиления выводит коды, соответствующие кодам VQ коэффициента усиления (например, коды, полученные путем применения кодирования с компрессией к кодам VQ коэффициентов усиления) для подкадров от первого до третьего.
Блок 613 поиска (фиг.4) получает период T4 (целочисленную часть и дробную часть) основного тона для четвертого подкадра, включенного в текущий кадр, таким же образом, как в традиционном случае. Периоды T1, T2, T3 и T4 основного тона для подкадров от первого до четвертого вводятся на блок 617 кодирования параметров (фиг.5). Блок 617 кодирования параметров кодирует целочисленные части периодов T1, T2 , T3 и T4 основного тона таким же образом, как в вариантах осуществления от первого до пятого, описанных выше. Например, блок 617 кодирования параметров использует код(ы) VQ коэффициента усиления для всех подкадров от первого до третьего или одного из них в качестве индекса(ов), указывающего уровень стационарности сигналов x(n)(n=0,...,L-1) временной последовательности, чтобы кодировать целочисленные части периодов T1, T2, T3 и T4 основного тона таким же образом, как в описанных выше вариантах осуществления и модификацияих таковых. Блок 617 кодирования параметров может кодировать целочисленные части периодов T1, T2, T3 и T4 основного тона таким же образом, как в традиционном способе.
Блок 611 назначения битов (фиг.4) использует фиксированную длину кода, указанную заранее, для одного кадра и длины кодов, назначенных в текущем кадре, таких как длина кода для информации линейного предсказания LPC info текущего кадра, длина кода для кода, соответствующего каждой целочисленной части периодов T1, T2, T3 и T 4 основного тона, длина кода для индексов Cf1 , Cf2 и Cf3 кодов и длина кода для кода, соответствующего коду VQ коэффициента усиления для каждого подкадра от первого до третьего, чтобы определить назначение длин кода, которые еще не были определены в текущем кадре. Блок 611 назначения битов по настоящему варианту осуществления определяет разрешающие способности для дробных частей периодов T1, T 2, T3 и T4 основного тона (см. фиг.3), число отдельных импульсов для четвертого подкадра и число битов кода VQ коэффициента усиления для четвертого подкадра. Некоторые из этих элементов могут быть фиксированными.
Чем выше разрешающая способность для дробной части каждого периода основного тона, тем более «длинной» становится длина кода, назначаемая коду, соответствующему дробной части периода основного тона, повышая качество кодирования. Чем больше число отдельных импульсов для четвертого подкадра, тем более «длинной» становится длина кода, назначаемая индексу Cf4 кода для четвертого подкадра, повышая качество кодирования четвертого подкадра. Чем больше число битов для кода VQ коэффициента усиления для четвертого подкадра, тем более длинной становится длина кода, назначаемая коду, соответствующему коду VQ коэффициента усиления для четвертого подкадра, повышая качество кодирования четвертого подкадра. В таком назначении длины кода максимально возможное количество битов из числа битов, для которых назначение не было определено в текущем кадре, назначаются коду, соответствующему дробной части каждого периода основного тона, индексу Cf4 кода для четвертого подкадра и коду, соответствующему коду VQ коэффициента усиления для четвертого подкадра. Предпочтительно, что все биты, для которых назначение не было определено в текущем кадре, назначаются коду, соответствующему дробной части каждого периода основного тона, индексу Cf4 кода для четвертого подкадра, и коду, соответствующему коду VQ коэффициента усиления для четвертого подкадра. Такое назначение длины кода выполняется согласно правилу, определенному заранее.
Информация, указывающая разрешающие способности для дробных частей периодов T1, T2, T3 и T4 основного тона для подкадров от первого до четвертого, разрешающая способность, определяемая блоком 611 назначения битов, вводится на блок кодирования параметров 617. Блок 617 кодирования параметров кодирует дробные части периодов T1, T2, T3 и T4 основного тона для подкадров от первого до четвертого с разрешающими способностями, указанными этой информацией, чтобы сформировать коды, соответствующие дробным частям периодов T 1, T2, T3 и T4 основного тона.
Информация, указывающая число отдельных импульсов для четвертого подкадра, число, определяемое блоком 611 назначения битов, вводится на блок 613 поиска (фиг.4). Блок 613 поиска использует анализ четвертого подкадра, включенного в текущий кадр, чтобы определить компонент c(n) сигнала для четвертого подкадра, образуемого из комбинаций отдельных импульсов, число таковых, указываемое информацией, и знаки плюс или минус отдельных импульсов (чтобы определить комбинации позиций отдельных импульсов и знаков плюс и минус отдельных импульсов), чтобы идентифицировать индекс Cf4 кода, выражающий компонент сигнала, и получает коэффициент gp4 усиления основного тона и коэффициент gc4 усиления фиксированной кодовой книги. Этот анализ проводится таким же образом, как в традиционном случае за исключением того, что полученный прежде для четвертого подкадра период T 4 основного тона является фиксированным.
Информация, указывающая число битов кода VQ коэффициента усиления для четвертого подкадра, определенная блоком 611 назначения битов, и коэффициент gp4 усиления основного тона, и коэффициент gc4 усиления фиксированной кодовой книги, полученные блоком 613 поиска, вводятся на блок 617a квантования коэффициентов усиления в блоке 617 кодирования параметров (фиг.5). Блок 617a квантования коэффициентов усиления применяет векторное квантование к коэффициенту gp4 усиления основного тона и коэффициенту gc4 усиления фиксированной кодовой книги при числе битов кода VQ коэффициента усиления, указанном информацией, указывающей число битов для получения кода VQ коэффициента усиления, имеющего это число битов кода VQ коэффициента усиления, для четвертого подкадра, и выводит код, соответствующий коду VQ коэффициента усиления для четвертого подкадра (например, коды, полученные путем применения кодирования с компрессией к кодам VQ коэффициентов усиления).
Информация линейного предсказания LPC info для текущего кадра, индексы Cf=Cf1 , Cf2, Cf3, Cf4 кодов, код C T, соответствующий периодам T1, T2 , T3 и T4 основного тона (целочисленным частям и дробным частям) для подкадров от первого до четвертого, и коды, соответствующие кодам VQ коэффициентов усиления для подкадров от первого до четвертого, вводятся на блок 117g синтеза. Блок 117g синтеза осуществляет синтез этих элементов согласно последовательности, определенной заранее, формирует битовый поток BS, для которого длина кода на один кадр является фиксированной, и выводит битовый поток. Если полная длина кода на один кадр информации, вводимой на блок 117g синтеза, меньше фиксированной длины кода на один кадр, дополнительный бит и другие биты могут добавляться к битовому потоку BS.
Способ декодирования
Битовый поток BS вводится на блок 627 декодирования параметров (фиг.6) в декодере 62. Блок 627 декодирования параметров сначала получает информацию линейного предсказания LPC info, индексы Cf1, Cf2 и Cf3 кодов для подкадров от первого до третьего, код, соответствующий целочисленным частям периодов T1, T2, T3 и T 4 основного тона для подкадров от первого до четвертого, и коды, соответствующие кодам VQ коэффициентов усиления для подкадров от первого до третьего, из битового потока BS. Блок 627 декодирования параметров может идентифицировать назначение длины кода, определенное блоком 611 назначения битов, исходя из полной длины кода для этих элементов, и может получить код, соответствующий дробным частям периодов T1, T2, T3 и T4 основного тона для подкадров от первого до четвертого, индекс Cf4 кода для четвертого подкадра и код, соответствующий коду VQ коэффициента усиления для четвертого подкадра, из битового потока BS. Блок 627 декодирования параметров также получает квантованные коэффициенты gp =gp1 , gp2 , gp3 , gp4 усиления основного тона и квантованные коэффициенты g c =gc1 , gc2 , gc3 , gc4 усиления фиксированной кодовой книги из кодов, соответствующих кодам VQ коэффициентов усиления для подкадров от первого до четвертого. Обработка, подлежащая выполнению после этого, является такой же, как в вариантах осуществления от первого до пятого.
Первая модификация шестого варианта осуществления
В модификации шестого варианта осуществления блок 613 поиска (фиг.4) может осуществлять поиск периода основного тона (целочисленной части и дробной части) для текущего подкадра в соответствии со способом поиска, соответствующим коду VQ коэффициента усиления для прошлого подкадра, находящегося перед текущим подкадром, чтобы получить периоды T2, T3 и T4 основного тона (целочисленные части и дробные части) для подкадров от второго до четвертого, вместо получения периодов T2 ,T3 и T4 основного тона (целочисленных частей и дробных частей) для подкадров от второго до четвертого таким же образом, как в традиционном случае путем использования блока 613 поиска. Например, блок 613 поиска может осуществлять поиск периода T2 основного тона (целочисленной части и дробной части) второго подкадра в соответствии со способом поиска, соответствующим кодам VQ коэффициентов усиления первого подкадра, поиск периода T 3 основного тона (целочисленной части и дробной части) для третьего подкадра в соответствии со способом поиска, соответствующим кодам VQ коэффициентов усиления для первого и второго подкадров, и осуществлять поиск периода T4 основного тона (целочисленной части и дробной части) для четвертого подкадра в соответствии со способом поиска, соответствующим кодам VQ коэффициентов усиления для подкадров от первого до третьего. Конкретно, например, блок 613 поиска применяет критерий 1 определения или критерий 2 определения из конкретного случая 3 этапа S112 к коду VQ коэффициентов усиления прошлого подкадра, чтобы определить, являются ли сигналы временной последовательности стационарными (периодическими) в текущем подкадре, и изменяет диапазон поиска периода основного тона текущего подкадра согласно результату. Например, если определяется, что сигналы временной последовательности являются нестационарными (непериодическими), поскольку адаптивные компоненты сигнала вносят лишь небольшой вклад, блок 613 поиска сужает диапазон поиска периода основного тона или снижает разрешающую способность поиска для дробной части периода основного тона по сравнению со случаем, где определяется, что сигналы временной последовательности являются стационарными (периодическими). Альтернативно, например, если определяется, что сигналы временной последовательности являются стационарными (периодическими), осуществляется поиск целочисленной части и дробной части каждого периода основного тона; и, если определяется, что сигналы временной последовательности являются нестационарными (непериодическими), осуществляется поиск только целочисленной части каждого периода основного тона, а поиск дробной части не осуществляется.
Вторая модификация шестого варианта осуществления
В модификации шестого варианта осуществления блок 611 назначения битов может определять разрешающие способности для дробных частей периодов основного тона во втором и третьем подкадрах согласно коду VQ коэффициента усиления прошлого подкадра. Например, блок 611 назначения битов определяет разрешающую способность дробной части периода T1 основного тона в первом подкадре, определяет разрешающую способность дробной части периода T 2 основного тона во втором подкадре согласно коду VQ коэффициента усиления для первого подкадра и определяет разрешающую способность дробной части периода T3 основного тона в третьем подкадре согласно кодам VQ коэффициентов усиления для первого и второго подкадров таким же образом, как в вариантах осуществления от первого до пятого и традиционном способе. Конкретно, например, блок 611 назначения битов применяет критерий 1 определения или критерий 2 определения из конкретного случая 3 этапа S112 к коду VQ коэффициента усиления прошлого подкадра, чтобы определить, являются ли сигналы временной последовательности стационарными (периодическими) в текущем подкадре, и определяет разрешающие способности для дробных частей периодов основного тона во втором и третьем подкадрах согласно результату. Конкретно, например, если определяется, что сигналы временной последовательности являются нестационарными (непериодическими), поскольку адаптивные компоненты сигнала вносят лишь небольшой вклад, блок 611 назначения битов снижает разрешающую способность для дробной части периода основного тона по сравнению со случаем, где определяется, что сигналы временной последовательности являются стационарными (периодическими). Например, если определяется, что сигналы временной последовательности являются стационарными (периодическими), блок 611 назначения битов кодирует дробную часть периода основного тона с дробным разрешением; и, если определяется, что сигналы временной последовательности являются нестационарными (непериодическими), блок 611 назначения битов кодирует период основного тона с целочисленным разрешением.
Блок 611 назначения битов дополнительно использует фиксированную длину кода на один кадр, указанную заранее, и длины кода, назначенные в текущем кадре, такие как длина кода для информации линейного предсказания LPC info для текущего кадра, длина кода для кода, соответствующего каждой целочисленной части периодов T1 ,T2,T3 и T4 основного тона, длина кода для кода, соответствующего каждой дробной части периодов T1, T2, и T3 основного тона, длина кода для индексов Cf1, Cf2 и C f3 кодов и длина кода для кодов, соответствующих кодам VQ коэффициентов усиления для подкадров от первого до третьего, чтобы определить назначение длин кода, которое еще не было определено в текущем кадре. Например, блок 611 назначения битов определяет разрешающую способность для дробной части периода T4 основного тона в четвертом подкадре, число отдельных импульсов для четвертого подкадра и число битов для кода VQ коэффициента усиления для четвертого подкадра. В этом назначении длины кода максимально возможное число битов из битов, для которых назначение не было определено в текущем кадре, назначается коду, соответствующему дробной части периода T4 основного тона для четвертого подкадра, индексу Cf4 кода для четвертого подкадра, и коду, соответствующему коду VQ коэффициента усиления для четвертого подкадра. Предпочтительно, что все биты, для которых назначение не было определено в текущем кадре, назначаются коду, соответствующему дробной части периода T4 основного тона для четвертого подкадра, индексу Cf4 кода для четвертого подкадра, и коду, соответствующему коду VQ коэффициента усиления для четвертого подкадра.
Третья модификация шестого варианта осуществления
В следующей модификации шестого варианта осуществления блок 611" назначения битов может определять числа битов кода VQ коэффициента усиления для вторых и третьих подкадров согласно коду VQ коэффициента усиления прошлого подкадра. Например, блок 611" назначения битов устанавливает число битов кода VQ коэффициента усиления для первого подкадра в фиксированное значение, определяет число битов кода VQ коэффициента усиления для второго подкадра согласно коду VQ коэффициента усиления для первого подкадра и определяет число битов кода VQ коэффициента усиления для третьего подкадра согласно кодам VQ коэффициентов усиления для первого и второго подкадров. Конкретно, например, блок 611" назначения битов применяет критерий 1 определения или критерий 2 определения из конкретного случая 3 этапа S112 к коду VQ коэффициента усиления прошлого подкадра, чтобы определить, являются ли сигналы временной последовательности стационарными (периодическими) в текущем подкадре, и определяет число битов кода VQ коэффициента усиления для вторых и третьих подкадров согласно результату. Конкретно, например, если определяется, что сигналы временной последовательности являются нестационарными (непериодическими), поскольку адаптивные компоненты сигнала вносят лишь небольшой вклад, блок 611" назначения битов снижает число битов для кода VQ коэффициента усиления по сравнению со случаем, где определяется, что сигналы временной последовательности являются стационарными (периодическими).
Затем блок 611" назначения битов использует фиксированную длину кода на один кадр, заданную заранее, и длины кода, назначенные в текущем кадре, такие как длина кода для информации линейного предсказания LPC info текущего кадра, длина кода для кода, соответствующего каждой целочисленной части периодов T1, T2 , T3 и T4 основного тона, длина кода для индексов Cf1, Cf2 и Cf3 кодов и длина кода для кода, соответствующего коду VQ коэффициента усиления для каждого из подкадров от первого до третьего, чтобы определить назначение длин кода, которое еще не было определено в текущем кадре, такое как число битов для кода VQ коэффициента усиления для четвертого подкадра, таким же образом, как в шестом варианте осуществления.
Четвертая модификация шестого варианта осуществления
В модификации шестого варианта осуществления, фиксированная длина кода на один кадр, указанная заранее, и длины кода, назначенные в текущем кадре, такие как длина кода для информации линейного предсказания LPC info текущего кадра, длина кода для кода, соответствующего каждой целочисленной части периодов T1, T2 , T3 и T4 основного тона, длина кода для индексов Cf1, Cf2 и Cf3 кодов и длина кода для кода, соответствующего коду VQ коэффициента усиления для каждого из подкадров от первого до третьего, могут использоваться, чтобы изменить количество раз, которое обновляются коэффициент усиления основного тона и коэффициент усиления фиксированной кодовой книги (количество обновлений кода VQ коэффициента усиления) для четвертого подкадра согласно длине кода, которая еще не была назначена в текущем кадре. Например, если длина кода, которая еще не была назначена в текущем кадре, больше указанного значения, коэффициент усиления основного тона и коэффициент усиления фиксированной кодовой книги могут быть обновлены дважды в четвертом подкадре, и код VQ коэффициента усиления, соответствующий комбинации значения квантования коэффициента усиления основного тона и значения квантования коэффициента усиления фиксированной кодовой книги, может формироваться в каждом процессе обновления.
Другие модификации
Настоящее изобретение не ограничивается вышеописанными вариантами осуществления. Например, в каждом из вышеописанных вариантов осуществления вместо кодирования дробных частей периодов основного тона во втором и четвертом подкадрах с фиксированной длиной в битах (см. фиг.9A и 9B, например) каждая из дробных частей периодов основного тона во втором и четвертом подкадрах может кодироваться с некоторым разрешением в пределах от четверного дробного разрешения до целочисленного разрешения, в зависимости от значения целочисленной части соответствующего периода основного тона, таким же образом, как для первого и третьего подкадров (см. фиг.15A и 15B, например). Например, кодирование может выполняться так, что если целочисленная часть периода T2 основного тона равна или больше минимального значения Tmin и меньше TA, дробная часть периода T2 основного тона кодируется двумя битами; если целочисленная часть периода T2 основного тона имеет значение от T до TB, дробная часть периода T2 основного тона кодируется одним битом; и, если целочисленная часть периода T2 основного тона имеет значение от TB до максимального значения Tmax, дробная часть периода T2 основного тона не кодируется (например, то же применяется к периоду T3 основного тона). При этом кодировании среднее число битов может уменьшаться, тогда как на рабочей характеристике влияние почти не сказывается. В конфигурации, показанной на фиг.2A и 2B, вместо кодирования дробных частей периодов основного тона во втором и четвертом подкадрах с фиксированной длиной в битах каждая из дробных частей периодов основного тона во втором и четвертом подкадрах может кодироваться с некоторым разрешением в пределах от четверного дробного разрешения способности до целочисленного разрешения, в зависимости от значения целочисленной части соответствующего периода основного тона, таким же образом, как для первого и третьего подкадров.
В каждом из вышеописанных вариантов осуществления разностью TD( , ) является либо (целочисленная часть периода T основного тона) - (целочисленная часть периода T основного тона), либо (целочисленная часть периода T основного тона) - (целочисленная часть периода T основного тона). Если целочисленные части и дробные части периодов основного тона выражаются фиксированными длинами в битах, как показано на фиг.16A, но разность TD ( , ) между старшими частями периодов основного тона ((старшая часть периода T основного тона) - (старшая часть периода T основного тона), или (старшая часть периода T основного тона) - (старшая часть периода T основного тона)) может использоваться вместо разности TD( , ). Старшая часть периода основного тона означает значение фиксированного числа старших битов в периоде основного тона, выраженном фиксированной длиной в битах, и младшая часть периода основного тона означает фиксированное число младших битов, остающихся в периоде основного тона. Старшая часть периода основного тона может быть битами, составленными из всех битов целочисленной части периода основного тона и некоторых битов дробной части (например, фиксированного числа старших битов или фиксированного числа младших битов дробной части) (см. фиг.16B, например), или может быть некоторыми битами целочисленной части периода основного тона (например, фиксированного числа старших битов или фиксированного числа младших битов целочисленной части) (см. фиг.16C, например). Если разность TD ( , ) между старшими частями периодов основного тона используется вместо разности TD( , ) между целочисленными частями периодов основного тона, численное значение младшей части каждого периода основного тона кодируется, например, непосредственно. Если разность TD ( , ) между старшими частями периодов основного тона используется вместо разности TD( , ) между целочисленными частями периодов основного тона в конфигурации, показанной на фиг.9A и 9B, коды для периодов основного тона имеют конфигурацию, например, как показано на фиг.17A и 17B.
В отличие от конфигурации, показанной на фиг.9A и 9B, где значение, полученное объединением разности TD(1,2) и разности TD(3,4) целочисленных частей периодов основного тона кодируется с переменной длиной в соответствии со значениями разности TD(1,2) и разности TD(3,4), значение, полученное объединением разности TD(4 ,1) и разности TD(2,3) целочисленных частей периодов основного тона, может кодироваться с переменной длиной в соответствии со значениями разности TD(4 ,1) и разности TD 2,3), где разностью TD(4 ,1) является разность между целочисленной частью периода основного тона четвертого подкадра в кадре непосредственно перед текущим кадром и целочисленной частью периода основного тона первого подкадра в текущем кадре. В этом случае вместо разности TD( , ) между целочисленными частями периодов основного тона может использоваться разность TD ( , ) между старшими частями периодов основного тона.
Блок поиска может непосредственно получать значение, соответствующее квантованному коэффициенту усиления основного тона, и значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги, вместо получения сначала коэффициента усиления основного тона и коэффициента усиления фиксированной кодовой книги, за которыми следуют значение, соответствующее квантованному коэффициенту усиления основного тона, и значение, соответствующее квантованному коэффициенту усиления фиксированной кодовой книги.
Обработка на основании того, удовлетворяется ли условие, указывающее, что сигналы временной последовательности являются высокопериодическими и/или высокостационарными, то есть на основании определения для выбора одного из двух классов, была описана на настоящий момент. Обработка может быть расширена с тем, чтобы уровень периодичности и/или стационарности разделялся на три класса или более, и разрешающие способности, используемые, чтобы выражать периоды основного тона и/или режим кодирования периода основного тона, переключались в соответствии с классом.
Каждый тип обработки, описанной выше, может исполняться не только последовательно во времени в соответствии с порядком описания, но также и параллельно или индивидуально, если необходимо, или в соответствии с возможностями обработки устройств, которые исполняют обработку. Соответствующие изменения могут быть сделаны в настоящем изобретении без выхода за рамки объема настоящего изобретения.
Если конфигурации, описанные выше, реализуются компьютером, подробности обработки относительно функций, которые должны обеспечиваться аппаратными объектами, описываются в программе. Если программа исполняется компьютером, функции обработки, соответствующие аппаратным объектам, реализуются на компьютере.
Программа, содержащая подробности обработки, может быть записана в читаемом компьютером носителе записи. Читаемый компьютером носитель записи может быть любым типом носителя, таким как магнитное запоминающее устройство, накопитель на оптическом диске, магнитно-оптическое запоминающее устройство или полупроводниковое запоминающее устройство.
Программа распространяется путем продажи, передачи или предоставления переносимого носителя записи, такого как цифровой многофункциональный диск (DVD) или ПЗУ на компакт-диске (CD-ROM) с наличием записанной на нем программы, например. Программа также может распространяться путем сохранения программы в устройстве хранения данных серверного компьютера и передачи программы с серверного компьютера на другой компьютер через сеть.
Компьютер, который исполняет этот тип программы, сначала сохраняет программу, записанную на переносимом носителе записи, или программу, переданную с серверного компьютера, в своем устройстве хранения данных. Затем компьютер считывает программу, сохраненную в его устройстве хранения данных, и исполняет обработку в соответствии со считанной программой. В различной форме исполнения программы компьютер может считывать программу непосредственно с переносимого носителя записи и исполнять обработку в соответствии с программой, или компьютер может исполнять обработку в соответствии с программой всякий раз, когда компьютер принимает программу, переданную с серверного компьютера. Альтернативно вышеописанная обработка может исполняться посредством службы так называемого поставщика прикладных услуг (ASP), в которой функции обработки реализуются лишь путем задания команд исполнения программы и получения результатов, без передачи программы на компьютер с серверного компьютера. В вариантах осуществления программа этой формы включает в себя информацию, которая обеспечивается для использования в обработке компьютером и трактуется соответственно как программа (нечто, не являющееся прямой командой компьютеру, а являющееся данными и т.п., имеющими характеристики, которые определяют обработку, исполняемую компьютером).
В описании, приведенном выше, аппаратные объекты реализуются путем исполнения заранее заданной программы на компьютере, но, по меньшей мере, часть обработки может реализовываться аппаратными средствами.
ОПИСАНИЕ ЧИСЛОВЫХ ССЫЛОЧНЫХ ПОЗИЦИЙ
11, 21, 31, 41, 51: Кодеры
12, 22, 32, 42, 52: Декодеры
117, 217, 317, 417, 517: Блоки кодирования параметров
127, 227, 327, 427, 527: Блоки декодирования параметров
Класс G10L19/08 определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов