способ идентификации звукового файла, содержащего цифровой водяной знак
Классы МПК: | G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев |
Автор(ы): | Иванов Владимир Алексеевич (RU), Гречишников Евгений Владимирович (RU), Кирюхин Дмитрий Александрович (RU), Гатилов Олег Вячеславович (RU), Скурнович Алексей Валентинович (RU), Иванов Иван Владимирович (RU) |
Патентообладатель(и): | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) (RU) |
Приоритеты: |
подача заявки:
2008-06-30 публикация патента:
20.05.2010 |
Изобретение относится к области стеганографии, а именно к способам идентификации звуковых файлов (ЗФ), содержащих цифровой водяной знак (ЦВЗ). Техническим результатом разработки способа является обеспечение возможности идентификации ЗФ сжатых и несжатых форматов, содержащих ЦВЗ, в условиях отсутствия априорных сведений о наличии ЦВЗ в данном ЗФ и о законе встраивания ЦВЗ. Перед выполнением многоуровневого дискретного вейвлет-преобразования определяют формат звукового файла. Если формат сжатый, то осуществляют преобразование сжатого звукового файла в аналоговый сигнал. После этого в цифровом измерительном устройстве считывания осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала. На основе многоуровневого дискретного вейвлет-преобразования формируют собственный характеристический вектор, вычисляют расстояния Махаланобиса до центров тяжести первого (звуковой файл содержит ЦВЗ) и второго (звуковой файл не содержит ЦВЗ) классов, а затем принимают решение о принадлежности анализируемого звукового файла к одному из классов по минимуму вычисленного расстояния. 2 ил., 2 табл.
Формула изобретения
Способ идентификации звукового файла, содержащего цифровой водяной знак (ЦВЗ), заключающийся в том, что выполняют многоуровневое дискретное вейвлет-преобразование, вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования, затем формируют собственный характеристический вектор, отличающийся тем, что в режиме "анализ" перед выполнением многоуровневого дискретного вейвлет-преобразования определяют формат звукового файла, если формат сжатый, то выполняют коммутацию на декодер, при этом в декодере осуществляют преобразование сжатого звукового файла в аналоговый сигнал, после чего в цифровом измерительном устройстве считывания осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала, если формат несжатый, то выполняют коммутацию на блок дискретного многоуровневого вейвлет-преобразования, кроме того, после формирования собственного характеристического вектора для него вычисляют расстояния Махаланобиса до центров тяжести первого (звуковой файл содержит ЦВЗ) и второго (звуковой файл не содержит ЦВЗ) классов, а затем принимают решение о принадлежности анализируемого звукового файла к одному из классов по минимуму вычисленного расстояния, а в режиме "обучение" формируют обучающую выборку, включающую звуковые файлы, содержащие встроенные случайным образом ЦВЗ и не содержащие таковых, при этом звуковые файлы обучающей выборки должны быть одного формата, если формат сжатый, то выполняют коммутацию на декодер, при этом в декодере осуществляют преобразование сжатого звукового файла в аналоговый сигнал, после чего в цифровом измерительном устройстве считывания осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала, если формат несжатый, то выполняют коммутацию на блок дискретного многоуровневого вейвлет-преобразования, а затем выполняют многоуровневое дискретное вейвлет-преобразование, кроме того, после формирования массива собственных характеристических векторов из обучающей выборки вычисляют центры тяжести для двух классов звуковых файлов и ковариационную матрицу.
Описание изобретения к патенту
Изобретение относится к области стеганографии, а именно к способам идентификации звуковых файлов (ЗФ), содержащих цифровой водяной знак (ЦВЗ), и может быть использовано для поиска ЗФ различных форматов, содержащих дополнительную цифровую информацию в виде ЦВЗ в условиях отсутствия априорных сведений о законе ее встраивания и присутствии в ЗФ.
Известен способ идентификации ЗФ, содержащих ЦВЗ (См. Özer Н., Avcibas I., Memon N., Sankur В., "Detection of audio covert channels using statistical footprints of hidden messages", Digital Signal Processing 16, 2006, p.389-401), включающий этап встраивания в звуковой сигнал дополнительной информации в виде ЦВЗ, этап фильтрации звукового сигнала в области вейвлет-преобразования, этап вычисления метрик качества звукового сигнала, этап формирования вектора признаков, этап обучения классификатора и этап классифицирования.
Недостатками указанного способа являются низкая вероятность правильной идентификации и отсутствие возможности анализа ЗФ сжатых форматов.
Наиболее близким по технической сущности к заявляемому изобретению (прототипом) является способ идентификации цифрового изображения, содержащего ЦВЗ (см. Патент РФ № 2304306, кл. МПК G06K 9/00, опубл. в 2006 г.), заключающийся в том, что в документ встраивают дополнительную информацию, состоящую из двух типов ЦВЗ, выполняют многоуровневое дискретное вейвлет-преобразование, вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования, затем формируют собственный характеристический вектор, при этом в режиме "обучение" формируют массив собственных характеристических векторов изображений из обучающей выборки, обучают классификатор, а в режиме "анализ" осуществляют классифицирование изображения.
Недостатком известного способа является отсутствие возможности идентификации ЗФ, содержащих ЦВЗ.
Техническим результатом, на достижение которого направлено изобретение, является разработка способа идентификации звуковых файлов, содержащих цифровой водяной знак, обеспечивающего возможность анализа ЗФ как сжатых, так и несжатых форматов, при этом вероятность правильной идентификации должна быть не ниже, чем у прототипа.
Технический результат достигается тем, что в известном способе идентификации цифрового изображения, содержащего ЦВЗ, заключающемся в том, что в документ встраивают дополнительную информацию, состоящую из двух типов ЦВЗ, выполняют многоуровневое дискретное вейвлет-преобразование, вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования, затем формируют собственный характеристический вектор, при этом в режиме "обучение" формируют массив собственных характеристических векторов изображений из обучающей выборки, обучают классификатор, а в режиме "анализ" осуществляют классифицирование изображения, дополнительно, после встраивания в ЗФ дополнительной информации, состоящей из двух типов ЦВЗ, определяют формат ЗФ, если формат сжатый, то выполняют коммутацию на декодер, при этом в декодере осуществляют преобразование сжатого звукового файла в аналоговый сигнал, после чего в цифровом измерительном устройстве считывания осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала, если формат несжатый, то выполняют коммутацию на блок дискретного многоуровневого вейвлет-преобразования.
Благодаря новой совокупности существенных признаков в способе реализована возможность идентификации звуковых файлов как сжатых (МР3, WMA), так и несжатых (WAV, PCM) форматов, содержащих ЦВЗ, при отсутствии априорных сведений о наличии ЦВЗ в ЗФ и законе его встраивания.
Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности «новизна».
Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность отличительных существенных признаков, обусловливающих тот же технический результат, который достигнут в заявляемом способе. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».
Заявленный способ поясняется чертежами, на которых показано:
фиг.1 - общая схема реализации способа идентификации ЗФ, содержащего цифровой водяной знак;
фиг.2 - график вероятности правильной идентификации ЗФ, содержащих ЦВЗ, в результате работы заявляемого способа.
Заявленный способ, схема которого представлена на фиг.1, осуществляют в два этапа, называемых "обучение" и "анализ". Этап "обучения" реализуется за счет того, что сначала с помощью блока 1 формируют обучающую выборку, включающую звуковые файлы, содержащие встроенные случайным образом ЦВЗ, затем с помощью блока 2 определяют формат ЗФ. Если формат сжатый, то посредством блока 3 выполняют коммутацию на декодер 4. В декодере осуществляется преобразование сжатого звукового файла в аналоговый сигнал. Данное устройство реализуется на основе однокристального цифрового аудиодекодера AT85C51SND3B3. С выхода декодера аналоговый сигнал поступает в цифровое измерительное устройство считывания 5, схема которого известна и описана в книге Б.Я.Авдеева, Е.М.Антонюка, Е.М.Душина «Основы метрологии и электрические измерения: учебник для вузов» под ред. Е.М.Душина. - 6-е изд., перераб. и доп. - Л.: Энергоатомиздат. Ленингр. отд-ние, 1987. - 480 с.: ил. (с.255, рис.8-34). При этом осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала. Если формат ЗФ не является сжатым, то осуществляют коммутацию на блок дискретного многоуровневого вейвлет-преобразования 6. В блоке 6 оцифрованный сигнал подвергают многоуровневому одномерному дискретному вейвлет-преобразованию (необходимо не менее пяти уровней вейвлет-преобразования) с использованием биортогональных низкочастотного (НЧ) и высокочастотного (ВЧ) фильтров (Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. - С.-Петербург: Военный университет связи, 1999, с.42-49). Рекомендуется использовать фильтры с коэффициентами согласно таблице 1.
Затем в блоке 7 вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования. Данными статистическими характеристиками являются выборочное среднее, выборочная дисперсия, асимметрия, эксцесс и центральные моменты четного порядка с четвертого по тридцатый (Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. Учеб. пособие для втузов. - 2-е изд., стер. - М.: Высш. шк., 2000. - 480 с.: ил., с.111-121), которые определяют по формулам (1, 2, 3, 4, 5) соответственно.
Таблица 1 | |||
Значения коэффициентов блока биортогональных вейвлет-фильтров 3/9 | |||
№ | Значение коэффициентов НЧ | № | Значение коэффициентов ВЧ |
п/п | фильтра | п/п | фильтра |
0 | -0.00067974 | 0 | -0.17678 |
1 | 0.0020392 | 1 | 0.53033 |
2 | 0.0050603 | 2 | -0.53033 |
3 | -0.020619 | 3 | 0.17678 |
4 | -0.014113 | ||
5 | 0.099135 | ||
6 | 0.0123 | ||
7 | -0.32019 | ||
8 | 0.00205 | ||
9 | 0.94213 | ||
10 | 0.94213 | ||
11 | 0.00205 | ||
12 | -0.32019 | ||
13 | 0.0123 | ||
14 | 0.099135 | ||
15 | -0.014113 | ||
16 | -0.020619 | ||
17 | 0.0050603 | ||
18 | 0.0020392 | ||
19 | -0.00067974 |
где - выборочное среднее;
n - количество коэффициентов данного уровня вейвлет-преобразования.
где DB - выборочная дисперсия;
n - количество коэффициентов данного уровня вейвлет-преобразования.
где AS - асимметрия теоретического распределения;
µ3 - центральный момент третьего порядка;
3 - куб выборочного среднего квадратического отклонения.
где Ek - эксцесс теоретического распределения;
µ4 - центральный момент четвертого порядка;
4 - выборочное среднее квадратическое отклонение в четвертой степени.
где µS - центральный момент S-го порядка;
n - количество коэффициентов данного уровня вейвлет-преобразования.
В блоке формирования собственного характеристического вектора 8 все вычисленные значения статистических характеристик включают в вектор (6).
где N - число уровней вейвлет-преобразования.
Таким образом, размерность такого вектора зависит от количества уровней вейвлет-преобразования N и равна 18N.
После этого посредством блока 9 осуществляют коммутацию на блок формирования массива собственных характеристических векторов из обучающей выборки 10, где производится формирование массива собственных характеристических векторов звуковых файлов из обучающей выборки. Для этого посредством блока 11 осуществляют коммутацию на блок 2 до тех пор, пока не будет сформирован массив собственных характеристических векторов всех звуковых файлов из обучающей выборки (обучающая выборка должна содержать не менее 285 ЗФ, не содержащих ЦВЗ, и не менее 285 ЗФ, содержащих ЦВЗ, причем все ЗФ данной обучающей выборки должны быть одного формата и ЦВЗ должны встраиваться по различным законам).
После формирования массива собственных характеристических векторов всех звуковых файлов из обучающей выборки полученный массив, представленный в виде таблицы 2, коммутируют на блок обучения классификатора 12 для линейной дискриминации звуковых файлов из обучающей выборки на два класса: ЗФ, содержащие ЦВЗ, и ЗФ, не содержащие ЦВЗ. После этого этап "обучение" заканчивается и начинается второй этап - "анализ".
На этапе "анализ" с выбранным для анализа ЗФ (он должен быть одного формата с ЗФ из обучающей выборки) производят все процедуры, описанные выше, только теперь посредством блока 9 осуществляют коммутацию на блок классифицирования 13, на который одновременно с этим с блока обучения классификатора 12 подают результаты дискриминации всех собственных характеристических векторов, полученных от ЗФ из обучающей выборки на этапе "обучение".
Таблица 2 | ||||||
Номер вектора признаков | Номер признака в векторе | |||||
1 | 2 | j | n | |||
1 | y11 | y 12 | y1j | y1n | ||
2 | y21 | y22 | y2j | y2n | ||
i | yi1 | yi2 | yij | yin | ||
N | yN1 | yN2 | yNj | yNn |
В блоке классифицирования ЗФ 13 на основании вычисленного расстояния Махаланобиса по формуле (7) (Калугина Т. Ф., Киселев В. Ю. Математическая статистика: Учеб. пособие/Иван. гос. энерг. ун-т. - Иваново, 2001. - 321 с., с.245) принимается решение о принадлежности анализируемого звукового файла к одному из классов: либо к классу ЗФ, содержащих ЦВЗ, либо к классу ЗФ, не содержащих ЦВЗ.
где dM(xi,x j) - расстояние Махаланобиса,
K-1 =С - матрица, обратная ковариационной матрице К, вычисленной по выборке х,
cpq - элементы матрицы С.
Для проверки заявляемого способа классификатор, основанный на дискриминантном анализе, был обучен на выборке из 1710 звуковых файлов различных форматов, 855 из которых содержали ЦВЗ. С помощью набора из 1800 ЗФ формата WAV, МР3 и WMA, не принадлежащих обучающей выборке, 600 из которых содержали встроенный по неизвестному закону ЦВЗ (по 200 ЗФ каждого формата), заявляемый способ был протестирован. Результаты, представленные на фиг.2, показали, что вероятность правильной идентификации заявляемого способа не ниже, чем у прототипа.
Класс G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев