способ и устройство прогнозирования нестационарного временного ряда
Классы МПК: | G06F17/10 комплексные математические операции G06N7/00 Компьютерные системы, основанные на специфических математических моделях |
Автор(ы): | Доценко Сергей Михайлович (RU), Яковлев Алексей Иванович (RU), Магон Александр Евгеньевич (RU), Сапрыкин Алексей Вячеславович (RU) |
Патентообладатель(и): | Министерство обороны Российской Федерации Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военный учебно-научный Центр Военно-Морского Флота "Военно-Морская академия имени Адмирала Флота Советского Союза Н.Г. Кузнецова" (RU) |
Приоритеты: |
подача заявки:
2009-06-15 публикация патента:
20.11.2012 |
Изобретение относится к области радиотехники и может быть использовано для прогнозирования данных в системах различного назначения. Технический результат изобретения - повышение помехоустойчивости процесса прогнозирования в условиях влияния аддитивной помехи и выраженном нестационарном характере прогнозируемого процесса. Он достигается тем, что в способе прогнозирования нестационарных временных рядов, основанном на авторегрессионной модели скользящего среднего с минимальной среднеквадратической ошибкой, дополнительно содержатся операции рециркуляции входных данных на один отсчет, передискретизации исходного процесса в логарифмическом масштабе времени, нахождения энергетического спектра полученного сигнала, определения отклика, соответствующего энтропии энергетического спектра выборки, вычисления максимального значения откликов энтропии, нахождения прогноза для реализации, соответствующей максимальному значению энтропии, передискретизации результата прогнозирования в экспоненциальном масштабе времени. 2 н.п. ф-лы, 3 ил.
Формула изобретения
1. Способ прогнозирования нестационарных временных рядов, основанный на авторегрессионной модели скользящего среднего с минимальной среднеквадратической ошибкой, отличающийся тем, что дополнительно содержит операции рециркуляции входных данных на один отсчет, передискретизации исходного процесса в логарифмическом масштабе времени, нахождения энергетического спектра полученного сигнала, определения отклика, соответствующего энтропии энергетического спектра выборки, вычисления максимального значения откликов энтропии, нахождения прогноза для реализации, соответствующей максимальному значению энтропии, передискретизации результата прогнозирования в экспоненциальном масштабе времени.
2. Устройство прогнозирования нестационарных временных рядов, содержащее аналого-цифровой преобразователь, блок синхронизации, соединенный со вторым входом аналого-цифрового преобразователя, первый вход которого является входом устройства, блок прогнозирования, отличающееся тем, что дополнительно содержит блок задержки, первый вход которого соединен с выходом блока синхронизации, второй вход подключен к выходу аналого-цифрового преобразователя, выход соединен со входом блока передискретизации исходного процесса по логарифмическому масштабу времени, выход которого соединен с первым входом буферного блока памяти, соединенного своим первым выходом со входом блока нахождения спектра сигнала, выход последнего является входом блока вычисления квадрата модуля сигнала, выход которого соединен со входом блока нахождения энтропии выборки, выход которого подключен ко входу блока вычисления максимального значения энтропии, выход которого является вторым входом блока буферной памяти, второй выход которого является входом блока прогнозирования, соединенного своим выходом с входом блока передискретизации результата прогнозирования по экспоненциальному закону.
Описание изобретения к патенту
Предлагаемое изобретение относится к области специальной радиотехники и может быть использовано для прогнозирования данных в системах различного назначения, в том числе при прогнозировании экономических процессов. Известны способы прогнозирования, основанные на методах Винера и Яглома. Общая теория прогнозирования случайных процессов подробно изложена в работе [1]. Эффективность решений зависит от объема априорных данных, исследуемых процессов и методов их представления. Недостатком известных технических решений является использование, как правило, гипотезы стационарности прогнозирующих процедур, в том числе при анализе широкополосных сигналов.
Известны методы прогнозирования процессов с дискретным временем в случае рациональных спектров, а также одномерных стационарных процессов с постоянным шагом во времени. Отмечается, что многомерный случай в общей теории прогнозирования значительно более сложен, чем одномерный. Как правило, основой прогнозирования служит анализ временного ряда [1, 2]. Наиболее распространенными методами являются: метод наименьших квадратов [3] и его модификации, метод экспоненциального сглаживания, метод вероятностного моделирования и метод адаптивного сглаживания. В любом случае необходим выбор наиболее подходящей модели для описания прогнозирующего процесса.
При прогнозировании процессов формируются дискретные выборки двух типов:
1. Модель функциональной зависимости процесса неизвестна. В этом случае решают задачи оценки модели функциональной зависимости из целого класса доступных моделей.
2. Модель функциональной зависимости процесса известна и требуется только оценить параметры модели исходного процесса (коэффициенты регрессии b0, b1, b2, ).
Применяются следующие математические модели: линейная - y=b0+b1x, гиперболическая - y=b0+b1/x, показательная - y=b0 +b1 x, степенная - , параболическая - y=b0+b1x+b 2x2, логарифмическая - y=b0+b 1lgx, экспоненциальная - y=b0exp(b1 x) и другие.
Решение математических уравнений связи предполагает вычисление по исходным данным параметров модели (свободного члена b0 и коэффициентов регрессии b 1, b2 ).
При всем разнообразии моделей все же имеется вид аналитической зависимости, получивший наиболее широкое распространение. Им является уравнение регрессии в виде многочленов (полинома), расположенных по восходящим степеням изучаемого фактора и одновременно линейных ко всем коэффициентам:
y=f(x)=b0 +b1x+b2x2+ +bmxm, где b0, b1 , b2, ,bm - коэффициенты, подлежащие определению.
Для определения коэффициентов уравнения регрессии bm применяют разные методы (графический, метод средних), однако наибольшее распространение получил метод наименьших квадратов (МНК).
Отыскание коэффициентов b0 и b1 осуществляется по МНК, используя следующие уравнения:
, .
Оценка, основанная на методе наименьших квадратов, предполагает обязательное удовлетворение целого ряда предпосылок, невыполнение которых может привести к ошибкам.
МНК широко применяется для получения конкретных прогнозов, что объясняется его простотой и легкостью реализации на ЭВМ. Недостаток метода состоит в том, что модель тренда жестко фиксируется, поэтому надежный прогноз можно получить только на небольшой период упреждения. МНК используют главным образом при краткосрочном прогнозировании. В методе существенно затруднен правильный выбор вида модели, а также обоснование и выбор весов во взвешенном МНК. Наиболее близким к предлагаемому изобретению является способ и устройство прогнозирования временных рядов, основанный на авторегрессионной модели скользящего среднего с минимальной среднеквадратической ошибкой [1].
Основой прогнозирования служит случайный временной ряд - это упорядоченная последовательность случайных величин, представляющих собой значения отсчетов принятого сигнала от цели. Одной из важных задач при работе с временными рядами является прогнозирование будущих значений временного ряда. В практических приложениях временные ряды сильно коррелированны, что позволяет рассчитывать на удовлетворительные оценки прогноза.
Рассмотренный способ и устройство позволяют произвести прогнозирование временного процесса на фоне аддитивных гауссовых помех, при этом ставится задача прогнозирования значения z n+l, l 1 в текущий момент времени tn. Такой прогноз в момент tn делается с упреждением l. Рассматривается три явные формы представления модели, выраженные следующими соотношениями:
1) При помощи разностного уравнения:
2) Как бесконечную взвешенную сумму текущего и предшествующих импульсов aj:
.
3) Как бесконечную взвешенную сумму предыдущих наблюдений плюс случайный импульс:
,
где j - весовые коэффициенты.
Суть способа состоит в следующем. Выбирают выборку входного процесса zn, у которой необходимо сделать прогноз с упреждением l, представляющую собой линейную функцию , наилучший прогноз представляется в виде , где веса задаются заранее, находят значение среднеквадратической ошибки прогноза , находят минимальное значение СКО прогноза приравниванием , определяют результирующий прогноз или , где en+l - ошибка прогноза с упреждением l отсчетов. Полученный способ позволяет осуществлять прогнозирование процесса, однако на практике влияние шума или другой посторонней информации приводит к уменьшению отношения сигнал-помеха. Основным недостатком способа является то, что при наличии модуляции входного процесса формируется дополнительная ошибка прогноза за счет отклонения процесса от стационарного случая.
Целью предлагаемого изобретения является повышение помехоустойчивости процесса прогнозирования в условии влияния аддитивной помехи и выраженном нестационарном характере прогнозируемого процесса. Поставленная цель достигается тем, что:
1. Способ прогнозирования нестационарных временных рядов, основанный на авторегрессионной модели скользящего среднего с минимальной среднеквадратической ошибкой, дополнительно содержит операции рециркуляции входных данных на один отсчет, передискретизации исходного процесса в логарифмическом масштабе времени, нахождения энергетического спектра полученного сигнала, определения отклика, соответствующего энтропии энергетического спектра выборки, подвергнутой передискретизации, вычисления максимального значения откликов энтропии, нахождения прогноза для реализации, соответствующей максимальному значению энтропии, передискретизации результата прогнозирования в экспоненциальном масштабе времени.
2. Устройство прогнозирования временных рядов, содержащее аналого-цифровой преобразователь, блок синхронизации, соединенный со вторым входом аналого-цифрового преобразователя, первый вход которого является входом устройства, блок прогнозирования, блок синхронизации, соединенный со вторым входом аналого-цифрового преобразователя, первый вход которого является входом устройства, блок прогнозирования, дополнительно содержит блок задержки, первый вход которого соединен с выходом блока синхронизации, второй вход подключен к выходу аналого-цифрового преобразователя, выход соединен со входом блока передискретизации исходного процесса по логарифмическому масштабу времени, выход которого соединен с первым входом буферного блока памяти, соединенного своим первым выходом со входом блока нахождения спектра сигнала, выход последнего является входом блока вычисления квадрата модуля сигнала, выход которого соединен со входом блока нахождения энтропии выборки, выход которого подключен ко входу блока вычисления максимального значения энтропии, выход которого является вторым входом блока буферной памяти, второй выход которого является входом блока прогнозирования, соединенного своим выходом со входом блока передискретизации результата прогнозирования по экспоненциальному закону.
Способ прогнозирования временных рядов
Суть предлагаемого способа состоит в следующем.
Существующие методы прогнозирования работают наилучшим образом при принятии гипотезы о линейном стационарном процессе. Реальные же процессы часто подвержены влиянию факторов, вносящих нестационарную составляющую. Примером могут являться взрывной процессы в гидрофизике, внезапный дефолт в экономике и т.д. В предлагаемом способе рассматривается возможность расширения использования известных методов прогнозирования на подобные процессы. Для стационарных (аддитивных) процессов используют дискретизацию с постоянным шагом. Для нестационарных процессов предложено применять дискретизацию сигналов с переменным шагом с обязательным обозначением нуля формирования процесса. Примером нестационарного сигнала является сигнал с гиперболической ЧМ (ГЧМ-сигнал), широко известный в радиотехнике [4]. При записи сигнала , где - начальная частота, k - масштабный множитель, характеризующий крутизну модулирующей функции, видно, что мгновенная частота , где - фаза сигнала, стремится к бесконечности при t 0. Поскольку операция сжатия (расширения) не инвариантна относительно операции сдвига во времени, для формирования процедуры экстраполяции процесса требуется информация о начале обрабатываемой реализации. При работе с таким сигналом необходимо найти местоположение нуля, определяющего начало отсчетов.
В предлагаемом способе производятся следующие операции:
Выполняется временное сжатие прогнозируемого процесса, необходимое для обеспечения обработки сигнала в реальном масштабе времени [5]. При этом на каждом шаге реализация обновляется на один отсчет. Таким образом, формируется класс реализаций, отличающихся друг от друга сдвигами на один отсчет. Для формирования класса дискретных выборок каждая реализация подвергается операции логарифмирования и дискретизации.
Реализации сигнала подвергают передискретизации в логарифмическом масштабе времени t lnt. Поскольку исходный процесс поступает с постоянным шагом, вначале восстанавливают дискретный процесс, что решается процедурой интерполяции. При нестационарной передискретизации полагают, что нуль реализации известен. Пусть задан процесс в дискретном виде через единичный интервал дискретизации на интервале длиной М-1, что соответствует М-отсчетам. Полагаем также, что m пробегает значения m (0 M-1). При логарифмическом масштабировании сигнала с шагом q имеем:
, .
Отсюда следует . Процедуру интерполяции следует начинать с последнего отсчета реализации сигнала, рассматривая его значение как последний отсчет интерполированного процесса. При указанном подходе к интерполяции полностью сохраняется информация, содержащаяся в сигнале. Видно, что для проведения логарифмической дискретизации интервала N-1 требуется бесконечное число отсчетов. Поэтому ограничимся дискретизацией только части интервала, формируемого конечной суммой геометрической прогрессии . Начало для узлов интерполяции k (0 K-1) определяется значением:
.
Для проверки видно, что при K t0 0. При использовании стандартной процедуры интерполяции необходимо задать значения узлов интерполяции слева направо. Если провести инверсию номеров отсчетов по закону k (0 K-1):k1=K-1-k, то узлы интерполяции задаются значениями:
После передискретизации процессов для каждой реализации sn(t) формируется спектральная функция Sn(f,T):
.
Далее формируют энергетический спектр: .
Для определения начала реализации предлагается следующая процедура. В качестве критерия выбора реализации предлагается использовать энтропию (информацию Кульбака) [6]:
где - нормированный энергетический спектр выборки, , rss(n) - корреляционная функция процесса.
Эвристическое объяснение выбора такого критерия состоит в том, что он минимизирует случайность или белизну процесса.
Далее осуществляется нахождение максимального значения энтропии в соответствии с соотношением (1.1). Данная операция сводится к сравнению откликов с пороговым напряжением. При превышении порога принимается решение, что максимум найден.
Для реализации соответствующей максимальному значению энтропии применяют операцию передискретизации результата прогнозирования в экспоненциальном масштабе времени t expt. Данное преобразование является обратным к ранее рассмотренному логарифмическому. Отметим, что выполненное ранее масштабирование гиперболического процесса (нестационарного) в логарифмическом масштабе фактически сделало его близким к тональному сигналу. Такой сигнал является, по сути, стационарным и хорошо прогнозируется известными методами. Экспоненциальное преобразование позволило вернуться к исходному гиперболическому процессу.
Применение предлагаемого способа позволяет получить более точный прогноз, чем при применении известных процедур.
Для проверки предлагаемых технических решений был проведен статистический эксперимент, в котором была оценена эффективность использования процедур прогнозирующих функций:
1. Классической процедуры прогнозирования, реализованной в среде MathCad, основанной на гипотезе стационарности входных данных (отсчеты распределены равномерно во времени) и оцениваемой как АРСС прогноза.
2. Процедуры, использующей гиперболическую симметрию для реализации процедуры прогнозирования.
В проведенном эксперименте была выделена методика оценки эффективности прогнозирования процедур. Искусственно формировались сигнал и шум с заданными значениями характеристик. При данном подходе, зная характеристики сигнала и шума, получали полное описание эффективности указанных процедур. К сожалению, в целом методика носила ограниченное применение, из-за того выбранные процессы являются сформированными из известных моделей.
Оценка ошибки прогнозирования определяется в соответствии с соотношением:
где - исходный процесс, - результат прогноза, AA, BB - средние арифметические значения процессов, определяемые по формулам:
, ,
, - вариации процессов и , определяемые по формулам:
,
.
Для ее формирования входной процесс подвергался секционированию на две части, где первая часть процесса рассматривалась как входная выборка, а вторая часть являлась неизвестной, но сформированной будущей частью процесса .
За счет секционирования с перекрытием на половину размера секции и операции осреднения разности оценок получаем общую осредненную оценку ошибки прогнозирования:
где M/2 означает, что имеет место перекрытие на половину длины секций.
Оценка (1.2) вычислялась для процедур прогнозирования по первой и второй методике при изменении верхней частоты.
Из фиг.2. следует что:
1. С увеличением полосы частот ошибка прогнозирования уменьшается.
2. На частотах в пределах от нулевой частоты до 0.1 появляется резкое увеличение ошибки прогнозирования.
3. Начиная с частоты в пределах от 0.1 и выше, наблюдается плавное уменьшение ошибки прогнозирования.
Результат оценки осредненной корреляции прогнозирования в зависимости от полосы частот показан на фиг.3.
Из фиг.3 видно, что:
1. С увеличением полосы частот коэффициент корреляции прогнозирования увеличивается.
2. На частотах до 0.1 наблюдается падение значения коэффициента корреляции прогнозирования до частот в пределах 0.1.
3. Начиная с частоты в пределах от 0.1 и выше, наблюдается плавное увеличение значения коэффициента корреляции прогнозирования.
По второй методике выбиралась модель сигнала по фактическим данным. В этом случае эксперимент носил ограниченный характер оценок в части оценки ошибки прогнозирования.
Рассмотренный подход позволил увеличить объем априорных данных за счет формирования выборки для прогнозирования данных, т.е. на временной плоскости ( ,t), 0 , - <t< . Расчеты показывают, что предложенные операции позволяют уменьшить ошибку прогноза в среднем на 20%.
Устройство прогнозирования временного ряда сигнала
Устройство, реализующее предлагаемый способ прогнозирования временных рядов, приведено на фиг.1 и содержит в себе следующие блоки:
- аналого-цифровой преобразователь (АЦП) - 1;
- блок задержки - 2;
- блок передискретизации - 3;
- блок буферной памяти - 4;
- блок быстрого преобразования Фурье (БПФ) - 5;
- блок вычисления квадрата модуля спектра - 6;
- блок вычисления энтропии - 7;
- блок нахождения максимума - 8;
- блок прогнозирования - 9;
- блок передискретизации - 10;
- блок синхронизации - 11.
В качестве блока задержки 2 можно использовать цифровые линии задержки с рециркуляцией (РЛЗ) [18,5]. Блок быстрого преобразования Фурье (БПФ) 5 предназначен для нахождения спектральной плотности сигнала и широко распространен в цифровой обработке сигналов [7].
Блок нахождения максимума энтропии 8 может быть реализован программно либо в виде порогового блока.
В целом устройство функционирует следующим образом. В блоке задержки 2 анализируемая реализация постоянно обновляется на один отсчет на каждом шаге обработки. В блоке передискретизации 3 последовательность преобразуется в логарифмический масштаб времени t lnt. Текущая реализация сохраняется в блоке буферной памяти 4. Блоки БПФ 5, вычисления квадрата модуля 6 обеспечивают нахождение энергетического спектра реализации для последующего вычисления энтропии в блоке 7 в соответствии с соотношением (1.1). При нахождении максимума энтропии в блоке 8 выдается сигнал в блок буферной памяти 4, который означает, что в нем хранится реализация сигнала с правильно определенным «нулем», определяющим начало отсчета при дискретизации. Выбранная реализация поступает в блок прогнозирования 9. Результат прогноза возвращается в исходный масштаб с помощью блока передискретизации 10, функционирующего по экспоненциальному закону t expt.
ЛИТЕРАТУРА
1. Бокс-Дженкинс. Анализ временных рядов, с.144-150.
2. Хеннон Э. Многомерные временные ряды. - М.: «МИР», 1974. - с.145-185.
3. Бараз В.Р. Корреляционно-регрессионный анализ связи показателей коммерческой деятельности с использованием программы Excel: учебное пособие / В.Р.БАРАЗ. - Екатеринбург: ГОУ ВПО «УГТУ-УПИ», с.41-50.
4. Рихачек. Сигналы, допустимые с точки зрения доплеровского эффекта. ТИИЭР, т.54, N 6, 1966. - с.39-41.
5. Э.Оппенгейм. Применение цифровой обработки сигналов. - М.: Мир, 1980. - с.417-418.
6. С.Кульбак. Теория информации и статистика. - М.: Изд. Наука, 1967. - 408 с.
7. Корнеев В., Кисилев А. Современные микропроцессоры. - М.: Изд. «Нолидж», 1998. - с.136-138.
Класс G06F17/10 комплексные математические операции
Класс G06N7/00 Компьютерные системы, основанные на специфических математических моделях