//Электрика. – 2007. – № 3.– С.41-46

 

ПРОГНОЗИРОВАНИЕ ЭЛЕКТРОПОТРЕБЛЕНИЯ МЕТОДОМ

АНАЛИЗА ГЛАВНЫХ КОМПОНЕНТ

(Опыт применения пакета Mathcad-2001)

 

В. И. Гнатюк, Д. В. Луценко, Л. И. Двойрис, Д. В. Антоненков, П. Ю. Дюндик

Калининградский государственный технический университет

 

В работах [1,2] показана возможность анализа и синтеза временных рядов с помощью метода анализа главных компонент (АГК), получившего в англоязычной версии название Singular Spectrum Analysis (SSA). Как показано в [2], данный метод совмещает в себе достоинства многих других методов, в частности, анализа Фурье и регрессионного анализа. Одновременно он отличается простотой и наглядностью в управлении. Базовый вариант метода состоит в преобразовании одномерного ряда в многомерный с помощью однопараметрической сдвиговой процедуры, в исследовании полученной многомерной траектории с помощью анализа главных компонент (сингулярного разложения) и восстановлении (аппроксимации) ряда по выбранным главным компонентам. Таким образом, результатом применения метода является разложение временного ряда на простые компоненты: медленные тренды, сезонные и другие периодические или колебательные составляющие, а также шумовые компоненты. Полученное разложение может служить основой корректного прогнозирования, как самого ряда, так и его отдельных составляющих [2].

Используем этот метод для прогнозирования электропотребления объектов техноценоза [3]. На основе информации о месячном электропотреблении (в кВт·ч) создается электронная база данных. Рекомендуется базу данных формировать в виде файла Microsoft Excel, в котором должны содержаться только числовые значения, при этом столбцы должны соответствовать объектам техноценоза, а строки – месяцам. Перед началом обработки данные необходимо подвергнуть верификации [3,4] и сохранить под именем «data_lu.xls» в директории «c:\mathcad_dat», которая должна быть заблаговременно создана в корневом каталоге диска «c:\». Далее, уже программными средствами, осуществляется импорт данных из файла «data_lu.xls» в тело mathcad-программы. В настоящем примере используются десятилетние данные по электропотреблению реально существующего в Калининградской области техноценоза, состоящего из рассредоточенных по всей территории региона 69 объектов (подробно см. [3]).

Подготовка данных. Зададим начало отсчёта, а также для последующей обработки импортируем данные из внешнего файла [5].

 

 

X

 

 

         При необходимости можно осуществить просмотр базы данных непосредственно в теле программы.

        Таким образом, столбец матрицы данных представляет собой реализацию случайного процесса электропотребления объекта техноценоза на глубину N месяцев.

В данном случае:

       Выделение из исходной базы матриц верификации и данных. В настоящей программе осуществляется прогноз на 12 месяцев вперёд, но при необходимости горизонт прогноза можно изменить.

Выделение матрицы данных осуществляется следующим образом:

 

 

 

       Далее выделим матрицу верификации.

 

       Также можно просмотреть реализацию случайного процесса электропотребления по каждому объекту. В данном случае рассматривается первый объект техноценоза (рис. 1). Однако изменение параметра k прямо в теле программы позволяет произвести мгновенный пересчёт применительно к любому интересующему объекту.

Развёртка одномерного ряда в многомерный. Подпрограмма P1(x,) преобразует отдельную реализацию X длиной n в матрицу с параметром  [2].

Определим параметр Ф, который задаёт количество членов исходной реализации, составляющих строку конечной матрицы (данный параметр равен числу её столбцов).

 

 

 

 

        Подпрограмма SSA(W) осуществляет преобразование по всей матрице данных. Результатом выполнения программы является вектор, элементы которого – вложенные матрицы.

         Возможен просмотр преобразованной матрицы для k-го объекта.

 

         Проанализируем изменение выборочных средних и средних квадратичных отклонений (СКО) в зависимости от номера столбца преобразованной матрицы k-го объекта (рис. 2 и 3).

 

        Анализ ковариационной матрицы для каждого объекта. Натуральный ряд, длина которого соответствует количеству объектов техноценоза:

 

        Сформируем вектор, элементы которого представляют собой ковариационные матрицы [1,5].

 

         Определим собственные числа ковариационной матрицы [5].

 

 

      Зададим вектор, каждый элемент которого представляет собой вектор отсортированных в порядке убывания собственных чисел ковариационной матрицы (рис. 4).

 

 

 

 

 

 

Рис. 4

Визуальный анализ рисунка 4 показывает, что первые четыре собственных числа имеют наибольшее значение, а значит, способны «объяснить» основную долю дисперсии [1].

Определим количество собственных чисел, «объясняющих» заданную долю дисперсии. Предлагаемый алгоритм использует одно из свойств собственных чисел: чем больше доля собственного числа в сумме элементов вектора собственных чисел, тем большую долю информации «способна объяснить» соответствующая ему главная компонента [1,2]. Для выполнения подпрограмм необходимо задать долю дисперсии (в процентах), которую необходимо «объяснить» (в данном случае задаётся 99 %).

 

 

 

 

 

 

 

 

 

       Получаем вектор, элементы которого представляют собой количество собственных чисел, объясняющих 99 % дисперсии для k-го объекта.

 

 

Найдем собственные вектора [5].

 

 

        Сформируем вектор, элементы которого представляют собой матрицы собственных векторов.

 

 

 

 

 

 

 

 

Прогнозирование электропотребления объектов техноценоза методом АГК. Будем полагать, что структура ряда для зарезервированных и обработанных данных остается неизменной [2]. Следовательно, ковариационная матрица, собственные числа и собственные вектора остаются неизменными также и для второй части временного ряда электропотребления. С учётом этого допущения составим подпрограмму прогнозирования временного ряда на основе следующих входных аргументов: AQ – матрица собственных векторов, x – обрабатываемая часть ряда, n – горизонт прогноза,  – параметр преобразования ряда в матрицу, L – задаваемое число собственных векторов. Если число собственных векторов максимальное, т. е. равно параметру , то на каждом шаге прогноза приходится решать системы линейных уравнений, в которых число неизвестных в точности равно числу уравнений. Как показано в [2], эти системы имеют единственное решение. Если число учитываемых собственных векторов меньше параметра , то системы линейных уравнений становятся избыточными, и для их решения следует применять метод наименьших квадратов. В любом случае свободными членами систем являются члены ряда, дополняемые прогнозируемыми значениями. Поэтому необходимо на каждом шаге формировать вектор свободных членов из ряда переменной длины. Для этого составим вспомогательную подпрограмму R, аргументами которой являются обрабатываемая часть ряда x, параметр , а также номер шага реализуемого прогноза m.

 

 

        Подпрограмма PR служит для прогнозирования отдельной реализации процесса электропотребления.

 

 

           В свою очередь, подпрограмма Prognoz служит для прогнозирования по всей матрице данных.

 

 

         Визуализируем результаты расчётов для глубины прогноза, задаваемого параметром s (в данном случае s – месяцы) (рис. 5).

 

 

 

 

Вычислим относительную среднеквадратическую ошибку прогноза по каждому объекту [3].

         Относительная годовая ошибка прогноза по каждому объекту:

        Анализируя ошибки прогноза, можно сделать вывод о том, насколько структура обработанных данных соответствует зарезервированным. При значительных ошибках, превышающих 10 – 15 %, объекты следует подвергать обследованию с целью выявления причин структурных изменений. Прогнозирование электропотребления таких объектов должно производиться другими методами (например, Z- или GZ-методами [3]).

Анализ собственных векторов временного ряда. При необходимости можно осуществить пообъектный анализ собственных векторов с целью выявления информации о структуре процесса электропотребления и составляющих его факторных слагаемых. Для этого выполним анализ собственных векторов (на примере k-го объекта). На рис. 6 приведены графики, иллюстрирующие главные компоненты (номера векторов показаны по оси ординат графиков).

Анализ рис. 6 показывает, что первый собственный вектор является составляющей тренда и уровня процесса, второй и третий, а также шестой и седьмой – относятся к низкочастотной составляющей. Однако четвёртый и пятый векторы полезной информации о процессе не несут.

Ниже на рис. 7 показаны двумерные проекции собственных векторов k-го объекта (номера проецируемых векторов показаны по осям).

Анализ рис. 7 позволяет сделать следующие выводы по k-му объекту: второй и третий собственные векторы отражают годовые циклы; шестой и седьмой – восьмимесячные; восьмой и девятый – трехмесячные циклы; остальные двумерные проекции собственных векторов полезной информации о процессе электропотребления не несут.

Общие выводы по k-му объекту:

·                                                 сравнительно невысокая относительная годовая ошибка прогноза электропотребления (2,581 %) в целом свидетельствует об адекватности выполненных расчётов;

·                                                 можно предположить, что за исследуемый период отсутствовали существенные структурные изменения внутри самого объекта;

·                                                 тенденция на увеличение электропотребления отсутствует;

·                                                 в процессе функционирования объекта достаточно ярко выражены годовые, восьмимесячные и квартальные циклы электропотребления, которые необходимо учитывать при планировании ремонта и технического обслуживания оборудования.

Список литературы

            1.                                                  Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989. 607 с.

            2.                                                  Данилов Д. Л., Жиглявский А. А. Главные компоненты временных рядов: Метод «Гусеница». СПб.: СПбГУ, 1997. 308 с. (Компьютерная версия в сети Интернет – см. на сайте http://www.gistatgroup.com/gus).

            3.                                                  Гнатюк В. И. Закон оптимального построения техноценозов. М.: Изд-во ТГУ Центр системных исследований, 2005. 384 с. (Компьютерная версия в сети Интернет – http://www.baltnet.ru/~gnatukvi/ind.html).

            4.                                                  Гнатюк В. И., Луценко Д. В. Верификация базы данных по электропотреблению // Электрика, 2006. № 7. С. 35 – 38.

            5.                                                  Дьяконов В. П. MATHCAD 8/2000: Специальный справочник. СПб.: Питер, 2001. 59с.


 

Рис. 1. Случайный процесс электропотребления  k-го объекта: абсцисса – месяцы; ордината – электропотребление, кВт·ч

 

Рис. 2. Динамика изменения выборочного среднего для k-го объекта:  абсцисса – месяцы; ордината – выборочное среднее, кВт·ч

 

Рис. 3. Динамика изменения СКО для k-го объекта: абсцисса – месяцы; ордината – СКО, кВт·ч

 

Рис. 4. Кривая собственных чисел k-го объекта: абсцисса – номера собственных чисел; ордината – логарифмы собственных чисел

 

Рис. 5. Сравнение прогнозных значений с реальными данными для k-го объекта: абсцисса – месяцы; ордината – электропотребление, кВт·ч; точки – реальные данные; квадраты – прогнозные значения

 

Рис. 6. Главные компоненты временного ряда электропотребления: абсцисса – месяцы; ордината – собственные вектора

 

Рис. 7. Проекции собственных векторов временного ряда электропотребления k-го объекта: номера проецируемых векторов показаны по осям