Гнатюк В.И. Закон оптимального построения техноценозов, 2005

Гнатюк В.И. Закон оптимального построения техноценозов, 2005 – главная страница

Адрес монографии в сети – http://gnatukvi.narod.ru/ind.html

5.4. Выполнение тонких процедур рангового анализа

5.4.1. Обработка ранговой параметрической поверхности

методом «Singular spectrum analysis»

Подготовка данных. Преобразование матрицы данных с помощью сдвиговой процедуры в траекторную матрицу. Исследование траекторной матрицы с помощью анализа главных компонент. Восстановление исходной матрицы по выбранным главным компонентам. Выводы.

Для эффективной реализации тонких процедур рангового анализа техноценоза (дифлекс-, GZ- и ASR-анализа), подробно описанных в параграфе 4.1, зачастую возникает необходимость исследования его ранговой параметрической поверхности, которая представляет собой двумерное поле рангового параметрического распределения во времени. Очевидно, что на техноценоз в процессе функционирования оказывают влияние несистематические, случайные факторы, искажающие форму ранговой поверхности. Такие искажения могут в значительной степени снизить достоверность тонких процедур рангового анализа. Процедура выделения и устранения несистематических компонент осуществляется при помощи метода Singular Spectrum Analysis (SSA) [1], обладающего простотой и наглядностью. Алгоритм метода SSA для двумерного поля состоит из следующих шагов: преобразования исходной матрицы данных с помощью сдвиговой процедуры в траекторную матрицу; дальнейшего ее исследования с помощью анализа главных компонент; восстановления исходной матрицы по выбранным главным компонентам. В конечном итоге, результатом применения метода является разложение матрицы (двумерного поля) на составляющие: систематические (определяемые закономерностью развития процесса во времени) и несистематические («шум») с последующим удалением «шумовой» составляющей.

Используем этот метод для рангового анализа электропотребления объектов техноценоза. После сбора информации о годовом электропотреблении (в кВт·ч) создается электронная база данных. Рекомендуется базу данных формировать в виде файла Microsoft Excel, в котором должны содержаться только числовые значения, при этом столбцы должны соответствовать объектам техноценоза, а строки – годам процесса электропотребления. Перед началом программной обработки данные следует подвергнуть процедуре верификации, которая описана выше в пункте 5.1.2, и сохранить под именем «data_d.xls» в директории «c:\mathcad_dat», которая должна быть заблаговременно создана в корневом каталоге диска «c:\». Далее, уже программными средствами, осуществляется импорт данных из файла «data_d.xls» в тело mathcad-программы.

Подготовка данных

С целью принудительного упорядочения индексации в матрицах и векторах, используемых в программе, зададим начало отсчета.

Далее импортируем данные по электропотреблению для последующей обработки. При этом числовые значения из файла «c:\mathcad_dat\data_d.xls» присваиваются соответствующим элементам матрицы V [4].

При необходимости можно осуществить просмотр данных по электропотреблению непосредственно в теле программы.

Построим табулированные ранговые параметрические распределения техноценоза по электропотреблению (см. п. 2.2).

Таким образом, столбец матрицы V1 представляет собой ранговое параметрическое распределение исследуемого техноценоза на определенном временном интервале (году). Визуализируем данные (рис. 5.49).

Рис. 5.49.

Трехмерная ранговая параметрическая

поверхность техноценоза:

V1 – исходная эмпирическая матрица данных;

абсцисса – ранг объекта;

ордината – временной интервал (год);

аппликата – электропотребление, кВт·ч

Преобразование матрицы данных с помощью

сдвиговой процедуры в траекторную матрицу

Преобразование матрицы ранговых параметрических распределений при помощи матрицы-окна определенного размера в траекторную матрицу подробно описано в работе [1]. Подпрограмма «GS(a)» предназначена для преобразования матрицы-окна в вектор.

Для того чтобы можно было в дальнейшем восстановить исходную матрицу, создадим специальную матрицу индексов. При этом матрица индексов должна совпадать по размеру с исходной матрицей ранговых параметрических распределений.

Зададим размер матрицы-окна.

Далее преобразуем матрицу ранговых параметрических распределений и матрицу индексов по алгоритму, описанному в работе [1].

Исследование траекторной матрицы с помощью

анализа главных компонент

В первую очередь найдем ковариационную матрицу.

Далее определим собственные числа ковариационной матрицы и визуализируем их для предварительного анализа (рис. 5.50) [1].

Рис. 5.50.

Собственные числа ковариационной матрицы:

абсцисса – порядковый номер числа;

ордината – значение собственного числа

Определим количество собственных чисел, объясняющих заданную долю дисперсии (в данном случае m = 98,89%) [1].

Таким образом, для нашего примера количество собственных чисел, объясняющих 98,89% дисперсии, составляет:

Найдем собственные вектора по определенному выше количеству собственных чисел. Процедуру нахождения собственных векторов можно рассматривать как задание нового многомерного базиса, на направлениях орт которого дисперсия максимальна [1].

Далее найдем главные компоненты. При этом осуществляется проецирование («натягивание») исходной многомерной совокупности данных на орты в пространстве меньшей размерности [1].

Восстановление исходной матрицы

по выбранным главным компонентам

Восстановим траекторные матрицы соответственно по первой, второй и третьей главным компонентам [1].

Далее восстановим матрицу ранговых параметрических распределений техноценоза.

В результате проделанных процедур получаем разложение матрицы ранговых параметрических распределений (рис. 5.51).







Рис. 5.51.	Трехмерные ранговые поверхности техноценоза, восстановленные по главным компонентам: W1, W2 и W3 – матрицы соответственно первой, второй и третьей главных компонент; абсцисса – ранг объекта; ордината – временные интервалы (годы); аппликата – электропотребление (знак учитывает отклонения второй и третьей компонент), кВт·ч

Первая главная компонента является основной в разложении. Она задает структуру ранговой параметрической поверхности техноценоза по электропотреблению. Данная компонента описывает техноценоз в целом. В известном смысле ее можно считать «ципфовой компонентой». Вторая главная компонента является вторичной (с точки зрения порядка величин). Она задает тренд процесса электропотребления. Данная компонента имеет отношение в основном к ноевой и пойнтер- кастам техноценоза. Ее можно считать «гауссовой компонентой разложения». Третья главная компонента является третичной (с точки зрения порядка величин). Она задает цикличность процесса электропотребления. Данная компонента имеет отношение в основном к ноевой и старшим пойнтер- кастам. Ее также можно считать «гауссовой компонентой разложения» [20].

Очевидно, что для нахождения результирующей матрицы необходимо сложить отдельные компоненты (рис. 5.52).

Рис. 5.52.

Трехмерная ранговая поверхность техноценоза,

восстановленная по трем главным компонентам:

W – восстановленная матрица данных;

абсцисса – ранг объекта;

ордината – временные интервалы (годы);

аппликата – электропотребление, кВт·ч

Проанализируем отклонения восстановленных значений (матрица W, рис. 5.52) от исходных эмпирических (матрица V1, рис. 5.49). При этом используем методики, изложенные в параграфе 4.6 и пункте 5.3.3.

Выводы

Таким образом, в ходе реализации программы удалось разложить матрицу ранговых параметрических распределений техноценоза, определить ее главные компоненты, а также восстановить данные после удаления несистематических составляющих. При этом суммарное максимальное относительное отклонение восстановленных значений от исходных эмпирических на одном временном интервале не превысило 5%. Следовательно, задача удаления «шумовой» составляющей решена без потери полезной информации.

При использовании материалов ссылки обязательны

E-mail: gnatukvi@mail.ru