Статистические методы прогнозирования временных рядов. Предобработка данных. Кривые роста | Школа финансового анализа и инвестиционной оценки Жданова Василия и Жданова Ивана

В этой статье попытаемся дать общее представление о статистических методах прогнозирования временных рядов.

Прогноз – возможное состояние объекта в будущем, а также суждение об альтернативных путях достижения этого состояния в будущем.

Классификация прогнозов:
По масштабности выделяют следующие прогнозы:

Прогнозы микроуровня
Прогнозы макроуровня
Глобальные прогнозы

По времени прогнозы делят на:

Краткосрочные
Среднесрочные
Долгосрочные

Это довольно условное деление, так как деление производит эксперт, изучающий временные ряды.

Прогнозирование можно рассматривать на двух уровнях:

Прогнозирование как предсказание
Прогнозирование как предуказание

Предсказание – отвечает на вопрос «что нам ожидать в будущем?», описывает перспективы изменения объекта исследования в будущем. (Такие прогнозы называют поисковыми)
Предуказание – отвечает на вопрос «что нам нужно изменить в будущем, что бы получить заданное состояние объекта?», возможное решение проблем, возникающих при предсказании. (Такие прогнозы называют нормативными).

Этапы прогнозирования включают в себя следующие уровни:

Сбор необходимой задачи для прогноза
Предобработка данных
Определение моделей прогнозирования
Оценка параметров выбранных моделей
Проверка на адекватность выбранной модели
Выбор лучшей модели для прогнозирования
Построение прогноза по выбранной модели
Анализ результатов

Изменение экономико-финансовых показателей чаще всего отражается временными и динамическими рядами.
Динамические ряды – совокупность последовательных наблюдений показателя х в зависимости от изменения показателя y.
Временные ряды – называют совокупность последовательных наблюдений, упорядоченных во временной последовательности.
Статистические методы прогнозирования временных рядов. Предобработка данных. Кривые роста

Рисунок 1. Пример временного ряда

Временные ряды можно разделить на моментные и интервальные ряды. Моментные временные ряды – наблюдения характеризуют объект на определенный момент времени. Интервальные временные ряды – ряд наблюдений характеризует объект за определенный период времени.
Процесс прогнозирования финансово-экономических рядов состоит в определении и выделении закономерностей, которые объясняли динамику изменения процесса в прошлом, для того чтобы потом использовать ее для описания ее развития в будущем. Для успешного осуществления процесса прогнозирования необходимо, что бы анализируемый временной ряд был достаточной длины (свойство полноты информации), во временном ряде не должно быть пропусков (свойство непрерывности). Соответствие изучаемого временного ряда этим требованиям проверяется на этапе «Предварительная обработка данных».

Давайте рассмотрим компоненты временного ряда.

Трендовая — T
Сезонная — S
Циклическая -C
Нерегулярная — e

Тренд – направленное изменение значений наблюдаемого временного ряда. Наряду с трендовыми движениями, в экономических процессах часто присутствует сезонная составляющая, которая представляет период колебания показателей, не превышающих 1 год. Если период более 1 года, то говорят, что во временном ряду присутствует циклическая составляющая. Если из изучаемого ряда убрать трендовую составляющую и периодическую (циклическая и сезонная), то останется нерегулярная, случайная компонента.
Если временной ряд равен сумме своих компонент
Y=T+S+C+e,
то полученная модель ряда называется аддитивной, если в виде произведения
Y=T*S*C*e,
то это мультипликативная модель.
Смешанный тип модели временного ряда соответственно представлен формулой
Y=T*S*C+e, где Y-значение временного ряда.
Если все компоненты во временном ряду правильно выделены, то случайная недетерминированная, некоррелированная компонента е обладает следующими свойствами:

е – является случайными величинами
случайные величины распределены по нормальному закону распределения
имеет математическое ожидание равно 0

Предобработка временных рядов
Статистические методы прогнозирования временных рядов. Предобработка данных. Кривые роста
Аномальные наблюдения могут возникнуть из-за ошибок в измерении и передачи информации (ошибки первого рода – подлежат устранению) или воздействия на изучаемый процесс редко появляющихся объективных факторов (ошибки второго рода – не подлежат устранению).
Устранение аномальных наблюдений производится в 2 этапа: поиск аномальных наблюдений по методу Ирвинга и замена их на среднее арифметическое соседних значений.

Статистические методы прогнозирования временных рядов. Предобработка данных. Кривые роста

Одним из самых распространённых методов сглаживания временных рядов является метод скользящей средней. Суть использования метода заключается в замене значений временного ряда на более сглаженные значения, подверженные колебаниям в меньшей степени. Скользящие средние позволяют выявить тенденцию в развитии процесса и отфильтровать компоненты временного ряда, а также подготовить данные для построения модели прогнозирования.
Сглаживание может производиться следующими методами:

Простой скользящей средней (SMA)
Взвешенной скользящей средней (WMA)
Экспоненциальной скользящей средней (EMA)

Далее рассмотрим основные методы, используемые для определения наличия – отсутствия тренда в исследуемом временном ряде:

Критерий восходящих/нисходящих серий Кокса-Стюарта
Критерий серий (основанный на медиане выборки)
Метод Фостера-Стюарта
Метод автокорреляционных функций

Расчет количественных характеристик развития экономических процессов включает в себя определение: расчета абсолютных приростов, расчета темпов роста, выявления автокорреляции временного ряда. В основе вычисления этих показателей лежит сравнение значений временного ряда. Такой подход к анализу и прогнозированию процесса применим, если изучаемый временной ряд имеет линейную тенденцию. К недостаткам такого анализа следует отнести то, что в нем учитывается только конечные и начальные значения временного ряда и исключается влияние промежуточных данных.

Построение моделей временных рядов
Формирование значений временного ряда определяется тремя закономерностями:

Инерцией тенденции
Инерцией взаимосвязи между последовательными значениями временного ряда
Инерцией взаимосвязи между исследуемым показателем и показателями – факторами, оказывающие на него воздействие

В соответствии с этими закономерностями выделяют задачи анализа и моделирования тенденций (решается с помощью моделей кривых роста), анализа взаимосвязи между значениями временного ряда (решается с помощью адаптивных моделей), анализа причинных взаимодействий между исследуемым показателем и показателями – факторами (решается регрессионными методами).
Кривая роста – плавная кривая, аппроксимирующая временной ряд. Аналитические методы выделения неслучайной составляющей временного ряда с помощью кривых роста реализуется в рамкам модели регрессии.
Процедура разработки прогноза по кривым роста:

Выбор кривой роста
Оценка параметров выбранной кривой
Расчет точного и интервального прогноза
Оценка полученного прогноза

Кривые роста делятся на три класса. К первому классу относят кривые для описания монотонных процессов развития объекта. Ко второму классу относят кривые, которые описывают процессы с пределом роста в исследуемом периоде (их называют кривые насыщения). Если кривые насыщения имеют точку перегиба, то они относятся к 3му классу S – образных кривых.

Статистические методы прогнозирования временных рядов. Предобработка данных. Кривые роста
1 класс кривых роста включает – полином первого порядка, второго, третьего, экспоненту, экспоненциальные кривые.
2 класс кривых роста включает – модифицированную экспоненту.
3 класс кривых – Кривая Гомперца, логистическая кривая.

Наиболее простой способ выбрать кривую роста – визуальный метод. Подбирают кривую, наиболее точно описывающую исследуемый процесс.
Оценка качества полученной модели для прогнозирования по кривым роста производится при проверке адекватности и оценки точности модели.
В проверку адекватности входит: проверка независимости (отсутствие автокорреляции по критерию Дарбина-Уотсона), проверка случайности, соответствие остатков временного ряда случайному распределению(R/S критерий), равенство 0 средней ошибки.
Точность модели оценивается по методу МНК, т.е. кривая подбирается таким образом, чтобы график функции кривой роста располагался на минимальном удалении от точек процесса.