Оглавление



Оглавление. 2

Выявление существования трендов методом разности средних уровней временного ряда. 3

Задача. 12

Список литературы.. 14

Выявление существования трендов методом разности средних уровней временного ряда

Временным или динамическим рядом называется совокупность наблюдений xi в последовательные моменты времени i = 1, . . . ,N  (обычно для индексации временных рядов используется t , в этом пункте для целостности изложения материала сохранено i). Задача анализа временного ряда заключается в выделении и моделировании 3-х его основных компонент[1]:

xi = δi + γi + εi, i= 1,N,

или в оценках:

xi = di + ci + ei, i= 1,N,

δi, di — тренд, долговременная тенденция,

γi, ci — цикл, циклическая составляющая,

εi, ei — случайная компонента,

с целью последующего использования построенных моделей в прикладном экономическом анализе и прогнозировании.

Для выявления долгосрочной тенденции используют различные методы.

Наиболее распространено использование полиномиального тренда. Такой тренд строится как регрессия xi на полином определенной степени относительно времени:

xi = a1i + a2i2 + . . . + b + ei, i= 1, . . . , N.

Для выбора степени полинома можно использовать F -критерий: оценивают тренд как полином, последовательно увеличивая его степень до тех пор, пока удается отвергнуть нулевую гипотезу.

Для выявления долговременной тенденции применяют также различные приемы сглаживания динамических рядов с помощью скользящей средней.

Один из подходов к расчету скользящей средней заключается в следующем: в качестве сглаженного значения xi, которое по аналогии с расчетным значением можно обозначить через xci , принимается среднее значений

xi−p, . . . , xi, . . . , xi+p , где p — полупериод сглаживания. Сам процесс сглаживания заключается в последовательном расчете (скольжении средней) xcp+1, . . . , xcNp . При этом, часто, теряются первые и последние p значений исходного временного ряда. Для сглаживания могут использоваться различные средние..

Основной чертой, выделяющей анализ временных рядов среди других видов статистического анализа, является существенность порядка, котором производятся наблюдения.

Различают два вида временных рядов. Измерение некоторых величин (температуры напряжения и т.д.) производится непрерывно, по крайней мере, теоретически. При этом наблюдения можно фиксировать в виде графика. Но даже в том случае, когда изучаемые величины регистрируются (или могут регистрироваться) непрерывно  практически при их обработке используются только те значения, которые соответствуют дискретному множеству моментов времени.

Следовательно, если время измеряется непрерывно, временной ряд называется непрерывным если же время фиксируется дискретно (т.е. через фиксированный интервал времени), то временной ряд дискретен. В дальнейшем мы будем иметь дело только с дискретными временными рядами. Дискретные временные ряды получаются двумя способами[2]:

– Выборкой из непрерывных временных рядов через регулярные промежутки времени (например, численность населения, величина собственного капитала фирмы, объем денежной массы, курс акции), — такие временные ряды называются моментными;

– Накоплением переменно в течение некоторого периода времени (примеры: объем производства какого-либо вида продукции, количество осад-

ков, объем импорта), — в этом случае временные ряды называются интервальными.

Тенденция соответствует медленному изменению, проходящему в некотором определенном направлении, которое сохраняется в течение значительного промежутка времени. Тенденцию называют также трендом или

долговременным движением.

Циклические колебания — это более быстрая, чем тенденция, квазипериодическая динамика, в которой есть фаза возрастания и фаза убывания.

Наиболее часто цикл связан с флуктуациями экономической активности.

Сезонные колебания соответствуют изменениям, которые происходят регулярно в течение года, недели или суток. Они связаны с сезонами и ритмами человеческой активности.

Календарные эффекты — это отклонения, связанные с определенными предсказуемыми календарными событиями, такими как праздничные дни, количество рабочих дней за месяц, високосность года и т.п.

Случайные флуктуации — беспорядочные движения относительно большой частоты. Они порождаются влиянием разнородных событий на изучаемую величину (несистематический или случайный эффект).

Выбросы — это аномальные движения временного ряда, связанные с редко происходящими событиями, которые резко, но лишь очень кратковременно отклоняют ряд от общего закона, по которому он движется.

Структурные сдвиги — это аномальные движения временного ряда, связанные с редко происходящими событиями, имеющие скачкообразный характер и меняющие тенденцию.

Некоторые экономические ряды можно считать представляющими те или иные виды таких движений почти в чистом виде. Но большая часть их имеет очень сложный вид. В них могут проявляться, например, как общая тенденция возрастания, так и некоторые сезонные изменения, на которые могут накладываться случайные флуктуации. Часто для анализа временных рядов оказывается полезным изолированное рассмотрение отдельных компонент.

Для того чтобы можно было разложить конкретный ряд на эти составляющие, требуется сделать какие-то допущения о том, какими свойствами должны обладать эти составляющие. Желательно также построить сначала формальную статистическую модель, которая бы включала в себя в каком-то виде эти составляющие, затем оценить ее, а после этого на основании полученных оценок вычленить составляющие. Однако построение формальной модели является сложной задачей. В частности, из содержательного описания не всегда ясно, как моделировать те или иные компоненты. Например, тренд может быть детерминированным или стохастическим. Аналогично, сезонные колебания можно комбинировать с помощью детерминированных переменных или с помощью стохастического процесса определенного вида. Компоненты временного ряда могут входить в него аддитивно или мультипликативно. Более того, далеко не все временные ряды имеют достаточно простую структуру, чтобы можно было разложить их на указанные составляющие.

Существует две основные категории методов разложения временных рядов на компоненты. Первая категория использует множественные регрессии с факторами, являющимися функциями времени, вторая основана на применении линейных фильтров[3].

Сравнительно простой моделью временного ряда может служить модель вида:

xt = µt + εt,, t= 1, 2, . . . , T.

Здесь временной ряд рассматривается как сумма полностью детерминированной последовательности {µt} , которую можно назвать систематической составляющей, и случайной последовательности { εt }, являющейся белым шумом.

Если µt зависит от вектора неизвестных параметров θ :

µt = µt(θ)

то это модель регрессии, и параметры можно оценить методом наименьших квадратов (МНК).

Детерминированная компонента µt , как правило, сама моделируется как состоящая из нескольких компонент.

Например, можно рассмотреть модель, в которой рассматриваемый ряд xt содержит три компоненты: тренд τt , сезонные движения vt и случайные флуктуации εt :

xt = τt + vt + εt.

Часто изучаемый экономический ряд ведет себя так, что аддитивной схеме можно предпочесть мультипликативную схему:

xt = τtvt exp(εt).

Однако мультипликативную схему можно прологарифмировать, чтобы получить аддитивное выражение:

ln(xt) = ln(τt) + ln(vt) + εt = τ * t + v*t + εt.

Таким образом, здесь достаточно просто прологарифмировать исходный временной ряд. Этот прием позволяет оставаться в рамках линейной регрессии

и значительно упрощает моделирование.

Изучая тренды, следует иметь в виду, что существует, вообще говоря, несколько их разновидностей.

Первым и самим очевидным типом тренда представляется тренд среднего,

когда временной ряд выглядит как колебания около медленно возрастающей или убывающей величины.

Второй тип трендов — это тренд дисперсии. В этом случае во времени меняется амплитуда колебаний переменной. Иными словами, процесс гетероскедастичен. Часто экономические процессы с возрастающим средним имеют и возрастающую дисперсию.

Третий и более тонкий тип тренда, визуально не всегда наблюдаемый, —

изменение значимости одной из компонент временного ряда (например, уменьшение величины сезонных колебаний), или, скажем, изменение величины корреляции между текущим и предшествующим значениями ряда, т.е. тренд автоковариации и автокорреляции.

Проводя разложение ряда на компоненты, мы, как правило, подразумеваем под трендом изменение среднего уровня переменной.

Принято выделять четыре основных способа аппроксимации временных рядов и соответственно четыре вида трендов.

– Полиномиальный тренд[4]:

τt = a0 + a1t + . . . + aptp.

– Экспоненциальный тренд:

τt = ea0+a1t+...+aptp

– Гармонический тренд:

τt = Acos(2πft + f)

Оценивание параметров полиномиального и экспоненциального трендов не представляет сложности. После замены переменных в первом случае и логарифмирования функции во втором случае используется обычный метод наименьших квадратов.

Если в составе временного ряда отчетливо прослеживаются  периодические колебания, то для описания этой периодической составляющей можно использовать функцию Acos(2πft + f). Здесь A — амплитуда колебаний, f —линейная частота, f — сдвиг по фазе.

Если рассматривать A, f и f как неизвестные параметры, то функция оказывается нелинейной и не может использоваться в линейной регрессии.

Однако, если частота f известна, то несложно представить данную функцию как линейную комбинацию синуса и косинуса:

Acos(2πft + f) = α cos(2πft) + β sin(2πft)

и, рассчитав векторы cos(2πft) и sin(2πft) , воспользоваться МНК для оценивания параметров α и β .

Логистической функцией называется функция вида:

τt = k/(1 + be−at)

где a , b , k — параметры, которые подлежат оцениванию.

Видно, что с ростом t график логистической фунции стремится к асимптоте: Lim(t→∞)=τt = k.

В этом преимущество логистической функции перед полиномиальной или экспоненциальной функциями, которые по мере роста t стремятся в бесконечность и, следовательно, не всегда годятся для прогнозирования.

Логистическая кривая наиболее часто используется при изучении социальных и, в частности, демографических процессов.

Особенностью логистической кривой является нелинейность по оцениваемым параметрам (a, b, k) , поэтому система уравнений, получаемая с помощью метода наименьших квадратов, нелинейна относительно неизвестных параметров, и для ее решения могут применяться только итеративные численные методы.

Гарольд Готелинг предложил интересный метод для оценки этих параметров, основанный на использовании дифференциального уравнения логистической функции. Дифференцирование функции τt по времени t дает первую производную:

(dτt)/dt= (kabe−at)/(1 + be−at)2 .

Поскольку t2)/k= k/((1 + beat)2 и beat ={ k/(τt)} 1, то подставляя эти выражения в формулу первой производной, получаем дифференциальное уравнение, выражающее зависимость темпа прироста исследуемой переменной от абсолютного уровня показателя в момент времени t:

{dτt /dt}/τt= a −{a/kt.

Исходя из этого соотношения, можно предположить, что в реальности абсолютный прирост показателя ∆xt связан с фактическим его уровнем xt следующей статистической зависимостью

xt = axt1 + (a/k)x2t1 + εt.

К этому уравнению теперь можно применить непосредственно метод наименьших квадратов и получить оценки параметров a и (−a/k) и, следовательно, найти k[5] .

Недостающий параметр b может быть оценен методом Родса. Eсли имеется T наблюдений, происходящих через равные промежутки времени.

Поскольку левую часть дифференциального уравнения можно трактовать как темп прироста, то метод Готелинга имеет ограниченную сферу применения. Его использование оправдано лишь в том случае, если наблюдения в исходном временном ряду представлены через равные промежутки времени (например, ежегодные или еженедельные данные). На практике это требование нередко нарушается.

Существует способ преодоления этой трудности, когда уровни  временного ряда являются неравноотстоящими. Рассчитывается величина, обратная к τt , которую можно обозначить через yt :

yt =(1 + be−at)/k

Функция yt представляет собой линейное разностное уравнение первой степени:

yt+1 =(1 − e−a)/k+ e−ayt

Реальная величина 1/(xt+1) содержит помимо 1/(τt+1) ошибку εt+1 : 1/(xt+1)= β0 + β1/xt+ εt+1 , где β0 = (1 − e−a)/k , β1 = e−a.

Разностное уравнение оценивается методом наименьших квадратов,

получаются оценки для β0 и β1 , на основе которых рассчитываются искомые коэффициенты a и k логистической функции. Значение b также вычисляется по формуле Родса

При моделировании временного ряда часто отбрасываются аномальные наблюдения, резко отклоняющиеся от направления эволюции ряда. Такого рода

выбросы, вместо исключения, можно моделировать с помощью фиктивных

переменных, соответствующих фиксированным моментам времени. Предположим, что в момент t* в экономике произошло какое-нибудь важное событие (например, произошла отставка правительства). Тогда можно построить фиктивную переменную δt* t , которая равна нулю всегда, кроме момента t = t* , когда она равна единице: δt* t = (0, . . . , 0, 1, 0, . . . , 0) .

Описанная фиктивная переменная пригодна только для моделирования кратковременного отклонения временного ряда. Если же в экономике произошел

структурный сдвиг, вызвавший скачок в динамике ряда, то следует использовать фиктивную переменную другого вида: (0, . . . , 0, 1, . . . , 1) . Эта переменная равна нулю до некоторого фиксированного момента t* , а после этого момента становится равной единице.

Заметим, что последние два вида переменных нельзя использовать для прогнозирования, поскольку они относятся к единичным непрогнозируемым событиям.

Задача


Условие:

t-критерий Стьюдента=2,697

F-критерий Фишера= 6,82

Стандартное отклонение S1,2=141,2

Число наблюдений N=8

Горизонт прогнозирования T=9

Параметр а=-48,5

Параметр b=204,6

Решение:

Наша модель выглядит следующим образом:

Y(T)=-48,5+204,6T

а) Заданием определена величина t=2,697, N=8 Доверительные пределы определены a=10% Табличное значение ta/2=1,943. Следовательно, используемая прогнозирующая функция дает прогноз, не соответствующий выбранному пределу, т.е вероятность отклонения истинного значения прогнозного показателя от расчетного превышает 10%

b) заданием опредеена величина F=6,82. Табличное значение равно 13,74, следовательно, модель прогноза статистически незначима.

с) Составим точечный прогноз для года Т=N+m. (В нашем случае m=1)

Если m=1, то Y(9)= -48,5+204,6*9=1792,9

Таким образом, прогнозируемое значение показателя Y в 9-м от начала периоде наблюдения составляет 1792,9

d) Определим доверительные пределы прогноза:

Y(down)=Y(T)-ta/2{(Sa)2+Sb2(T)2+S122}0,5

Y(up)=Y(T)-ta/2{(Sa)2+Sb2(T)2+S12}0,5

Y(down)= 1792,9-1,943{2492,18+97,73*81+19937,44}0,5=1454,4

Y(up)= 1792,9+1,895{2492,18+97,73*81+19937,44}0,5=2131,4

Выполненная оценка доверительных пределов позволяет сделать вывод о том, истинное значение прогнозируемого показателя будет находиться в пределах  1454,4и 2131,4

С вероятностью 95%, что свидетельствует о низкой точности модели, используемой для прогнозирования. Нетрудно сделать вывод о том, что при увеличении числа наблюдений N ширина доверительных пределов уменьшается. С увеличением числа наблюдений происходит уменьшение табличного значения Стьюдента-  ta/2=1,895 при N=8, однако при N=30, ta/2= 1,699.

Список литературы


1. Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001, 346с.

2. Андерсон Т. Статистический анализ временных рядов. — М.: «Мир»,

1976, 343с

3. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1. — М.: «Мир», 1974, 322с

4. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования.

— М.: «Статистика», 1979, 232с

5. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — Начальный курс. — М.: «Дело», 2000,125с

6. Маленво Э. Статистические методы эконометрии. Вып. 2. — М.: «Статистика», 1976, 223с



[1] Андерсон Т. Статистический анализ временных рядов. — М.: «Мир»,

1976, 123с


[2] Андерсон Т. Статистический анализ временных рядов. — М.: «Мир»,

1976, 143с


[3] Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — Начальный курс. — М.: «Дело», 2000,125с

[4] . Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001, 221с

[5] . Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001, 93с.