Реферат: Корреляционный анализ 3
Название: Корреляционный анализ 3 Раздел: Рефераты по математике Тип: реферат | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Корреляционный анализ . 1. Сбор и анализ данных. Будем считать, что данные, кот. нам даны – это случайная выборка. Анализ данных – проводится с целью принятия гипотезы о виде корр. зависимости. График корр. поля. Если принимается гипотеза о линейной зависимости, то 2. Вычисл. лин. коэфф. корр. 3. Проверка стат. значимости а) принимается нулевая гипотеза об отсутствии корр. в ген. совок-ти б) альт. гип-за, что корр. есть
а) б) 4. Выводы и рекомендации. а) Наличие достаточно большого по величине стат. значимого выборочного коэфф. корр. свидет-ет о наличии достат. тесной корр. зав-ти м/у исследуемыми показателями т.е. изменение одного показателя ведет за собой изменение ср. знач-я другого показ-ля и это св-во с опред. вероятностью распространяется на всю ген. совокупность. Если ЛПР считает политику в прошлом правильной, тоее можно распространить на будущее. б) Если наоборот, то политика была неэфф., в будущем ее надо менять. Множеств. корреляция . Коэфф. множеств. корр. показывает степень влияния всех остальных факторов на один (два…). Составляется матрица парных коэффициентов корр-ции:
Частная корреляция . Частный коэфф-ент корр. показывает м/у двумя факторами при исключении третьего (в отличии от парного коэффициента, кот. не исключает влияния остальных факторов).
(общая имеет вид Чем ближе частный коэфф. корр. к парному, тем меньше влияние третьего фактора на первые 2. Проверка стат. значимости. Аналогично выдвигаются две гипотезы. Гипотезы проверяются с помощью t-статистики Стьюдента
а) б) Регрессионный анализ. 1 этап. Построение задачи и определение цели регрессии исследования. 2 этап. Сбор и анализ данных. 3 этап. Спецификация. 4 этап. Оценка качества модели. а) Анализ остатков. 1) Графический способ. Наблюдение, кот. связано с выбросом, исключается таблицы данных и модель пересчитывается снова для нового объема данных. 2) Критерий серий.
3) Критерий Дарбина-Уотсона. Принимается гипотеза По таблице (
автокорреляция ? Автокорреляция отсутствует ? Отрицат. автокорреляция
Выводы: Остатки удовлетворяют основным требованиям регрессионного анализа и можно переходить к следующему этапу; Остатки не удовлетворяют основным требованиям регрессионного анализа, необходимо вернуться к исследованию спецификации модели на первом и втором этапах. б) Анализ качества коэфф. регрессии. Принимается гипотеза о том, что в ген. совок-ти фактор Проверка этой гипотезы осущ. с помощью t-статистики:
Если Если в) Построение доверительных интервалов для коэфф. теор. ур-я регрессии. г) Оценка качества модели в целом.
Принимается гипотеза об отсутствии совместного влияния всех факторов на изменение
Если Криволинейная корр. зависимость. Линейный коэфф. корр. применять нельзя. Применяются корр. отношения.
Пример. Дано:
Проверка стат. значимости: критерий Фишера:
Способы построения модели регрессии. Метод последовательного включения. Все данные должны представлять случайную выборку. На основе данных определяется корреляционная матрица:
По первому столбцу выбирается мах стат. значимый коэфф. регр-ии. Соответствующий фактор первым включается в модель ( Далее определяется 2 фактор. Вычисляется частный коэфф. корр. 1 порядка м/у
Далее вычисл. частный коэф. корр. II порядка при исключ. уже включ. факторов:
Каждый раз строятся модели, вычисл. t-статистики, Метод последовательного исключения. Применяется, если среди факторных переменных есть неслуч. переменные. Сначала строится регесс. модель, включ. все факторные переменные. производится оценка коэфф. регрессии, для всех коэфф. опред. t-статистика. Если в построенной модели все Если же для нескольких факторов Метод всех возможных регрессий. Строятся модели с различным кол-вом факториальных признаков: от 1 до
Выбирается лучшая модель (все коэфф. значимы). Временные ряды. Метод среднего абсолютного отклонения. Предназначен для прогнозирования на один год. Временной ряд
Точность аппроксимации характеризуют: средняя абсолютная погрешность
Практически хорошим качеством аппроксимации считается Метод экспоненциального сглаживания.
Прогнозное значение показателя Х в году Т+1 есть S(t+1). Метод скользящих средних. Сущность метода состоит в укрупнении интервалов и определении средних для каждого укрупненного интервала:
Общая формула для средней скользящей:
Построение модели тренда. 1. Сбор и анализ данных. 1.1 На основе графического анализа данных выдвигается гипотеза о наличии понижательной или повышательной тенденции. 1.2 Данная гипотеза проверяется на основе критерия Кендела:
Проверяется стат. значимость
Если Если Выбор наилучшей кривой осуществляется: а) на основе следующего критерия:
б) Используется также коэфф. Тейла:
Модели временных рядов с периодической компонентой. В этих моделях временной ряд разлагается на три компоненты: тренд – Т, сезонную компоненту Sи случайную компоненту или погрешность – Е. В аддитивных моделях уровни временного ряда представлены как сумма этих компонент – Анализ модели с аддитивной компонентой. 1. Анализ данных. Построение графика, вывод о возможности использования аддитивной модели.
2. Расчет сезонной компоненты. 2.1 Расчет скользящей средней с шагом 4. 2.2 Центрирование скользящей средней. 2.3 Определение сезонной компоненты: 2.4 Расчет средних значений сезонной компоненты по кварталам. 2.5 Корректировка средних значений сезонной компоненты. 3. Определение тренда.
3.1 Десезонализация данных: от всех уровней ряда вычитают соотв. знач-е скорр. сезонной компоненты, получают значения, содержащие тренд и случайную компоненту:
3.2 Построение модели тренда методом наименьших квадратов на основе десезонализированных данных. 4. Определение качества модели и расчет ошибок. Ошибки должны составлять небольшую долю. 5. Построение прогноза с учетом сезонных колебаний. Сначала рассчитывается прогноз по модели тренда, а затем проводится корректировка прогноза на сезонную компоненту. На IIквартал 4 года: по прогнозу: 8,07+19,9*14=359; скорректированное знач-е: Анализ модели с мультипликативной компонентой. 1. Анализ данных. Построение графика и вывод о необходимости использовать модель с мультипликативной компонентой. 2. Расчет сезонной компоненты. 2.1 Расчет сезонной средней с шагом 4. 2.2 Центрирование скользящей средней. 2.3 Определение коэфф. сезонности путем деления уровней ряда на значение центрированной скользящей средней за соответствующий момент времени.
2.4 Расчет средних значений коэфф. сезонности по кварталам.
2.5 Корректировка средних значений коэфф. сезонности (сумма оценок сезонной компоненты должна равняться 4, в противном случае производится корректировка.) 3. Определение тренда. 3.1 Десезонализация данных путем деления фактич. знач-ий ряда на скор. коэфф. сезонности за соотв. квартал.
3.2 Построение модели тренда на основе десезонализированных данных методом МНК.
4. Определение качества модели и расчет ошибок. Ошибки должны быть невелики.
5. Построение прогноза с учетом сезонных колебаний. 5.1 Расчет прогнозных значений на основе тренда. Для II квартала 4 года: Т=128,5+3,2*14 5.2 Корректировка сезонных значений с учетом коэфф. сезонности: |