Контрольная работа: Построение и анализ однофакторной эконометрической модели
Название: Построение и анализ однофакторной эконометрической модели Раздел: Рефераты по математике Тип: контрольная работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задача 1. Построение и анализ однофакторной эконометрической модели Однофакторная производственная функция накладных расходов в шахтном строительстве имеет вид У=a0 +a1 x+e, где У – накладные расходы, часть в затратах; х – годовой объем затрат, тыс. грн; На основании статистических данных по девяти шахтостроительным управлениям, используя 1МНК, найти оценки параметров производственной функции накладных расходов для шахтостроительного объединения. Дать общую характеристику достоверности и экономическую интерпритацию построенной модели. Таблица 1 – Исходные данные
Построение и анализ классической однофакторной эконометрической модели 1. Спецификация модели. 1.1 Идентификация переменных Y – накладные расходы – результирующий показатель; Х – объем работ – показатель-фактор; Таблица 2 – Исходные данные и элементарные превращения этих данных для оценки модели.
1.2 Общий вид линейной однофакторной модели и её оценки Полученная диаграмма свидетельствует о слабой обратной зависимости. Введем гипотезу, что между фактором Х и показателем У нет корреляционной зависимости. 1.3 Оценка тесноты связи между результативным показателем У и фактором Х на основании коэффициента парной корреляции Парные коэффициенты корреляции вычисляем по формуле: – среднее квадратическое отклонение показателя Y; – среднее квадратическое отклонение фактора X; – дисперсия показателя Y; – дисперсия показателя X; – коэффициент ковариации признаков Y и Х;
Вывод: Поскольку коэффициент парной корреляции rху =-0,8461, то это свидетельствует об отсутствии тесной связи между объемом работ и накладными расходами. 2. Оценка параметров модели методом 1МНК Таблица 3 – Оценка параметров модели
Таким образом, оцененная эконометрическая модель: у=56,32897439–1,838886546х 3. Общая характеристика достоверности модели Для общей оценки адекватности принятой эконометрической модели данным, которые наблюдаем, воспользуемся коэффициентом множественной детерминации R2 . Таблица 4 – Общая характеристика достоверности моделей
Вывод: Поскольку коэффициент множественной детерминации R2 = 0,71585226, то это свидетельствует, что вариация объема накладных расходов на 72% определяется вариацией объема работ и на 28% вариацией других факторов, которые не вошли в модель. Коэффициент корреляции R=-0,84608053 характеризует слабую связь между этими показателями. Модель не адекватна. Задача 2. Построение и анализ многофакторной эконометрической модели Условие задачи По статистическим данным для 9 предприятий общественного питания за год построить линейную двухфакторную модель, которая характеризует зависимость между уровнем рентабельности (%), относительным уровнем затрат оборота (%) и трудоемкостью предприятий. Прогнозные значения факторов выбрать самостоятельно. Сделать экономический анализ характеристик взаимосвязи. Исходные данные
Построение и анализ классической многофакторной линейной эконометрической модели 1. Спецификация модели 1.1 Идентификация переменных Многофакторная линейная эконометрическая модель устанавливает линейную зависимость между одним показателем и несколькими факторами. Y – рентабельность – результирующий показатель; Х1 – затраты оборота – показатель-фактор; Х2 – трудоемкость – показатель-фактор. Таблица 1 – Исходные данные и элементарные превращения этих данных для оценки модели
1.2 Оценка тесноты связи между показателем Y и факторами Х1 и Х2, а также межу факторами. (Диаграмма рассеяния) Связь обратная Связь обратная Связь тесная прямая
1.2.1 Парные коэффициенты корреляции, корреляционная матрица Для оценки тесноты связи между показателем Y и факторами Х1 и Х2, а также между факторами вычисляем парные коэффициенты корреляции, а потом составляем корреляционную матрицу, учитывая ее особенности: – корреляционная матрица является симметричной; – на главной диагонали размещены единицы. Парные коэффициенты корреляции вычисляем по формулам: – среднее квадратическое отклонение показателя Y; – среднее квадратическое отклонение фактора X1; – среднее квадратическое отклонение фактора X2; – дисперсия показателя Y; – дисперсия показателя X1; – дисперсия показателя X2; – коэффициент ковариации признаков Y и Х1; – коэффициент ковариации признаков Y и Х2; – коэффициент ковариации признаков X1 и Х2; Таблица 2 – Расчет парных коэффициентов корреляции
Коэффициенты парной корреляции
1.2.2 Коэффициенты частичной корреляции В многомерной модели коэффициенты парной корреляции измеряют нечистую связь между факторами и показателем. Поэтому при построении двухфакторной модели целесообразно оценить связь между показателем и одним фактором при условии, что влияние другого фактора не считается. Для измерения такой чистой связи вычисляют коэффициенты частичной корреляции. Формула частичного коэффициента корреляции между признаками Хi и Xjимеет вид: где – алгебраические дополнения соответствующих элементов корреляционной матрицы. Во время построения двухфакторной модели коэффициенты частичной корреляции рассчитываются по формулам: Для проверки полученных коэффициентов рассчитаем их матричным методом по формуле: где – элементы матрицы обратной корреляционной матрицы R. Таблица 3 – Расчеты коэффициентов частичной корреляции
Значения коэффициентов, полученные двумя методами, совпали. 1.2.3 Выводы о том, являются ли факторы ведущими и возможной мультиколлнеарности С помощью полученных корреляционной матрицы и коэффициентов частичной корреляции можно сделать выводы о значимости факторов и проверить факторы на мультиколлинеарность – линейную зависимость или сильную корреляцию. 1) Поскольку коэффициент парной корреляции между затратами оборота и рентабельностью rух1 = -0,655601546 и соответствующий коэффициент частичной корреляции ryx1 (х2) = – 0,402981473, это значит, что затраты оборота имеют обратное среднее влияние на рентабельность. 2) Поскольку коэффициент парной корреляции между трудоемкостью и рентабельностью rух2=0,857139597, а соответствующий коэффициент частичной корреляции rух2 (х1)= 0,781189003, то это свидетельствует о том, что трудоемкость существенно влияет на рентабельность. 3) Поскольку коэффициент парной корреляции между рентабельностью и затратами оборота = -0,565075617, а соответствующий коэффициент частичной корреляции rх1х2 (у) = -0,005029869 то можно сказать, что существует средняя обратная корреляционная зависимость. 3. Общий вид линейной двухфакторной модели и её оценка в матричной форме В общем виде многофакторная линейная эконометрическая модель записывается так: В матричной форме модель и ее оценка будут записаны в виде: и , где У – вектор столбец наблюдаемых значений показателя; У – вектор столбец оцененных значений фактора; Х – матрица наблюдаемых значения факторов; А – вектор столбец невидимых параметров; А – вектор столбец оценок параметров модели; е – вектор столбец остатков (отклонений).
2. Оценка параметров модели 1МНК в матричной форме Предположим, что все предпосылки классической регрессионной модели выполняются и осуществим оценку параметров модели по формуле: Алгоритм вычисления параметров модели 1. Вычисляем матрицу моментов Xt*X, но сначала найдем транспонированную матрицу Хt.
Xt*X
2. Вычисляем матрицу ошибок
3. Находим матрицу-произведение Xt*Y
4. Вычисляем вектор оценок параметров модели как произведение матрицы на матрицу Xt*Y
Таким образом, оценка эконометрической модели имеет вид y=1,2597249–0,0106048+0,012072x2 3. Коэффициенты множественной детерминации и корреляции для оцененной модели 3.1 Расчет коэффициентов множественной детерминации и корреляции Для оценки степени соответствия полученной модели наблюдаемым данным, то есть предварительной оценки адекватности модели, вычисляем коэффициенты множественной детерминации и множественной корреляции. Коэффициент множественной корреляции является степень соответствия оцененной модели фактическим данным и рассчитывается как коэффициент корреляции между y и . Квадрат коэффициента множественной корреляции называется коэффициентом множественной детерминации. Коэффициент множественной детерминации характеризует часть дисперсии показателя у , что объясняется регрессией, т.е. вариацией факторов, которые входят в модель: Коэффициент множественной корреляции удобно рассчитывать как корень из коэффициента множественной детерминации, т.е. Алгоритм вычисления коэффициентов множественной детерминации и корреляции: 1. Скопируем с итогового листа инструмента анализа Регрессия – Регрессия значения столбцов Предсказанное У и Остатки в таблицу 4. 2. Вычислим среднее значение у расчетного 3. В третий столбец введем формулу общих отклонений у-уср. и просчитаем ее для всех наблюдений. 4. Вычислим суммы квадратов общих отклонений и отклонений, которые не объясняются регрессией (остатков). 5. Вычислим коэффициент множественной детерминации . 6. Рассчитаем коэффициент множественной корреляции R. 7. Для проверки полученных коэффициентов скопируем с итогового листа Регрессия значения ячеек R-квадрат и Множественный R. Значения совпали. Таблица 4 – Расчет коэффициентов и
3.2 Разложение коэффициента множественной детерминации на коэффициенты отдельной детерминации Для определения доли влияния каждого фактора на показатель используют коэффициенты отдельной детерминации. Коэффициентом отдельной детерминации для фактора называется произведение коэффициента корреляции между фактором и показателем У на стандартизованный параметр регрессии : , Сумма коэффициентов отдельной детерминации равняется коэффициенту множественной детерминации: Во время анализа двухфакторной модели коэффициенты отдельной детерминации рассчитываются по формулам: Теперь рассчитаем коэффициенты отдельной детерминации по этим формулам. Полученное значение совпало с тем, которое рассчитали ранее. Таблица 5 – Расчет коэффициентов отдельной детерминации
3.3 Предварительные выводы об адекватности модели
С помощью полученных коэффициентов множественной детерминации, корреляции и отдельной детерминации можно сделать предварительные выводы об адекватности модели. 1) Поскольку коэффициент множественной детерминации R2 = 0,7778, то это свидетельствует про то, что вариация общих затрат на предприятиях на 77,78% определяется вариацией затрат оборота и трудоемкостью и на 22,22% вариацией показателей, которые не учитываются в модели. 2) Поскольку коэффициенты отдельной детерминации d1=0,1649, то это свидетельствует о том, что вариация общих затрат на предприятиях на 16,49% определяется вариацией затрат оборота 3) Коэффициент множественной корреляции R2 = 0,7778 характеризует сильную связь между общими затратами и факторами, которые их обуславливают. 4. Оценка дисперсионно – ковариационной матрицы оценок параметров модели 4.1 Оценка дисперсии отклонений Вычислим оценку дисперсии отклонений по формуле , где – сумма квадратов отклонений; n – количество наблюдений; m – количество факторов модели. Полученное значение проверим копированием с итогового листа Регрессии значение ячейки Остаток с таблицы дисперсийного анализа. Значения совпали. Таблица 6 – Оценка дисперсии остатков
4.2 Расчет дисперсии и ковариации оценок параметров модели Для получения оценок ковариаций и дисперсий оценок параметров модели необходимо сложить ковариационную матрицу по формуле: Таблица 7 – Оценка ковариационной матрицы оценок параметров модели
Мы получили дисперсии оценок параметров модели, которые расположены по главной диагонали:
4.3 Вычисление стандартных ошибок параметров и выводы о смещенности оценок параметров модели Стандартные ошибки параметров модели рассчитаем по формуле , , . Для получения стандартной ошибки оценки параметров а0 введем формулу возведения в степень 0,5. И аналогично получим стандартные ошибки оценок параметров а1 и а2. Для проверки полученных ошибок скопируем с итогового листа Регрессия значения ячеек столбца Стандартная ошибка . Значения совпали. Сравним каждую стандартную ошибку с соответствующим значением оценки параметра с помощью формулы: Таблица 8 – Расчет стандартных ошибок оценок параметров модели. Выводы о смещении оценок параметров модели
5. Проверка гипотез о статистической значимости оценок параметров модели на основе F- и t-критериев 5.1 Проверка адекватности модели по критерию Фишера Проверку адекватности модели по критерию Фишера проведем по представленному алгоритму. Шаг 1 . Формулирование нулевой и альтернативной гипотез. , т.е. не один фактор модели не влияет на показатель. Хотя бы одно значение отменно от нуля, т.е. Шаг 2. Выбор соответствующего уровня значимости. Уровнем значимости называется вероятность сделать ошибку 1-го рода, т.е. отвергнуть правильную гипотезу. Величина называется уровнем доверия или доверительной вероятностью. Выбираем уровень значимости , т.е. доверительная вероятность – Р=0,95 Шаг 3. Вычисление расчетного значения F-критерия. Расчетное значение F-критерия определяется по формуле: Для проверки полученного значения скопируем с итогового листа Регрессия расчетное значение F-критерия. Значения совпали Шаг 4. Определение по статистическим таблицам F-распределения Фишера критического значения F-критерия. Критическое значение F-критерия находим по статистическим таблицам F-распределения Фишера по соответствующим данным: - доверительной вероятности Р=0,95; - степеней свободы Определяем табличное значение критерия =5,14 Шаг 5. Сравнение рассчетного значения F-критерия с критическим и интерпритация результатов. Вывод о принятии нулевой гипотезы, т.е. об адекватности модели делаем с помощью встроенной логической функции ЕСЛИ. Поскольку , то отвергаем нулевую гипотезу про незначимость факторов с риском ошибиться не больше чем на 5% случаев, т.е. с надежностью Р=0,95 можно считать, что принятая модель адекватна статистическим данным и на основе этой модели можно осуществлять экономический анализ и прогнозирование. 5.2 Проверка значимости оценок параметров модели по критерию Стьюдента Проверку гипотезы о значении каждого параметра модели проведем в соответствии с представленным алгоритмом. Шаг 1 . Формулирование нулевой и альтернативной гипотез. – оценка j-го параметра является статистически незначимой, т.е. j-й фактор никак не влияет на показатель у ; – оценка j-го параметра является статистически значимой, т.е. j-й фактор влияет на показатель у . Шаг 2. Выбор соответствующего уровня значимости. Выбираем уровень значимости , т.е. доверительная вероятность – Р=0,95. Шаг 3. Вычисление расчетного значения t-критерия. Расчетное значение t-критерия определяется по формуле: Во время анализа двухфакторной модели расчетные значения t-критерия определяются по формулам: =-3,2333 =3,4264 =4,9937 Для проверки полученного значения t-критерия скопируем с итогового листа Регрессия значения ячеек столбца t -статистика . Значения совпали. Шаг 4. Определение по статистическим таблицам t-распределения Стьюдента критического значения t-критерия. Критическое значение t-критерия находим по статистическим таблицам t-распределения Стьюдента по соответствующим данным: - доверительной вероятности Р=0,95; - степеней свободы Определяем табличное значение критерия =2,45 Шаг 5. Сравнение рассчетного значения t-критерия с критическим и интерпритация результатов. Выводы о принятии нулевой гипотезы, т.е. о значимости оценок параметров , и делаем с помощью встроенной логической функции ЕСЛИ. С надежностью Р=0,95 можно считать, что – оценки 1-го и 2-го параметров модели значимые, т.е. оба фактора существенно влияют на показатель; – оценка 0-го параметра модели не является статистически значимой. Таблица 9 – Проверка гипотез о статистической значимости оценок параметров модели на основе F- и t – критериев
6. Построение интервалов доверия для параметров модели. Интервалом доверия называется интервал, который содержит неизвестный параметр с заданным уровнем доверия. Интервалы доверия для параметров находим аналогично процедуре тестирования нулевой гипотезы по t-критерию Стьюдента: – выбираем уровнем значимости =0,05 и соответственно уровень доверия будет составлять – Р=0,95; – для каждого параметра вычисляем нижнюю и верхнюю границы интервала доверия по формуле, при этом делаем абсолютную ссылку на табличное значение t-критерия : где - стандартная ошибка параметров модели Для проверки полученных значений границ скопируем с итогового листа Регрессия значения ячеек столбцов Нижнее 95% и Верхнее 95% . Значения совпали. Таблица 10 – Доверительные интервалы для оценок параметров
Исходя из этого, 95% интервалы доверия для параметров модели имеют вид: -0,5119912≤а0≤3,031441 -0,3466383≤а1≤0,013454 0,00243469≤а2≤0,021709 7. Расчет прогнозного значения рентабельности на основании оцененной модели Так как оцененная модель является адекватной статистическим данным, то на основании этой модели можно осуществлять прогнозирование рентабельности для одного из предприятий объединения, деятельность которого исследовалась. 7.1 Точечный прогноз рентабельности Сделаем точечный прогноз рентабельности для одного из предприятий при условии того, что затраты оборота составят 7 г.о. и трудоемкость – 50 г.о., т.е. , по формуле:
7.2 Доверительный интервал для прогноза математического ожидания рентабельности Рассчитаем значения верхней и нижней границ прогнозного интервала, используя табл. значения критерия Стьюдента 2,45, по формуле: Оценку дисперсий матожидания вычислим по формуле: Интервальный прогноз матожидания рентабельности: Стандартная ошибка матожидания
оценка дисперсионного прогноза
Таким образом, 95% интервал доверия для прогноза матожидания рентабельности имеет вид 1,72,895. 7.3 Доверительный интервал для прогноза рентабельности Для нахождения интервального прогноза индивидуального значения рентабельности вычислим стандартную ошибку прогноза индивидуального значения по формуле: А значение нижней и верхней границ по формуле:
Таким образом можно утверждать, что прогнозное значение затрат принадлежит интервалу 1,565747976≤Ур≤3,028739328. 8. Экономический анализ по уцененной модели. Т. к. оцененная модель является адекватной статистическим данным, то на основе этой модели можно осуществлять экономический анализ процесса, который исследуется, для этого рассчитаем граничные и средние показатели. Средней эффективностью (продуктивность) фактора называется объем результирующего показателя, который приводится на ед. затрат фактора в среднем. Средняя эффективность i-го фактора определяется по формуле: Предельной эффективностью(продуктивностью) называется изменение объема результирующего показателя за счет изменения этого фактора на единицу при неизменных других факторах, которые влияют на объем результирующего показателя. Предельной эффективность i-го показателя определяется по формуле: ; Частичный коэффициент эластичности показывает на сколько процентов изменится результирующий показатель, если i-ый фактор изменится на один процент при неизменных значениях других факторов. Частичный коэффициент эластичности i-го показателя определяется по формуле: ; Суммарным коэффициентом эластичности называется сумма частичных коэффициентов эластичности. Граничная норма замещения j-го фактора i-тым показывает количество единиц i-го фактора необходимую для замены j-го фактора при постоянном объеме результирующего показателя и других факторов и рассчитывается по формуле: ; Таблица 11-Расчет средних и граничных показателей
Анализ полученных результатов приводит к таким выводам: 1) На основе значения средней эффективности затрат оборота можно утверждать, что на 1 д.е.затрат оборота приходится 0,067 общих затрат. 2) На основе значения средней эффективности трудоемкости можно утверждать, что на 1 д.е.трудоемкости приходится 0,0195 общих затрат. 3) На основе значения граничной эффективности затрат оборота можно утверждать, что при увеличении затрат оборота на 1 г.о. объем общих затрат увеличится на 0,0195 д.е. при неизменном объеме трудоемкости. 4) На основе значения граничной эффективности трудоемкости можно утверждать, что при увеличении затрат оборота на 1 г.о. объем общих затрат увеличится на 0,012 д.е. при неизменном объеме затрат оборота. 5) На основе значения коэффициента частичной эластичности по фактору Х1 можно утверждать, что при увеличении затрат оборота на 1% общих затрат увеличится на 3,44% при неизменном объеме трудоемкости. 6) На основе значения коэффициента частичной эластичности по фактору Х2 можно утверждать, что при увеличении трудоемкости на 1% объем общих затрат увеличится на 1,62% при неизменном объеме затрат оборота. 7) На основе граничной нормы замены 2-го фактора первым можно утверждать, что для замены 1 д.е. трудоемкости нужно будет 0,29 д.е.затрат оборота при сохранении неизменного объема общих затрат. 8) На основе граничной нормы замены 1-го фактора вторым можно утверждать, что для замены 1 д.е.затрат оборота нужно будет 3,5 д.е.трудоемкости при сохранении неизменного объема общих затрат. Исследование наличия мультиколлениарности по алгоритму Феррара-Глобера Условие задачи Допустим, что на уровень рентабельности предприятий общественного питания существенно влияют такие показатели общественной деятельности: Относительный уровень затрат оборота (%), часть продукции собственного производства (%) и численность работников в расчете на 1 тыс. товарооборота (чел.) Чтобы построить эконометрическую модель этой зависимости по методу 1МНК необходимо быть уверенным, что между факторами относительного уровня затрат оборота, частью собственной продукции и трудоемкостью не существует мультиколлинеарности. Мультиколлинеарность обозначает существование тесной линейной зависимости или сильной корреляции между двумя или более факторами. Исследовать наличие мультиколлинеарности между этими факторами по данным десяти предприятий общественного питания города, которые приведены в таблице. Вариант 3.
Исследование наличия мультиколлинеарности по алгоритму Феррара-Глобера 1. Идентификация переменных. У – уровень рентабельности предприятий – результирующий показатель. Х1 – относительный уровень затрат оборота – показатель-фактор. Х2 – часть продукции собственного производства – показатель-фактор. Х3 – трудоемкость – показатель-фактор. Таблица 1- Исходные данные, построение матрицы стандартизированных переменных
2. Исследование наличия мультиколлинеарности по алгоритму Феррара-Глобера. Шаг 1. Стандартизация переменных. Элементы стандартизованных векторов рассчитываются по формулам: , i=1; n, j=1; m. где n – число наблюдений; m – число факторов; σj 2 – дисперсия j-го фактора. Поскольку дисперсия рассчитывается по формуле: , то формуле для стандартизации переменных примут вид: , i=1; n, j=1; m. Шаг 2. Нахождение корреляционной матрицы R (матрицы моментов стандартизованной системы нормальных уравнений). Корелляционная матрица R определяется по формуле: R=Х*Т ·Х*, где Х* – матрица стандартизованных переменных. Для нахождения элементов корелляционной матрицы R последовательно используем встроенные функции Транспонирование матриц – ТРАНСП и Произведение матриц – МУМНОЖ. Проверку вычислений следует выполнять, и используя последовательно встроенную функцию КОРРЕЛ, учитывая при этом свойства корреляционной матрицы: корреляционная матрица является симметричной, на главной диагонали расположены единицы. Таблица 2 – Нахождение корреляционной матрицы
Коэффициент корреляции между факторами Х1 и Х2=0,223 Коэффициент корреляции между факторами Х1 и Х3=-0,8093 Коэффициент корреляции между факторами Х2 и Х3=-0,21466. Вывод: на основании значения коэффициента корреляции rX 2 X 3 =-0,21466. можно сделать предварительный вывод о наличии возможной мультиколлинеарности между факторами Х2 и Х3. Шаг 3. Критерий – Х2 . Расчетное значение критерия Х2 определяется по формуле: , где -определитель корреляционной матрицы R-детерминант корреляции. По заданной доверительной вероятности Р и числу степеней свободы находится табличное значение критерия Х2 табл , которое сравнивается с расчетным. – если Х2 расч < Х2 табл , то нет оснований отклонить гипотезу об отсутствии мультиколлинеарности в массиве факторов, то есть с принятой надежностью можно утверждать, что в массиве факторов мультиколлинеарность отсутствует; – если Х2 расч > Х2 табл , то гипотеза об отсутствии мультиколлинеарности в массиве факторов отклоняется, то есть с принятой надежностью можно утверждать, что в массиве факторов мультиколлинеарность существует. Примечание: Если гипотеза об отсутствии мультиколлинеарности в массиве факторов принимается, то исследования мультиколлинеарности останавливаются. Выберем уровень значимости ά=0,05, следовательно доверительная вероятность Р=0,95. Число степеней свободы k=3. Табличное значение критерия Х2 табл =Х2 (0,95; 3)=7,8. Исследование наличия мультиколлинеарности в массиве факторов по критерию Х2 в оболочке электронных таблиц Excel . 1. Находим определитель матрицы, используя встроенную функцию МОПРЕД. 2. Находим натуральный логарифм определителя, используя встроенную математическую функцию LN. 3. Находим расчетное значение критерия. 4. Вводим расчетное значение. 5. Делаем вывод о наличии мультиколлинеарности в массиве факторов, используя встроенную логическую функцию ЕСЛИ. Таблица 3=Критерий Х2 .
Выводы: – на основании значения детерминанта корреляции =0,33 (→0) можно сделать предварительный вывод о наличии мультиколлинеарности в массиве факторов; – на основании критерия – Х2 с надежностью Р=0.95 можно утверждать, что в массиве факторов есть мультиколлинеарность. Шаг 4. F -критерий Фишера. Расчетные значения F-критерия для каждого фактора определяются по формуле: , j=1,2…m где- диагональные элементы матрицы С=R-1 ; По заданной доверительной вероятности Р и числом степеней свободы: – k1 =m-1 – степень свободы знаменателя; – k2 =n-m – степень свободы числителя(k1 < k2 ). Находится табличное значение F-критерия, которое сравнивается з расчетным: – если Fj расч < Fj табл , то нет оснований отклонить гипотезу об отсутствии мультиколлинеарности между J-тым фактором и остальным массивом, то есть с принятой надежностью можно утверждать, что между J-тым фактором и другими мультиколлинеарность отсутствует; – если Fj расч > Fj табл , то гипотеза об отсутствии мультиколлинеарности между J-тым фактором и остальным массивом отклоняется, то есть с принятой надежностью можно утверждать, что между J-тым фактором и другими мультиколлинеарность существует. Выбираем уровень значимости ά=0,05, следовательно, доверительная вероятность Р=0,95. Число степеней свободы k1=2, k2=7. Табличное значение критерия F0,95 (2; 7)=4,74. Исследования наличия мультиколлинеарности каждого фактора со всеми другими факторами массива по F -критерию Фишера в оболочке электронных таблиц Excel . 1. Находим расчетные значения критерия F1 , F2 , F3 соответственно. 2. Вводим табличное значение критерия. 3. Делаем вывод об отсутствии мультиколлинеарности фактора Х1 и факторами Х2 и Х3, используя встроенную логическую функцию ЕСЛИ. Поскольку функция будет копироваться в остальные ячейки столбца, то при введении адрес ячеек, которые сравниваются, нужно использовать абсолютную и относительную ссылку. 4. Копируем полученную формулу в две нижние ячейки и делаем выводы о наличии мультиколлинеарности фактора Х2 с факторами Х1 и Х3 и Х3 с факторами Х1 и Х2. Таблица 4-F-критерий Фишера
Выводы: – между фактором Х1 и факторами Х2 и Х3 существует мультиколлинеарность; – между фактором Х2 и факторами Х1 и Х3 не существует мультиколлинеарности; – между фактором Х3 и факторами Х2 и Х1 существует мультиколлинеарность; Шаг 6. Расчет коэффициентов частичной корреляции. Коэффициенты частичной корреляции рассчитываются по формулам: , k=1; m, j=1; m где Cjj , Ckk – диагональные элементы матрицы С=R-1 Ckj – элемент матрицы С=R-1 , который находится в k-той строке и в j-том столбце. Поскольку для массива факторов, которые исследуются m=3, то необходимо рассчитывать 3 коэффициента частичной корреляции r12(3) , r13(2) , r23(1) . Шаг 7. t – критерий Стьюдента. Расчетные значения t – критерия для каждой пары факторов определяются по формулам: , k=1; m, j=1; m, где rkj – соответствующие коэффициенты частичной корреляции. По заданной доверительной вероятности З и числом степеней свободы k=n-m находится табличное значение, которое сравнивается с расчетным: – если tjj расч <tjj табл , то нет оснований отклонить гипотезу об отсутствии мультиколлиниарности между k-тым и j-тым факторами, то есть с принятой надежностью можно утверждать, что между k-тым и j-тым факторами мультиколлинеарность отсутствует. – если tjj расч >tjj табл , то гипотеза об отсутствии мультиколлинеарности между k-тым и j-тым факторами отклоняется, то есть с принятой надежностью можно утверждать, что между k-тым и j-тым факторами мультиколлинеарность существует. Выберем уровень значимости ά=0,05, таким образом, доверительная вероятность Р= 0,95. Число степеней свободы k=7. Табличное значение критерия t0,95 (7)=1,89. Исследование наличия мультиколлинеарности для каждой пары факторов по критерию Стьюдента в оболочке электронных таблиц Excel . 1. Расчетные значения находим по формуле. 2. Вводим табличное значение критерия. 3. Модуль расчетного значения критерия r12(3 находим, используя встроенную математическую функцию ABS, при этом делаем относительную ссылку на столбец. 4. Делаем вывод о наличии мультиколлиниарности между факторами Х1 и Х2, используя встроенную логическую функцию ЕСЛИ. При этом делаем относительную и абсолютную ссылку. 5. Полученную формулу копируем и делаем выводы о наличии мультиколлиниарности между факторами Х1 и Х3, Х2 и Х3. Таблица 5 – t – критерий Стьюдента
Выводы: с надежностью Р=0,95 можно утверждать, что: – между факторами Х1 и Х2 мультиколлинеарность отсутствует; – между факторами Х1 и Х3 мультиколлинеарность существует; – между факторами Х2 и Х3 мультиколлинеарность отсутствует; Общий вывод: Таким образом между факторами 1 и 3 модели, т.е. между относительным уровнем затрат оборота и трудоемкостью существует мультиколлинеарность. Построить модель методом 1МНК нельзя, так как между факторами существует мультиколлинеарность. |