Всероссийский заочный  Финансово-Экономический институт

Кафедра математики и информатики

Отчет по аудиторной работе

 Вариант 26

По дисциплине «эконометрика»

 

г. Барнаул 2006

Задание 26

В табл. представлены данные о рынке строящегося жилья в Санкт-Петербурге.

№п/п

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

У

1

3

1

74,7

46,3

10,7

0

1

12

28,7

2

3

1

71,7

45,9

10,7

0

0

0

27,2

3

3

1

74,5

47,5

10,4

0

0

0

28,3

4

4

1

137,7

87,2

14,6

0

1

0

52,3

5

1

1

40

17,7

11

1

1

8

22

6

2

1

53

31,1

10

1

1

8

28

7

3

1

86

48,7

14

1

1

8

45

8

4

1

98

65,8

13

1

1

8

51

9

2

1

62,6

21,4

11

1

1

0

34,4

10

1

1

45,3

20,6

10,4

1

1

8

24,7

11

2

1

56,4

29,7

9,4

1

1

8

30,8

12

1

1

37

17,8

8,3

0

1

0

15,9

13

3

1

67,5

43,5

8,3

0

1

0

29

14

1

1

37

17,8

8,3

0

1

3

15,4

15

3

1

69

42,4

8,3

0

1

3

28,6

16

1

1

40

20

8,3

0

0

0

15,6

17

3

1

69,1

41,3

8,3

0

1

0

27,7

18

2

1

68,1

35,4

13

1

1

20

34,1

19

2

1

75,3

41,4

12,1

1

1

20

37,7

20

3

1

83,7

48,5

12,1

1

1

20

41,9

Принятые в таблице обозначения:

У – цена квартиры, тыс. долл.;

Х1 – число комнат в квартире;

Х2 – район города ( 1 – Приморский, Шувалово – Озерки, 2 – Гражданка, 3 – Юго-запад, 4 – Красносельский);

Х3 – общая площадь квартиры (м2);

Х4 – жилая площадь квартиры (м2)

Х5 – площадь кухни (м2);

Х6 – тип дома ( 1 – кирпичный, 0 – другой);

Х7 – наличие балкона ( 1 – есть, 0 – нет);

Х8 – число месяцев до окончания срока строительства.

Задание

1. введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы : квартиры на севере города ( приморский район, Шувалово – Озерки, Гражданка) и на юге города ( Юго-запад, Красносельский район).

2. Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.

3. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме. Установите, какие факторы мультиколлинеарны.

4. Постройте модель  у= f (х3,х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?

5. Существует ли разница в ценах квартир, расположенных в северной и южной частях Санкт-Петербурга?

6. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.

Решение:

1.      Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели

Таблица

№п/п

Х1

Х3

Х4

Х5

Х6

Х7

Х8

У

Z

1

3

74,7

46,3

10,7

0

1

12

28,7

1

2

3

71,7

45,9

10,7

0

0

0

27,2

1

3

3

74,5

47,5

10,4

0

0

0

28,3

1

4

4

137,7

87,2

14,6

0

1

0

52,3

1

5

1

40

17,7

11

1

1

8

22

1

6

2

53

31,1

10

1

1

8

28

1

7

3

86

48,7

14

1

1

8

45

1

8

4

98

65,8

13

1

1

8

51

1

9

2

62,6

21,4

11

1

1

0

34,4

1

10

1

45,3

20,6

10,4

1

1

8

24,7

1

11

2

56,4

29,7

9,4

1

1

8

30,8

1

12

1

37

17,8

8,3

0

1

0

15,9

1

13

3

67,5

43,5

8,3

0

1

0

29

1

14

1

37

17,8

8,3

0

1

3

15,4

1

15

3

69

42,4

8,3

0

1

3

28,6

1

16

1

40

20

8,3

0

0

0

15,6

1

17

3

69,1

41,3

8,3

0

1

0

27,7

1

18

2

68,1

35,4

13

1

1

20

34,1

1

19

2

75,3

41,4

12,1

1

1

20

37,7

1

20

3

83,7

48,5

12,1

1

1

20

41,9

1

Статистические данные по всем  переменным приведены в таблице. Количество наблюдений n=20, а число факторных переменных m=7.

Для проведения корреляционного анализа выполняем:

  1. Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
  2. Выберите команду Сервис →Анализ данных.
  3. В диалоговом окне Анализ данных выберите инструмент Корреляция, затем щелкните на кнопке ОК.
  4. В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные. 
  5. Выберите параметры ввода.
  6. ОК

Результат корреляционного анализа:

Таблица 1.1

 

У

Х1

Х3

Х4

Х5

Х6

Х7

Х8

Z 2

У

1

 

 

 

 

 

 

 

 

Х1

0,7714

1

 

 

 

 

 

 

 

Х3

0,8979

0,8841

1

 

 

 

 

 

 

Х4

0,8248

0,9224

0,9706

1

 

 

 

 

 

Х5

0,8370

0,4596

0,7233

0,6191

1

 

 

 

 

Х6

0,3929

-0,1558

-0,0210

-0,1431

0,5028

1

 

 

 

Х7

0,2944

0,0073

0,0948

0,0170

0,1728

0,4201

1

 

 

Х8

0,3287

-0,0308

0,0940

0,0420

0,4701

0,6522

0,3836

1

 

Z 2

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

1

Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная цена квартиры, имеет тесную связь с числом комнат в квартире (rух1= 0,7714), с общей площадью квартиры ( rух3=0,8979), с жилой площадью квартиры (rух4=0,8248) и с площадью кухни (rух5=0,8370).

Проверим выполнение условий для каждой  пары факторных переменных:

Коэффициент корреляции между двумя факторными переменными должен быть меньше 0,8 и одновременно меньше коэффициентов корреляции между исследуемой переменной и каждой из этих факторов.

Если хотя бы одно из условий неравенств не выполняется, то в модель включают только один из этих двух факторов, а именно тот, у которого модуль коэффициента корреляции с у больше. 

│rxіxј│<0,8

│rxіxј│<│ryxі│

│rxіxј│<│ryxј│

Х1Х3

0,8841 <0,8  (не выполняется)

0,8841 <0,7714   (не выполняется)

0,8841 <0,8979  (выполняется)

Х1Х4

0,9224 <0,8   (не выполняется)

0,9224 <0,7714 (не выполняется)

0,9224 <0,8248  (не выполняется)

Х3Х4

0,9706 <0,8  (не выполняется)

0,9706 <0,8979  (не выполняется)

0,9706 <0,8248   (не выполняется)

Факторы Х1 и Х3 мультиколлинеарны, их не рекомендуется использовать в модели одновременно, т.к. коэффициент парной корреляции больше 0,8, rx1x3 =0,8841.

Факторы Х1 и Х4 мультиколлинеарны, их не рекомендуется использовать в модели одновременно, т.к. коэффициент парной корреляции больше 0,8, rх1х4=0,9224.

Факторы Х3 и Х4 мультиколлинеарны, их не рекомендуется использовать в модели одновременно, т.к. rх3х4=0,9706>0,8.

Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, цена квартиры,  имеет тесную связь с числом комнат в квартире (rух1=0,7714), с общей площадью квартиры (ryx3=0,8979), с жилой площадью квартиры (ryx4=0,8248) и с площадью кухни (ryx5=0,8370).Факторы Х3 и Х4 тесно связаны между собой (rx3x4=0,9706), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х3,т.к.эта переменная теснее связана с зависимой переменной У.

       Для проведения регрессионного анализа выполняем:

1.Выберите команду Сервис →Анализ данных.

2.В диалоговом окне Анализ данных выберите инструмент Регрессия, затем щелкните на кнопке ОК.

3. В диалоговом окне Регрессия в поле Входной интервал У введите адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х введите адреса одного или нескольких диапазонов, которые содержат значения независимых переменных.

4. если выделены и заголовки столбцов, то установить флажок Метки в первой строке.

5. выберите параметры вывода.

6. в поле Остатки поставьте необходимые флажки.

7. ОК

Таблица 1.2

 Таблица 1.3

Регрессионная статистика

Множественный R

0,992352488

R-квадрат

0,98476346

Нормированный R-квадрат

0,975875479

Стандартная ошибка

1,64080082

Наблюдения

20

Таблица 1.4

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

7

2088,0388

298,2913

110,7972

6,036E-10

Остаток

12

32,306728

2,692227

Итого

19

2120,3455

Таблица 1.5

 

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

-1,939

3,575

-0,542

Х1

2,050

1,174

1,746

Х3

0,345

0,096

3,578

Х4

-0,034

0,126

-0,266

Х5

0,073

0,533

0,137

Х6

8,863

1,466

6,043

Х7

1,546

1,270

1,218

Х8

-0,066

0,077

-0,852

Y=-1,939+2,050*Х1+0,345*Х3-0,034*Х4+0,073*Х5+8,863*Х6+1,546*Х7-0,066*Х8

Таблица 1.6

Наблюдение

Предсказанное У

Остатки

У

1

29,959

-1,259

28,7

-0,0439

0,0439

2

28,183

-0,983

27,2

-0,0362

0,0362

3

29,074

-0,774

28,3

-0,0273

0,0273

4

53,444

-1,144

52,3

-0,0219

0,0219

5

23,998

-1,998

22

-0,0908

0,0908

6

30,009

-2,009

28

-0,0718

0,0718

7

43,144

1,856

45

0,0413

0,0413

8

48,686

2,314

51

0,0454

0,0454

9

34,247

0,153

34,4

0,0045

0,0045

10

25,685

-0,985

24,7

-0,0399

0,0399

11

31,185

-0,385

30,8

-0,0125

0,0125

12

14,428

1,472

15,9

0,0926

0,0926

13

28,186

0,814

29

0,0281

0,0281

14

14,230

1,170

15,4

0,0760

0,0760

15

28,542

0,058

28,6

0,0020

0,0020

16

13,843

1,757

15,6

0,1126

0,1126

17

28,811

-1,111

27,7

-0,0401

0,0401

18

34,501

-0,401

34,1

-0,0118

0,0118

19

36,718

0,982

37,7

0,0261

0,0261

20

41,427

0,473

41,9

0,0113

0,0113

сумма

0,8358

4,1791

Относительная ошибка апроксимации   Еотн =4,1791. 4,1791<15%, следовательно модель имеет высокую точность.

2. Оценка качества всего уравнения регрессии

В табл.1.5 приведены вычисления по модели значения зависимой переменной У и значения остаточной компоненты .

Значение коэффициентов детерминации и множественной корреляции можно найти в таблице1.2.

Оценим качество уравнения регрессии с помощью коэффициента детерминации R2=0,985, следовательно, около 98% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Коэффициент множественной корреляции R: R==0,992.

Он показывает тесноту связи зависимой переменной У с двумя включенными в модель объясняющими факторами.

3. Проверка значимости уравнения регрессии. с помощью F- критерия Фишера.

Табличное значение F- критерия  при доверительной вероятности 0,05 при v1= к=7 и v2=20-7-1=12 составляет 2,913. Табличное значение F- критерия можно найти с помощью функции FРАСПОБР

Поскольку Fрасч>Fтабл (110,797>2,913),   уравнение регрессии следует признать адекватным.

4. Оценить с помощью критерия t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии

Оценим статистическую значимость параметров регрессионной модели у=f(x1345678) с помощью t-критерия Стьюдента.

Табличное значение t –критерия Стьюдента найдем с помощью функции СТЬЮДРАСПОБР.

 

t-расчетное

t-табличное

ta0

-0,5424

2,1788

ta1

1,7459

2,1788

ta3

3,5781

2,1788

ta4

-0,2655

2,1788

ta5

0,1371

2,1788

ta6

6,0434

2,1788

ta7

1,2175

2,1788

ta8

-0,8522

2,1788

Табличное значение t- критерия при 5%- уровне значимости и степенях свободы (20-7-1=12) составляет 2,179. Так как  tрас>tтабл, то коэффициенты а3 и а6 существенны (значимы)

5. Построим модель y=f(x3,x6,x7,x8,z).

Цена квартиры, тыс. долл.

Общая площадь квартиры (м²)

Тип дома(1-кирпичный,

0-другой)

Наличие балкона (1-есть,

0-нет)

Число месяцев до окончания срока строительства

Район города

У

Х3

Х6

Х7

Х8

Z 2

28,7

74,7

0

1

12

1

27,2

71,7

0

0

0

1

28,3

74,5

0

0

0

1

52,3

137,7

0

1

0

1

22

40

1

1

8

1

28

53

1

1

8

1

45

86

1

1

8

1

51

98

1

1

8

1

34,4

62,6

1

1

0

1

24,7

45,3

1

1

8

1

30,8

56,4

1

1

8

1

15,9

37

0

1

0

1

29

67,5

0

1

0

1

15,4

37

0

1

3

1

28,6

69

0

1

3

1

15,6

40

0

0

0

1

27,7

69,1

0

1

0

1

34,1

68,1

1

1

20

1

37,7

75,3

1

1

20

1

41,9

83,7

1

1

20

1

У=-1,1657+0,4006*Х3+8,7667*Х6+1,4404*Х7-0,0796*Х8

Находим матрицу парных коэффициентов корреляции модели y=f(x3,x6,x7,x8,z) с помощью MS Excel аналогично первому примеру (Сервис→Анализ данных →Корреля- ция).

Результат корреляционного анализа:

Таблица 2.1

 

У

Х3

Х6

Х7

Х8

Z 2

У

1

Х3

0,897883

1

Х6

0,392853

-0,02102

1

Х7

0,294364

0,09484

0,420084

1

Х8

0,328739

0,094

0,652174

0,383555

1

Z 2

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

#ДЕЛ/0!

1

На формирование цены квартиры  воздействуют общая площадь квартиры Х3 rху3=0,8979.

Таблица 2.2

Регрессионная статистика

Множественный R

0,989389217

R-квадрат

0,978891022

Нормированный R-квадрат

0,973261962

Стандартная ошибка

1,727393527

Наблюдения

20

Таблица 2.3

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

4

2075,58717

518,8968

173,8995

2,263E-12

Остаток

15

44,7583259

2,983888

Итого

19

2120,3455

Таблица 2.4

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-1,1657

1,4436

-0,8075

0,4320

-4,2426

1,9112

-4,2426

1,9112

Х3

0,4006

0,0168

23,8246

0,0000

0,3648

0,4365

0,3648

0,4365

Х6

8,7667

1,0593

8,2761

0,0000

6,5089

11,0245

6,5089

11,0245

Х7

1,4404

1,2128

1,1877

0,2534

-1,1446

4,0254

-1,1446

4,0254

х8

-0,0796

0,0754

-1,0553

0,3080

-0,2403

0,0811

-0,2403

0,0811

У=-1,1657+0,4006*Х3+8,7667*Х6+1,4404*Х7-0,0796*Х8

Наблюдение

Предсказанное У

Остатки

У

Еi/Yi

|Еi/Yi|

1

29,247

-0,547

28,7

-0,019

0,019

2

27,559

-0,359

27,2

-0,013

0,013

3

28,681

-0,381

28,3

-0,013

0,013

4

55,441

-3,141

52,3

-0,060

0,060

5

24,430

-2,430

22

-0,110

0,110

6

29,638

-1,638

28

-0,059

0,059

7

42,859

2,141

45

0,048

0,048

8

47,666

3,334

51

0,065

0,065

9

34,121

0,279

34,4

0,008

0,008

10

26,553

-1,853

24,7

-0,075

0,075

11

31,000

-0,200

30,8

-0,007

0,007

12

15,098

0,802

15,9

0,050

0,050

13

27,317

1,683

29

0,058

0,058

14

14,859

0,541

15,4

0,035

0,035

15

27,679

0,921

28,6

0,032

0,032

16

14,859

0,741

15,6

0,047

0,047

17

27,958

-0,258

27,7

-0,009

0,009

18

34,733

-0,633

34,1

-0,019

0,019

19

37,617

0,083

37,7

0,002

0,002

20

40,983

0,917

41,9

0,022

0,022

сумма

0,753

Е отн

3,763

Относительная ошибка апроксимации Е отн=3,763<15%, следовательно модель имеет высокую точность.