Элементы математической статистики и корреляционного анализа

Балтийский военно-морской институт

им. Адмирала Ф. Ф. Ушакова (филиал) федерального государственного военного образовательного учреждения высшего профессионального образования «Военный учебно-научный центр Военно-морской флот «Военно-морская академия

имени адмирала флота Советского Союза Н. Г. Кузнецова»

Курсовая работа

«Элементы математической статистики и корреляционного анализа»

Выполнил:

Курсант 228 класса Хачатурян А.А.

Руководитель:

Доцент Коноваленко Т. А.

Калининград 2015

Содержание

ВВЕДЕНИЕ

ГЛАВА 1

Обработка данных наблюдений и проверка гипотез

Статистическое распределение выборки

Расчет сводных характеристик выборки

Расчет интервальных оценок генеральных параметров

Проверка гипотезы о нормальном распределении генеральной совокупности критерию Пирсона

Построение гистограммы выборки и теоретической нормальной прямой

Вывод

ГЛАВА 2

Элементы корреляционного анализа

Корреляционная таблица и корреляционное поле

Нахождение выборочного коэффициента корреляции

Нахождение доверительного интервала для генерального коэффициента корреляции

Нахождение доверительного выборочного уравнения прямой регрессии Y на X т построения ее графика

ЛИТЕРАТУРА
ЗАКЛЮЧЕНИЕ ПРЕПОДАВАТЕЛЯ

ВВЕДЕНИЕ

Наблюдаемые нами события (явления) можно подразделить на следующие три вида: достоверные, невозможные и случайные. Невозможно учесть влияние на результат всех причин, поскольку число их очень велико и законы их действий неизвестны. Поэтому теория вероятности не ставит перед собой задачу предсказать, произойдет единичное событие или нет, - она просто не в силах это сделать.

По – иному обстоит дело, если рассматриваются случайные события, которые могут многократно наблюдаться при осуществлении одних и тех же условий S, т. е. если речь идет о массовых однородных случайных событий. Оказывается, что достаточно большое число однородных случайных событий независимо от их конкретной природы подчиняется определенным закономерностям, а именно вероятностным закономерностям. Установлением этих закономерностей и занимается теория вероятности. Итак, предметом теории вероятности является изучение вероятностных закономерностей однородных массовых случайных событий. Знание закономерностей которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.

Методы теории вероятности широко применяются в различных отраслях естествознания и техники. В последние годы методы теории вероятности все шире и шире проникают в различные области науки и техники, способствуя их прогрессу.

Краткая историческая справка.

Первые работы, в которых зарождались основные понятия теории вероятностей, представляли собой попытки создания теории азартных игр (Кардано, Гюйгенс, Паскаль, Ферма и другие в XVI–XVII вв.).

Следующий этап развития теории вероятностей связан с именем Якоба Бернулли (1654–1705). Доказанная им теорема, получившая впоследствии название «Закона больших чисел», была первым теоретическим обоснованием накопленных ранее фактов.

Дальнейшими успехами теория вероятностей обязана Муавру, Лапласу, Гауссу, Пуассону и др.

Новый, наиболее плодотворный период связан с именами П. Л. Чебышева (1821–1894) и его учеников А. А.Маркова (1856–1922) и А. М.Ляпунова (1857–1918). В этот период теория вероятностей становится стройной математической наукой. Ее последующее развитие обязано в первую очередь русским и советским математикам (С. Н. Бернштейн, В. И. Романовский, А. Н. Колмогоров, А. Я. Хинчин, Б. В. Гнеденко, Н. В. Смирнов и др.). В настоящее время ведущая роль в создании новых ветвей теории вероятностей также принадлежит советским математикам.

Вариант № 38

ГЛАВА I

Обработка данных наблюдений и проверка гипотез

Задание: В результате независимых измерений получены n значений ошибки точности настройки РПУ на заданную частоту: х1, х2,…хn. Произвести полный статистический анализ данных выборки и сделать соответствующие выводы.

Значения выборки

0,637

1,121

0,409

1,082

-0,263

0,267

1,627

0,061

-1,114

-0,529

-0,142

0,658

-0,964

-0,586

0,799

-0,394

-0,036

0,507

0,882

-0,856

-0,118

0,678

-1,414

0,679

-0,276

0,247

1,469

-0,847

-0,032

0,379

-0,973

0,522

-1,191

0,091

1,468

0,486

1,642

0,185

0,838

-1,805

0,820

-0,872

-0,090

-0,304

-0,266

-0,426

-0,358

-0,866

-2,716

-0,592

0,243

1,594

-1,116

0,823

-1,473

-0,822

0,109

-0,156

-1,248

-1,266

0,238

0,676

-1,387

0,346

0,702

-0,220

-1,084

-0,406

-0,537

1,071

-1,566

0,318

-0,454

-0,402

-0.383

0,932

0,367

0,575

1,214

0.167

-0,833

-0,992

-0,266

-1,214

-0,348

-0,039

0,529

1,246

1,353

0,192

0,275

0,278

0,557

1,511

-1,447

-0,163

1,392

0,004

-0,184

0,495

min=

max=

Статическое распределение выборки

  1. По данным выборки найти:

а) размах варьирования: R = xmax – xmin,

R= 1,642-(-2.716)= 4,4

б) количество интервалов (разрядов):

к=7

в) длину разряда: 

h= 0,6

Интервал (-2,7 ; 1,6) расширим до интервала (-3 ; 1,9). Сдвиг в каждую стороны при этом не превысит: 

Для нового интервала изменения признака (-3;1,9) при  k=7  длина разряда получается равной 

  1. Произведем группировку опытных данных и построим интервальный вариационный ряд. Расчет оформим в виде таблицы 1.

Таблица №1

Границы интервала

[-3;-2,3)

[-2,3;-1,6)

[-1,6;-0,9)

[-0,9;-0,2)

[-0,2;0,5)

[0,5;1,2)

[1,2;1,9)

Частот

1

1

14

24

29

20

11

Относительные частоты

Накопленные частоты

1

2

16

40

69

89

100

-

n -

Расчет сводных характеристик выборки

  1. Вычислим моду  и медиану  выборочного распределения.

  1. По интервальному вариационному ряду, полученному в §1 составить дискретный вариационный ряд в виде таблицы 2, в котором в качестве вариант берём середины разрядов


Таблица № 2

Вычислим выборочную среднюю  (математическое ожидание) и выборочную дисперсию :


  1. Для расчета сводных характеристик выборки по методу произведений составим таблицу 3.

Таблица № 3

h=

Контроль расчетов производим по формуле:

  1. Вычислим начальные условные эмпирические моменты:



  1. Используя начальные моменты , вычислим центральные моменты: 


  1. Найдем выборочную среднюю (выборочное математическое ожидание):

где, С = 0,09

  1. Вычислим выборочную дисперсию и исправленную выборочную дисперсию:


  1. Найдем выборочное среднее квадратическое отклонение (с.к.о.) и исправленное выборочное с.к.о.: 


  1. Определим, чему равны выборочная асимметрия и выборочный эксцесс: 




Расчет интервальных оценок генеральных параметров

Построим доверительные интервалы для оценки генерального математического ожидания mx и генерального с.к.о. х. Для этого по заданной доверительной вероятности (надежности) из таблицы функции Лапласа найдем значение аргумента t этой функции, для которого Ф(t) = .




 

Используя найденное t, рассчитаем границы доверительного интервала для 

Интервальную оценку генерального с. к. о. определим по одной из формул:

В данном варианте q<1 то <x<

Проверка гипотезы о нормальном распределении
генеральной совокупности по критерию Пирсона

Для того, чтобы при заданном уровне значимости = 1 – проверить гипотезу о нормальном распределении обследуемого признака X генеральной совокупности, заполним таблицу 5.

Таблица №5

Контроль вычислений производим по формуле:

Обозначим сумму элементов восьмого столбца , и для заданного уровня значимости числа свободы р = k – 3 находим критическую

точку  (; р)

ВЫВОД: так как, то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).

Построение гистограммы выборки и теоретической 
нормальной кривой

1. Для построения гистограммы в выбранной системе координат на оси абсцисс откладываем разряды, а на каждом из разрядов как на основании строим прямоугольник с высотой , составляя таблицу 6.

Таблица №6

Разряды

На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi и выравнивающие частоты ni из таблицы 5. Эти данные заносим в таблицу 7.

Таблица №7

наносим точки с координатами и соединяем их плавной линией, получая искомую кривую. 

ВЫВОД: В данной части курсовой работы проверена гипотеза Пирсона, ее нет оснований отвергнуть, другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).


Разряды


-1.6


-1.1


-0.6


-0.1


0.4


0.9


1.4


1.9


2.4


2.9



0,12


0,18


0,26


0,38


0,32


0,40


0,26


0,04


0,02


0,06


В последней строке результаты вычислений округлим до 0,01.

На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi и выравнивающие частоты ni из таблицы 5. Эти данные заносим в таблицу 7.

Таблица №7


xi


-1.6


-1.1


-0.6


-0.1


0.4


0.9


1.4


1.9


2.4


2.9



0,12


0,23


0,35


0,41


0,38


0,27


0,15


0,07


0,024


0,006


наносим точки с координатами и соединяем их плавной линией, получая искомую кривую. 

ГЛАВА II

Элементы корреляционного анализа

Вариант №18

Дано: Результаты исследований зависимости между случайными величинами X и Y представлены в виде таблицы 8: 

Таблица №8

Y


X


30


35


40


45


50


55


ny


45


4


2






6


55



5


3





8


65




5


45


5



55


75




7


8


2



17


85





4


3


7


14


nx


4


7


15


57


10


7





Произвести корреляционный анализ зависимости Y от X, для чего:
Построить корреляционное поле;

  1. Найти выборочный коэффициент корреляции ;
  2. Получить доверительный интервал rxy для с надежностью ;
  3. Найти выборочное уравнение прямой регрессии Y на X;
  4. В выбранной системе координат построить точки (xi, yi) и выборочное уравнение регрессии Y на X.


§1. Корреляционная таблица и корреляционное поле

Представим данные корреляционной таблицы в виде корреляционного поля. Для этого в выбранной системе координат изобразим точки (xi, yj) и рядом с каждой точкой укажем, если это позволит масштаб, соответствующую частоту nxy. По расположению точек можно сделать предположение о наличии (или отсутствии) линейной корреляционной зависимости между обследуемыми признаками X и Y.

Для данных таблицы 8 корреляционное поле имеет вид:

Расположение точек говорит о наличии положительной корреляции между признаками X и Y.

§2.  Нахождение выборочного коэффициента корреляции

Вычисления можно значительно упростить, если перейти от истинных вариант xi, yj к условным ui, vj соответственно, а именно:




C1 = 45

h1 = 5

u1 = -3

u2 = -2

u3 = -1

u4 = 0

u5 = 1

u6 = 2


C2 = 65

h2 = 10

v1 = -1

v2 = 0

v3 = 1

v4 = 2


Формула для вычисления эмпирического коэффициента корреляции в условных вариантах имеет вид:

Для нахождения  составим расчетную таблицу 9.

Таблица №9


xi


ui


ni


niui


niui2


(ui + 1)


(ui + 1)2


ni(ui + 1)2


30


-3


4


-12


36


-2


4


16


35


-2


7


-14


28


-1


1


7


40


-1


15


-15


15


0


0


0


45


0


57


0


0


1


1


57


50


1


10


10


10


2


4


40


55


2


7


14


28


3


9


63




100


-17


117




183


Контроль 

,

то есть вычисления верны

Так как , то 



Аналогичные вычисления проводим для v в таблице 10.

Таблица №10


yj


vj


nj


njvj


njvj 2


(vj + 1)


(vj + 1)2


nj(vj + 1)2


45


-2


6


-12


24


-1


1


6


55


-1


8


-8


8


0


0


0


65


0


55


0


0


1


1


55


75


1


17


17


17


2


4


68


85


2


4


28


56


3


9


126




100


25


105




255


ui

vj 


-3


-2


-1


0


1


2




-3




-12




-4














-16


48



4




2















-12




-6
















-2







-10




-3











-13


26






5




3















-10




-6













-1







-




-5




0




5





0


0









5




45




5












-5




-45




-5







0










-7




0




2




0


-5


0









7




8




2












0




0




0







1













0




3





17


17












4




3















4




3








-12


-16


-11


-41


-2


7





36


32


11


0


-2


14



контроль


Контроль вычислений производим по формуле: 

вычисления верны.

Для вычисления  требуется еще найти. Для ее нахождения составим корреляционную таблицу 11 в условных вариантах.

Подставив найденные значения в формулу (*), получим

Таблица №11



§3. Нахождение доверительного интервала 
для генерального коэффициента корреляции

Задана надежность = 0,99. Доверительный интервал для генерального коэффициента корреляции rxy имеет вид:

 

Следовательно с вероятностью 0,99 доверительный интервал имеет вид:



§4. Нахождение выборочного уравнения прямой регрессии Y на X и построение ее графика

Общий вид уравнения прямой линии регрессии Y на X имеет вид:












Полученное уравнение регрессии показывает, как в среднем изменяется значение признака Y в зависимости от изменения признака Х.
В выбранной системе координат строим прямую и точки (xi, yi) корреляционного поля.

Таблица для построения графика


30


35


40


45


50


55


43,877


52,225


60,572


68,919


77,266


85,613


ВЫВОД: Построив корреляционное поле мы убеждаемся, что расположение точек говорит о наличии положительной корреляции между Х и Y. По расположению точек можно судить о линейной зависимости между Х и Y.

Заключение

В проделанной курсовой работе была предоставлена возможность проверить гипотезу Пирсона, опираясь на полученные результаты, я могу утверждать, что эмпирические и теоретические частоты различаются незначительно. Так же был проведен корреляционный анализ, была выявлена сильная линейная зависимость между величинами X и Y 

Список использованной литературы

1. Гмурман В.Е. «Теория вероятностей математической статистики» – М.: Высшая школа, 1999 г.

2. «Пособие и методические указания к выполнению курсовой работы» – Калининград: 1998 г.

Элементы математической статистики и корреляционного анализа