Курсовая работа: Статистическая проверка гипотез
Название: Статистическая проверка гипотез Раздел: Рефераты по экономике Тип: курсовая работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Содержание ВведениеСтатистическая проверка гипотез1.Статистическая гипотеза. Статистический критерий. Ошибки, возникающие при проверке гипотез2. Порядок проверки статистических гипотез 3. Проверка однородности результатов эксперимента в целях исключения грубых ошибок 4. Проверка гипотезы о воспроизводимости опытов 5. Проверка гипотезы о нормальном распределении ошибок эксперимента 6. Проверка гипотезы о виде распределения. ( Критерий согласия Пирсона ) 6.1 Расчёт теоретических частот для нормального распределения 7.Проверка гипотезы о согласованности мнений экспертов (априорное ранжирование переменных) 8. Уравнение линейной регрессии. Коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции 8.1 Метод наименьших квадратов8.2 Проверка незначимости коэффициента корреляции8.3 Использование корреляционной таблицы для вычисления коэффициента корреляцииВывод Список литературыПриложенияВведениеТема курсовой работы «Статистическая проверка гипотез». К важнейшим направлениям научно-технического прогресса относятся автоматизация производства, широкое применение компьютеров и роботов, создание гибких автоматизированных устройств и т.д. Во всех этих направлениях ведущая роль принадлежит электронике. При создании электронной и электромеханической аппаратуры основные трудозатраты приходятся на ее настройку, снятие характеристик и испытания. При этом нередко используется малоэффективный традиционный метод однофакторного эксперимента, недостаточно внимания уделяется организации и планированию эксперимента и вероятностно-статистическому анализу получаемых данных. Чтобы повысить производительность труда в данной области, специалистам необходимо знать основы математической теории эксперимента и успешно применить ее на практике. Цель работы – ознакомится со статистической проверкой гипотез, а именно: о воспроизводимости результатов эксперимента, о виде распределения результатов эксперимента, о наличии корреляционных связей между факторами и переменной состояния и др., рассмотрении практических примеров. Статистическая проверка гипотез1. Статистическая гипотеза. Статистический критерий. Ошибки, возникающие при проверке гипотезСтатистической называют гипотезу о виде неизвестного распределения или о параметрах известного распределения. Например, гипотеза H 0 - случайная величина распределена по нормальному закону. Нулевой (основной) называется выдвинутая гипотеза H 0 . Альтернативной (конкурирующей) называется гипотеза, противоречащая основной (конкурирующих гипотез может быть несколько). Например, основная гипотеза - математическое ожидание случайной величины Y равно 5 H 0 : My =5, конкурирующие: H
1
:
H
2
:
H
3
:
Статистическим критерием (К) называется случайная величина, точное или приближённое распределение, которой известно и которая служит для проверки справедливости нулевой гипотезы. Множество возможных значений критерия делится на две непересекающихся области: 1) значения, при которых нулевая гипотеза справедлива (область принятия гипотезы). 2) значения, при которых нулевая гипотеза отвергается (критическая область). Критическая область может быть односторонней (левосторонней, правосторонней) или двусторонней. Рис.1. Виды критических областей: правосторонняя, левосторонняя и двусторонняя. Точка Ккр , отделяющая критическую область от области принятия гипотезы, называется критической точкой. Чтобы определить критическую область, выбирают число q -уровень значимости. q - вероятность того, что при справедливости нулевой гипотезы значение критерия К попадает в критическую область. Тогда для правосторонней критической области Ккр определяется из условия: P { K > Kkp } = q . Значение критерия табулировано, т. е. Kkp можно найти по таблице распределения критических точек в зависимости от уровня значимости q и числа степеней свободы f . -Наблюдаемое значение критерия K набл определяется по результатам эксперимента. Если K набл < Kkp , то гипотеза H 0 принимается. Если K набл > Kkp , то H 0 отвергается, а принимается конкурирующая гинотеза H 1 . Для левосторонней критической области критическая точка определяется из условия: P { K < Kkp } = q . Для двухсторонней: P { K < K ’ kp } + P { K > K ” kp } = q . Если двусторонняя область симметрична относительно начала координат, то: P
{
K
<
K
’
kp
} =
Так как наблюдаемое значение критерия определялось по результатам эксперимента, то Кнабл -случайная величина и, следовательно, могут возникать ошибки при принятии гипотезы. Различают ошибки первого и второго рода. К ошибкам первого рода относят те, при которых отвергается правильная гипотеза. К ошибкам второго рода, относят те, при которых принимается неправильная гипотеза. Допустимой вероятностью ошибки первого рода является q -уровень значимости. Однако. если уменьшать q , то возрастает вероятность принятия неверной гипотезы, т. е. вероятность ошибок второго рода. Если справедлива гипотеза H 1 , то это считается доказанным, если справедлива гипотеза H 0 -то говорят, что результаты эксперимента не противоречат нулевой гипотезы. Для того чтобы считать H 0 доказанной нужно или вновь повторить эксперимент или проверить гипотезу с помощью других критериев. 2. Порядок проверки статистических гипотез 1) Выбор нулевой и альтернативной гипотез H 0 и H 1 . 2) Выбор критерия K и уровня значимости q . 3) Вычисление K набл по результатам эксперимента. 4) Поиск Kkp по таблице распределения критических точек для выбранного критерия. 5) Если K набл попадает в критическую область, то принимается альтернативная гипотеза H 1 , если K набл попадает в область принятия гипотезы, то принимается основная гипотеза H 0 .
3. Проверка однородности результатов эксперимента в целях исключения грубых ошибокРезультаты эксперимента удобно оформлять в виде таблицы . В графах 2-5 содержится план эксперимента (значение факторов), в остальных графах – результаты опытов. Пусть поводится N серий экспериментов серии (то есть в каждом из N точек факторного пространства проводится по
Вычислим оценки математического ожидания для каждой серии: Таблица 1.
Грубые ошибки искажают результаты эксперимента и должны быть исключены .Чаще всего при этом используют r-критерий .В соответствии с этим критерием результаты эксперимента в i-ой серии ,в которой предполагается ошибка , ранжируется ,т.е. располагается в неубывающем порядке Проверяется нулевая гипотеза Альтернативная гипотеза : отличие Если сомнительным показалось наименьшие значение Если сомнительным оказалась наблюдение в серии значение По таблице распределения r-критерия , используя число степеней свободы
Если
4. Проверка гипотезы о воспроизводимости опытовПри проведении экспериментов необходимо, чтобы опыты были воспроизводимы, т.е. результаты опытов, поставленных в одинаковых условиях, не имели существенных различий. Выбираем нулевую гипотезу H 0 : опыты воспроизводимы и альтернативную гипотезу H 1 : опыты не воспроизводимы. Для проверки справедливости H 0 ставится N -серий экспериментов, в каждой серии по m -параллельных опытов. Параллельными называются опыты, проводимые в одинаковых условиях, т.е. при одних и тех же значениях входных переменных. Следовательно, в факторном пространстве выбирается N точек и в каждой точке проводится по m опытов. Результаты экспериментов заносятся в таблицу: Таблица 2.
Для проверки нулевой гипотезы выбирается критерий Кохрена ( G ) :
По таблице распределения критических точек критерия Кохрена в зависимости от уровня значимости q , числа степеней свободы f = m -1 и числа серий N определяем критическую точку: Gkp = G ( q , f , N ). По результатам эксперимента вычисляем наблюдаемое значение критерия:
Если G набл < G кр , то гипотеза H 0 принимается, в противном случае принимается H 1 . Если гипотеза H 0 не принята, то для воспроизводимости результатов эксперимента необходимо или повысить число параллельных опытов m , или увеличить точность измерения переменной состояния. Если опыты воспроизводимы, то вычисляется ошибка опыта (дисперсия воспроизводимости опытов)
Дисперсия воспроизводимости опытов S0 2 является оценкой дисперсии переменной состояния sy 2 . Число степеней свободы дисперсии воспроизводимости: f 0 = N ( m -1). В некоторых лабораторных экспериментах повторные измерения отклика в параллельных опытах дают один и тот же результат . Тогда для расчета дисперсии воспроизводимости можно воспользоваться метрологическими характеристиками измерительных приборов. В паспортных данных прибора указывается класс его точности ( K , % от предела измерения
Случайная ошибка прибора подчиняется нормальному закону распределения . В машиностроении обычно считается , что В радиоэлектронной аппаратуре стабильность параметров активных и пассивных элементов значительно ниже и надежность 0,95 вполне приемлема. Поэтому выбираем
Дисперсию воспроизводимости полагаем равной
Пример: Проверить гипотезу о воспроизводимости опытов, в которых переменная состояния y зависит от трех факторов x 1 , x 2 , x 3 . Выбрать уровень значимости q =0,05 . Проведены 8 серий по 2 параллельных опыта в каждой серии. Результаты эксперимента и расчеты сведены в таблицу: Таблица 3.
Для каждой серии опытов вычисляем среднее значение
Значение критерия Кохрена по таблице: G кр =0.82 . Так как G набл < G кр , то нулевая гипотеза H0 принимается. Опыты воспроизводимы. Ошибка опыта S 0 2 =0.0021562 .
5. Проверка гипотезы о нормальном распределении ошибок экспериментаКак правило, ошибки результатов экспериментов распределены по нормальному закону . Выберем следующие гипотезы: H 0 : ошибки эксперимента распределены по нормальному закону; H 1 : ошибки эксперимента не распределены по нормальному закону. Для проверки гипотезы H 0 используется W –критерий. Пусть проведено m параллельных опытов ( 3 £ m £ 50 ). Для обработки результатов эксперимента нужно: 1) Расположить значения переменной состояния в неубывающем порядке: y 1 £ y 2 £ ... £ ym . 2) Вычислить: 3) Вычислить: если m -нечётное. Коэффициенты ai выбираются из таблицы в зависимости от m . 4) Вычислить наблюдаемое значение критерия:
5) По таблице критических точек найти W кр -критическое значение критерия в зависимости от числа степеней свободы f = m и уровня значимости q : W кр = W(q, f ); 6) Если наблюдаемое значение больше критического W набл > W кр (критическая область левосторонняя), то гипотеза H 0 принимается, т.е. ошибки эксперимента распределены по нормальному закону. В противном случае, если W набл <W кр , то гипотеза H 0 отвергается. Пример : Проведено 16 параллельных опытов. Получены следующие значения переменной состояния Y: 0.035 0.047 0.055 0.067 0.066 0.077 0.078 0.088 0.95 0.1 0.121 0.136 0.153 0.176 0.22 0.231 m = 16, q = 0,05, l = 16/2 = 8. Отметим, что результаты эксперимента расположены в неубывающем порядке.
где значения Наблюдаемое значение критерия:
Критическое значение критерия: Так как W набл > W кр , , то ошибки эксперимента распределены по нормальному закону. 6. Проверка гипотезы о виде распределения. ( Критерий согласия Пирсона )Пусть проведены N экспериментов в одинаковых условиях. Проверяется гипотеза H 0 : результаты эксперимента распределены по закону А . Критерий для проверки выдвинутой гипотезы называется критерием согласия. Разобьем интервал полученных результатов эксперимента [ Ymin , Ymax ] на m равных интервалов. [ Yi -1 , Yi ]; i =1,..., m . Обозначим через Yi * середину i -го интервала, ni - число результатов, попавших в i -й интервал. Получим ряд распределения:
Пусть в предположении, что результаты эксперимента имеют распределение А, вычислены теоретические частоты ni ’ . В качестве статистического критерия выбирается случайная величина: Чем меньше значение, принимаемое c 2 , тем ближе между собой теоретическое и эмпирическое распределения. Случайная величина c 2 имеет известное распределение Пирсона или c 2 . - распределение. Критическое значение критерия определяется по таблице распределения критических точек по заданному уровню значимости q и числу степеней свободы f : f = m - r -1 ; где r -число параметров распределения, определяемых по результатам эксперимента. Для нормального распределения r =2 , для распределения Пуассона и показательного распределения r =1 . Наблюдаемое значение критерия c 2 набл рассчитывается по результатам экспериментов
Если c 2 набл <c 2 кр , то гипотеза H 0 принимается, т. е. результаты эксперимента распределены закону А . Если c 2 набл >c 2 кр , то H 0 -отвергается (критическая область правосторонняя). 6.1 Расчёт теоретических частот для нормального распределения1. Вычисляем оценки математического ожидания и дисперсии: 2. Вычисляем границы интервалов нормированной переменной Z:
3. Выберем по таблице значения функции Лапласа Ф( Zi ) ; 4. Найдём вероятность попадания значений нормально распределённой случайной величины Z в i -й частичный интервал: 5. Вычисляем теоретические частоты: Пример: Пусть даны результаты 75 экспериментов. Проверить гипотезу о нормальном распределении результатов экспериментов:
Разобьем интервал [–64,-32] на частичные интервалы с шагом, равным 4. Для каждого частичного интервала подсчитаем число результатов, попавших в данный интервал. Обозначим эти частоты ni
. Вычислим середины частичных интервалов Полученные результаты вычислений занесем в таблицу. Находим оценки математического ожидания и среднего квадратического отклонения = -3566/75=-47.54; где Y* i – середина i -го интервала.
+78.6708+33.2024+429.6824+455.058+916.658) = =3420.5884/74=46.224 ; Sy = 6.7988=6.80; Вычислим границы интервала в кодированных переменных:
Вероятность попадания нормально распределённой случайной величины в i-тый частичный интервал Pi = Ф(Zi+1 ) - Ф(Zi ); i=1,...,m, где Ф(z) - функция Лапласа. Вычислим теоретические частоты ni ' =N×Pi . Величины Zi , Pi и ni ' заносим в таблицу. Определим наблюдаемое значение критерия Kнабл = 0,9168 + 0,0526 + 4,008 + 0,69 + 0,4303 + 0,1555 + 0,3874 + 0,74137) = 7,38197; Найдём критическое значение критерия Пирсона для уровня значимости q=0.1 и числа степеней свободы f=m-2-1=8-2-1=5: Kкр =c2 (q,f)= c2 (0.1;5)=9.236. Таблица 4.
Так как Kнабл < Kкр , то гипотеза H0 справедлива, т.е. результаты эксперимента распределены по нормальному закону.
7.Проверка гипотезы о согласованности мнений экспертов (априорное ранжирование переменных)Суть метода состоит в том, что специалистам (экспертам), хорошо знакомым с исследуемым процессом, предлагается расположить факторы в порядке убывания степени их влияния на переменную состояния. Пусть приглашены m экспертов, которым предложено проранжировать n факторов: x1 , x2 ,...,xn . Обозначим через а ij - ранг, выставляемый i-ым экспертом j-му фактору (1£а ij £n; i=1,...,m; j=1,...,n). Результаты опроса заносятся в сводную таблицу: Таблица 5.
Сумма рангов по строке (сумма рангов, выставляемых конкретным экспертом) для всех строк одинакова
Среднее значение рангов в строке: Среднее значение суммы рангов фиксированного фактора: По результатам опроса экспертов проверяется гипотеза H 0 : мнение экспертов согласованы, при альтернативной гипотезе H 1 : мнения экспертов не согласованы. Вычисляется коэффициент согласия (коэффициент конкордации):
где S ( d 2 ) - сумма квадратов отклонения суммы рангов от средней суммы:
а Если мнения экспертов согласованны, то: Если мнения экспертов рассогласованны, то: S ( d 2 ) близко к 0. Таким образом, получаем, что если мнения экспертов согласованны, то коэффициент конкордации W = 1 . Если мнения экспертов полностью рассогласованны, то W » 0 . Для проверки нулевой гипотезы в качестве статистического критерия выбираем случайную величину ( n -1) × m × W . Доказано, что при n >7 эта случайная величина имеет c 2 . - распределение с числом степеней свободы f = n - 1 . Таким образом, критическое значение критерия определяется по таблице критических точек c 2 . -распределения в зависимости от q и f . Наблюдаемое значение: c 2 .набл. = ( n -1) × m × W Если c 2 .набл. > c 2 .кр . , то мнения экспертов согласуются. В противном случае мнения экспертов рассогласованны (критическая область левосторонняя). Если из нескольких факторов эксперт ни одному не может отдать предпочтение, то в этом случае в таблицу ранжирования этим факторам он выставляет одинаковые дробные ранги . Коэффициент конкордации вычисляется по формуле:
где
где i - номер эксперта; k - номер повторения; tik - число одинаковых рангов в k -ом повторении. Если мнения экспертов согласованны, то строится ранжировочная диаграмма. В ней по оси абсцисс откладываются факторы, по оси ординат - суммы рангов в обратном порядке. По виду диаграммы судят о значимом или незначимом влиянии факторов на переменную состояния и об использовании факторов в основном эксперименте. Пример: Для некоторого технологического объекта рассматриваются шесть факторов, влияющих на переменную состояния. Мнения четырёх экспертов приведены в таблице. Проверить гипотезу о согласованности экспертов и, если она справедлива, то изобразить гистограмму ранжирования. Таблица 7.
m =4; n =6. Средняя сумма рангов в столбце:
Вычислим коэффициент конкордации:
Наблюдаемое значение критерия определяется по формуле: c 2 .набл =m (n -1)W =4×5×0,805=16,1.. Критическое значение критерия находим в таблице для уровня значимости q=0.05 и числа степеней свободы f = n - 1 = 6 – 1 = 5: c 2 .кр . = c 2 . (0,05;5)=11,07. Так как c 2 .набл. > c 2 .кр . , то мнения экспертов согласованны.
X3 X1 X2 X5 X4 X6 Рис.2. Ранжировочная гистограмма.
8. Уравнение линейной регрессии. Коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляцииПосле отсеивания незначимых факторов проверяется наличие корреляционных связей между факторами и между факторами и переменной состояния. Из статистики известно, что линейная связь между величинами X и Y оценивается с помощью коэффициента корреляции. Пусть проведены N экспериментов, в результате которых получены следующие значения величин X и Y:
Нанесём результаты экспериментов на координатную плоскость в виде точек, координатами которых является xi , y i , получим корреляционное поле Рис.3. Корреляционное поле. На рис.3а) – явно линейная зависимость между X и Y, на рис.3б) –зависимость нелинейная, на рис.3в) – зависимость между X и Y отсутствует. Простейшим видом эмпирической формулы является линейная зависимость Y = aX + b. Функцию f(x) = ax + b называют линейной регрессией Y на X . Существуют различные методы вычисления коэффициентов a и b: метод “натянутой нити”, метод сумм и метод наименьших квадратов. Рассмотрим метод “натянутой нити”. Нанесём результаты эксперимента на координатную плоскость (см. рис.4)) . Мысленно натянем нить таким образом, чтобы по обе стороны от неё оставалось приблизительно равное число точек, при этом суммы расстояний от точек до нити с обеих сторон должны быть одинаковы и минимальны.
Рис.4. Метод ”натянутой нити”. На прямой, совпадающей с направлением нити, выберем две точки с координатами (x1,y1) и (x2,y2). Подставим координаты точек в уравнение y=ax+b. Получим систему из двух уравнений с двумя неизвестными a и b и решаем её Составим уравнение y=ax+b, используя решение (a,b) системы. 8.1 Метод наименьших квадратовБудем искать уравнение регрессии в виде линейной зависимости: Коэффициенты a0 и a1 определяются из условия: сумма квадратов отклонений экспериментальных значений y от рассчитанных по уравнению регрессии должна быть минимальной. Для отыскания минимума составим систему уравнений Решая эту систему, получаем значения коэффициентов: Обозначим через rxy оценку коэффициента линейной корреляции:
Тогда коэффициенты регрессии определяются равенствами
Аналогичные вычисления для второго уравнения регрессии x = b 1 y + b 0 = g ( y ) дают следующие значения коэффициентов:
Тогда уравнение регрессии имеет вид:
Свойства коэффициента линейной корреляции: 1.Коэффициент линейной корреляции rxy
по абсолютной величине не превышает 1: 2.Если X и Y (случайные величины) независимы, то rxy =0, обратное утверждение верно не всегда. 3.Если rxy = ± 1 , то величины X , Y связаны функциональной линейной зависимостью. 4.Если
8.2 Проверка незначимости коэффициента корреляцииПусть по результатам эксперимента рассчитана оценка коэффициента корреляции rxy . Выберем нулевую гипотезу: H 0 - коэффициент корреляции r xy незначим; альтернативную гипотезу: H 1 – коэффициент корреляции r xy значим. Для проверки справедливости H 0 выберем критерий Стьюдента. Наблюдаемое значение критерия рассчитывается по результатам эксперимента по следующей формуле:
По таблице критических точек критерия Стьюдента определим Ткр. = Т( q , f ) по уровню значимости q и числу степеней свободы f = N -2 . Если |Тнабл |<Ткр , то гипотеза H0 – справедлива, т.е. коэффициент корреляции r xy - незначим. В противном случае, нулевая гипотез H0 отвергается, т.е. случайные величины X и Y связаны линейной зависимостью (критическая область двусторонняя).
Рис.5. Критическая область критерия Стьюдента.. При использовании метода наименьших квадратов для вычисления коэффициента корреляции и построения уравнения регрессии предполагается, что X и Y имеют нормальное распределение. 8.3. Использование корреляционной таблицы для вычисления коэффициента корреляцииЕсли число экспериментов велико, то составляются корреляционные таблицы. Для этого среди результатов эксперимента выбираются xmin , xmax , ymin , ymax . Интервал [xmin , xma ) ] возможных значений X делим с шагом h 1 на n частичных интервалов, Интервал [ymin ,ymax ] для Y делим с шагом h 2 на m частичных интервалов. Границы интервалов по X записываются в 1-ый столбец, по Y - в 1-ую строку. Для каждой пары (xi
, yi
) определяем в какую строку попало значение xi
и в какой столбец yi
. В клетку, расположенную на пересечении найденной строки и столбца, ставим палочку (или точку) . Операцию проводим для всех пар. Подчитываем число палочек (точек) в каждой клетке и записываем полученное число в клетку. Просуммируем числа, стоящие в 1- ой строке, получим частоту Таблица 7
Просуммируем величины, которые стоят в первом столбце. Получим частоту По виду корреляционной таблице можно судить о виде корреляционной зависимости. Вычислим середины частичных интервалов
i =1,…, n ; j =1,…, m . Внесем найденные значения в корреляционную таблицу. По таблице вычислим оценки математических ожиданий и дисперсий
Коэффициент линейной корреляции определяются по формуле:
Для простоты вычислений обычно используют замену переменных:
где С1
и С2
– значения xi
*
и yj
*
соответствующие максимальной частоте
При вычислениях используем, что
Коэффициент корреляции вычисляется по формуле:
Вернемся к исходным переменным:
Уравнения регрессии:
Графики функций пересекаются в точке Пример: Даны результаты 78 экспериментов:
Начало первого интервала x0 = 53, y0 = –321; Длина интервала h1 = 5, h2 = 17. 1. Построить корреляционное поле для 4-ых столбцов X и Y и методом “натянутой нити” найти линейные функции регрессии. 2. Составить корреляционную таблицу. Вычислить коэффициент линейной корреляции, найти уравнения регрессий и построить их графики. 3. Проверить гипотезу о незначимости коэффициента корреляции. Решение. 1. По последним столбцам X и Y находим: xmin =55; ymin =-279; xmax =70; ymax =-213; На осях отображаем тот промежуток, где находятся значения X и Y. Представляя в виде точек пары чисел (x1 ; yj ) строим корреляционное поле: Используя метод “натянутой нити”, проведём прямую. На прямой выберем две точки (57, -220) и (69, -270), расположенные достаточно далеко друг от друга.. Подставляя значения в функцию y=ax+b, получим систему уравнений относительно a и b.
Получим решение a = - 4,17; b = 17,69. Уравнение линейной регрессии имеет вид: y = - 4,17 x + 17,69. 2. Найдём минимальные и максимальные значения X и Y среди результатов эксперимента: xmin =55; ymin =-313; xmax =80; ymax =-213; Составим корреляционную таблицу с шагом h1 =5 по X и h2 =17 по Y. Учитываем, что левая граница входит в интервал, а правая нет. Клетка в шапке сверху содержит границы интервала по Y [yj , yj +1 ], значение середины интервала yj * и значение середины интервала для условной переменной V. Клетка в шапке слева содержит границы интервала по X [xi , xi +1 ], значение середины интервала xi * и значение середины интервала для условной переменной U. Произвольная клетка таблицы содержит число результатов Таблица 8.
Переход к условным вариантам.
C1 =70,5; С2 =-278,5 – координаты клетки с максимальным числом результатов экспериментов.
Вычисляем средние:
Вычислим среднее квадратов:
Вычислим среднее квадратическое отклонение:
Коэффициент корреляции:
Находим статистические характеристики X, Y:
Уравнение регрессии:
Определим координаты двух точек для каждого графика:
Графики пересеклись в точке M(68; -263,2) 3. Проверим гипотезу о незначимости коэффициента корреляции. Наблюдаемое значение критерия:
n , m – число частичных интервалов по X и Y . n = 6; m = 7; N = 7.
T кр = T (0,05; N -2)= T (0,05; 5)=2,57 – по таблице распределения Стьюдента. Так как | T набл |=6,65>2,57 , то гипотеза отвергается, следовательно r xy значим. Вывод В курсовую работу вошли задачи, решаемые на стадии предварительного эксперимента. При решении этих задач использованы идеи и методы математической статистики, в частности ее разделы - оценивание параметров и проверка статистических гипотез. Используя эти методы, проверяются следующие гипотезы: о воспроизводимости результатов эксперимента, о виде распределения результатов эксперимента, о наличии корреляционных связей между факторами и переменной состояния и др. Список литературы1.Егоров А.Е., Азаров Г.Н., Коваль А.В. Исследование устройств и систем автоматики методом планирования эксперимента. – К.: Вища школа, 1986. 2.Бондарь А.Г., Статюха Г.А. Планирование эксперимента в химической технологии. – К.: Вища школа, 1978. 3.Кафаров В.В. Методы кибернетики в химии и химической технологии. – М.: Химия, 1971. 4.Колде Я.К. Практикум по теории вероятностей и математической статистике. – М.: Высшая школа, 1991. 5.Твердохлебов Г.Н., Бродский А.Л., Старобина Е.К., Кутакова Д.А. Методические указания по математическим методам анализа и планирования эксперимента для студентов всех химических специальностей. -Ворошиловград, 1985.
Приложение 1(таблица значений функции Лапласа Ф(х))(Таблица значений функции
Приложение 2(таблица критических точек критерия Пирсона)c2 – распределение (распределение Пирсона)
Приложение 3(таблица критических точек критерия Стьюдента)(t – критерий)
Приложение 4(таблица критических точек критерия Фишера)(F – распределение для уровня значимости q=0.05)
Примечание. f1 – число степеней свободы большей дисперсии, f2 – число степеней свободы меньшей дисперсии. Приложение 5(таблица критических точек критерия Кохрена)(G- критерий для уровня значимости q=0.05)
Примечание. fu – число степеней свободы числителя; få -- число степеней свободы знаменателя. Приложение 6(таблица критических точек r ‑ критерия)(r – критерий для уровней значимости q={0.05;0.01})
|