Задание 1 (макс. 20 баллов)


Собрана статистика по курсу доллара в 76 обменных пунктах в один момент времени. Результаты обработки приведены в таблице и на диаграмме. Вы должны содержательно объяснить как можно большее число показателей и элементов диаграммы.

Решение

Содержательное объяснение показателей таблицы:

Показатель

Значение

показателя

Содержательное объяснение показателя

Счет

76

Количество элементов выборки (76 обменных пунктов).

Сумма

2280

Сумма значений курса доллара во всех 76 обменных пунктах.

Минимум

28,72

Минимальное значение курса доллара из выборки.

Максимум

30,47

Максимальное значение курса доллара из выборки.

Интервал

1,75

Разность между максимальным и минимальным значениями курса доллара из выборки.

Среднее

30

Среднее арифметическое значений курса доллара во всех 76 обменных пунктах.

Медиана

30,01

Значение курса доллара, делящее численность вариационного ряда  по сумме накопленных частот на две равные части.

Мода

29,91

Значение курса доллара, имеющее наибольшую частоту.

Асимметричность

-1,1

Разность между модой и медианой.

Дисперсия выборки

0,08

Характеризует разброс значений случайной величины относительно ее среднего значения.

Диаграмма частот показывает количество обменных пунктов, имеющих определенное значение курса доллара:

-         в  одном пункте курс доллара равен 28,72;

-         в 7 пунктах  курс доллара равен 29,65;

-         в 13 пунктах  курс доллара равен 29,89;

-         в 17 пунктах  курс доллара равен 30;

-         в 13 пунктах  курс доллара равен 30,12;

-         в 9 пунктах  курс доллара равен 30,24;

-         в 8 пунктах  курс доллара равен 30,35;

-         в 7 пунктах  курс доллара равен 30,47;

-         в  1 пункте курс доллара отличен от перечисленных.

На графике интегрального % показано количество обменных пунктов (в %), имеющих курс доллара меньше значения по горизонтальной оси. Например,  67% обменных пунктов имеют курс доллара меньше 30,12.

Задание 2 (макс. 20 баллов)

В результате выборочного обследования зафиксировано количество продаж одного товара разных фирм.

Требуется с помощью критерия Пирсона  проверить гипотезу о том, что товары этих фирм продаются примерно одинаково, а отклонения - случайны.


Фирма 1

Фирма 2

Фирма 3

Фирма 4

Фирма 5

180

250

203

196

206


Решение

Определим .

Так как проверяется гипотеза о том, что товары этих фирм продаются примерно одинаково, а отклонения – случайны, то для нахождения теоретических значений используем формулу .

Составляем расчетную таблицу.



Фирма 1

Фирма 2

Фирма 3

Фирма 4

Фирма 5

180

250

203

196

206

207

207

207

207

207

3,522

8,932

0,077

0,585

0,005

Сумма

1035


13,121



С помощью таблицы получаем:       ,

Так как , то нельзя считать, что товары фирм продаются примерно одинаково, а отклонения – случайны.

Задание З (макс. 20 баллов)

В супермаркете проведено выборочное маркетинговое обследование. Результаты приведены в таблице. Требуется с помощью критерия Пирсона  проверить гипотезу о том, что количество товаров в корзине не зависит от возраста покупателя.

Возраст

Количество товаров в корзине

Корзина пуста

В корзине только один товар

В корзине два и более товара

Интервал -1. От 18.00, меньше 35.50

92

80

182

Интервал - 2. От 35.50, меньше 53.00

83

92

204

Интервал - 3 От 53.00, меньше 70.50

67

88

163

Интервал - 4 От 70.50, до 88.00

10

9

27

Решение

1. Проверяем условие: , где

.

Составляем вспомогательную таблицу.



Интервал -1.

92

80

182

354

Интервал - 2.

83

92

204

379

Интервал - 3

67

88

163

318

Интервал - 4

10

9

27

46


252

269

576

1097


Получаем:

1097*((0,0949+0,0672+0,1624+0,0721+0,0830+0,1906+0,0560+0,0905+

0,1451+0,0086+0,0065+0,0275)-1)= 1097*0,0046=5,052

.

Так как , то количество товаров в корзине зависит от возраста покупателя.

Задание 4 (макс. 40 баллов)

Имеется статистика о количестве зарегистрированных транспортных средств и аварийности на дорогах. Исследователь провёл анализ этих данных. Результаты показаны на рисунке 1 и в таблицах 2-4.

Ваша задача описать в виде текста полученные результаты. Вы должны содержательно объяснить как можно большее число показателей и элементов диаграммы и сформулировать, выводы.

Решение

На рисунке 1 построена диаграмма рассеяния, т.е. для каждого года изображена точка с координатами (х,у), где х - количество зарегистрированных транспортных средств, у - количество аварий на дорогах. Для исследования зависимости между количеством зарегистрированных транспортных средств  и количеством аварий на дорогах к диаграмме рассеяния добавлена прямая линейного тренда, показано уравнение тренда (у = 0,312х + 55,853) и коэффициент детерминации (R2 = 0,9362).

По уравнению линейного тренда можно сделать вывод о прямой зависимости между количеством зарегистрированных транспортных средств и количеством аварий на дорогах (т.к. b = 0,312 >0), т.е. при увеличении количества зарегистрированных транспортных средств на  количество аварий на дорогах увеличивается в среднем на .

Так как коэффициент детерминации R2 = 0,9362, то количество аварий на дорогах на 93,62% зависит от количества зарегистрированных транспортных средств. Связь между исследуемыми признаками тесная, т.к. R2 близок к 1.


В таблице 2 приведены результаты регрессионной статистики.

Содержательное объяснение показателей таблицы:

Показатель

Значение

показателя

Содержательное объяснение показателя

Множественный

0,97

Коэффициент корреляции. Так как R >0, то связь между исследуемыми признаками прямая.

R-квадрат

0,94

Коэффициент детерминации.

Нормированный R-квадрат

0,93

Нормированный коэффициент детерминации получается из коэффициента  детерминации поправкой на размер выборки.

Наблюдения

11

 Количество элементов выборки (11 лет)


В таблице 3 приведены результаты дисперсионного анализа. Общая дисперсия (разброс значений зависимой переменной у относительно ее среднего значения) равна 17619,6. Большая часть дисперсии переменной у (16495,4) объясняется влиянием фактора х. Остаточная дисперсия равна 1124,1.

В таблице 4 приведены результаты исследования коэффициентов регрессии. Определено, что для исследуемых признаков уравнение регрессии у = bх + a имеет вид  у = 0,31х + 55,85. С вероятностью 0,95 значение коэффициента а уравнения регрессии находится в интервале (23,07; 88,63), стандартная ошибка коэффициента а  равна 14,49. С вероятностью 0,95 значение коэффициента b уравнения регрессии находится в интервале (0,25; 0,37), стандартная ошибка коэффициента b  равна 0,03.