Основные статистические расчеты
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОУ ВПО
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
КОНТРОЛЬНАЯ РАБОТА
ПО СТАТИСТИКЕ
Студентка:
Группа:
Факультет:
Зачетная книжка:Преподаватель:
Вариант № 18
Москва
2010Задание
Имеются следующие выборочные данные о деятельности коммерческих банков (выборка 5%-ная механическая), млн. руб.
Номер банка п/п |
Прибыль | Собственный капитал |
1 | 170 | 3900 |
2 | 200 | 4500 |
3 | 150 | 3000 |
4 | 90 | 2300 |
5 | 130 | 3700 |
6 | 170 | 3200 |
7 | 155 | 3780 |
8 | 190 | 4000 |
9 | 180 | 3100 |
10 | 210 | 4600 |
11 | 100 | 2200 |
12 | 220 | 5280 |
13 | 250 | 4700 |
14 | 180 | 4400 |
15 | 276 | 6500 |
16 | 220 | 5000 |
17 | 140 | 2500 |
18 | 50 | 1800 |
19 | 190 | 4200 |
20 | 210 | 5600 |
21 | 346 | 7962 |
22 | 240 | 5850 |
23 | 120 | 400 |
24 | 230 | 4900 |
25 | 350 | 8400 |
26 | 280 | 7088 |
27 | 163 | 5100 |
28 | 200 | 4300 |
29 | 260 | 6020 |
30 | 270 | 4800 |
ЗАДАНИЕ 1
По исходным данным:
Постройте статистический ряд распределения банков по признаку прибыль, образовав пять групп с равными интервалами.
Постойте графики полученного ряда распределения, графически определите значение моды и медианы.
Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, моду и медиану.
Вычислите среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п.3 для интервального ряда распределения. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Выполнение Задания 1
1.1 Построение интервального ряда распределения банков по объему прибыли
Для построения статистического ряда, характеризующего распределение банков по прибыли, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала h определяется по формуле
, (1)
где – наибольшее и наименьшее значения признака в исследуемой совокупности,
k- число групп интервального ряда.
Определение величины интервала по формуле (1) при заданных k = 5, xmax = 350 млн руб., xmin = 50 млн руб.:
h=(350-50)/5=60 млн руб.
При h = 60 млн руб. границы интервалов ряда распределения имеют следующий вид (табл. 2)
Таблица 2
Номер группы |
Нижняя граница, млн руб. |
Верхняя граница, млн руб. |
1 | 50 | 110 |
2 | 110 | 170 |
3 | 170 | 230 |
4 | 230 | 290 |
5 | 290 | 350 |
Процесс группировки единиц совокупности по признаку прибыль представлен во вспомогательной (разработочной) таблице 3
Таблица 3
Разработочная таблица для построения статистического ряда распределения и аналитической группировки
Группы банков по прибыли, млн руб. | Номер банка | Прибыль, млн руб. |
Собственный капитал, млн руб. |
1 | 2 | 3 | 4 |
50-110 | 4 | 90 | 2300 |
11 | 100 | 2200 | |
18 | 50 | 1800 | |
Всего | 3 | 240 | 6300 |
110-170 | 3 | 150 | 3000 |
5 | 130 | 3700 | |
7 | 155 | 3780 | |
17 | 140 | 2500 | |
23 | 120 | 400 | |
27 | 163 | 5100 | |
Всего | 6 | 858 | 18480 |
170-230 | 1 | 170 | 3900 |
2 | 200 | 4500 | |
6 | 170 | 3200 | |
8 | 190 | 4000 | |
9 | 180 | 3100 | |
10 | 210 | 4600 | |
12 | 220 | 5280 | |
14 | 180 | 4400 | |
16 | 220 | 5000 | |
19 | 190 | 4200 | |
20 | 210 | 5600 | |
28 | 200 | 4300 | |
Всего | 12 | 2340 | 52080 |
230-290 | 13 | 250 | 4700 |
15 | 276 | 6500 | |
22 | 240 | 5850 | |
24 | 230 | 4900 | |
26 | 280 | 7088 | |
29 | 260 | 6020 | |
30 | 270 | 4800 | |
Всего | 7 | 1806 | 39858 |
290-350 | 21 | 346 | 7962 |
25 | 350 | 8400 | |
Всего | 2 | 696 | 16362 |
ИТОГО | 30 | 5940 | 133080 |
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая таблица 4.
Таблица 4
Распределение банков по прибыли
Номер группы | Группы банков по прибыли, млн руб., |
Число банков, f |
1 | 50-110 | 3 |
2 | 110-170 | 6 |
3 | 170-230 | 12 |
4 | 230-290 | 7 |
5 | 290-350 | 2 |
Итого | 30 |
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .
Таблица 5
Структура банков по прибыли
№ группы | Группы банков по прибыли, млн руб. | Число банков, fj |
Накопленная частота, Sj |
Накопленная частоcть, % |
|
в абсолютном выражении | в % к итогу | ||||
1 | 2 | 3 | 4 | 5 | 6 |
1 | 50-110 | 3 | 10 | 3 | 10,0 |
2 | 110-170 | 6 | 20 | 9 | 30,0 |
3 | 170-230 | 12 | 40 | 21 | 70,0 |
4 | 230-290 | 7 | 23,3 | 28 | 93,3 |
5 | 290-350 | 2 | 6,7 | 30 | 100,0 |
Итого | 30 | 100,0 |
Вывод. Анализ статистического ряда распределения изучаемой совокупности банков показывает, что распределение банков по объему прибыли не является равномерным: преобладают банки с прибылью от 170 млн руб. до 230 млн руб. (это 12 банков, доля которых составляет 40%); 30% банков имеют прибыль менее 170 млн руб., а 70% – менее 230 млн руб.
1.2 Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).
Рис. 1 Определение моды графическим методом
Для определения моды графическим способом на гистограмме распределения правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых будет модой распределения.
Конкретное значение моды для интервального ряда рассчитывается по формуле:
(3)
где хМo – нижняя граница модального интервала,
h –величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 3 модальным интервалом построенного ряда является интервал 170 – 230 млн. руб., так как его частота максимальна (f3 = 12).
Расчет моды по формуле (3):
Mo=170+60*((12-6)/((12-6)+(12-7)))=202,727 млн руб.
Вывод. Для рассматриваемой совокупности банков наиболее распространенный объем прибыли характеризуется средней величиной 202,727 млн руб.
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5).
Для определения медианы графическим способом высоту наибольшей ординаты кумуляты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.
Рис. 2. Определение медианы графическим методом
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В демонстрационном примере медианным интервалом является интервал 170 – 230 млн. руб., так как именно в этом интервале накопленная частота Sj = 21 впервые превышает величину, равную половине численности единиц совокупности
(=).
Расчет значения медианы по формуле (4):
Ме=170+60*((30/2-9)/12)=200 млн руб.
Вывод. В рассматриваемой совокупности банков половина банков имеют в среднем объем прибыли не более 200 млн руб., а другая половина – не менее 200 млн руб.
1.3 Расчет характеристик интервального ряда распределения
Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 5 строится вспомогательная таблица 6 ( – середина j-го интервала).
Таблица 6
Расчетная таблица для нахождения характеристик ряда распределения
Группы банков по объему прибыли, млн руб. |
Середина интервала,
|
Число банков, fj |
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
50-110 | 80 | 3 | 240 | -117,333 | 13924,000 | 41772 |
110-170 | 140 | 6 | 840 | -57,333 | 3364,000 | 20184 |
170-230 | 200 | 12 | 2400 | 2,667 | 4,000 | 48 |
230-290 | 260 | 7 | 1820 | 62,667 | 3844,000 | 26908 |
290-350 | 320 | 2 | 640 | 112,667 | 14884,000 | 29768 |
Итого | 30 | 5940 | 118680 |
Расчет средней арифметической взвешенной: (5)
=5940/30=198 млн руб.
Расчет среднего квадратического отклонения:
(6)
σ=118680/30=62,897 млн руб.
Расчет дисперсии:
σ2 =61,641 2=3956
Расчет коэффициента вариации:
(7)
Vσ=62,897*100/198=31,77 %
Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем прибыли банков составляет 198 млн руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 62,897 млн руб. (или 31,77 %), наиболее характерные значения объема прибыли находятся в пределах от 135,103 млн руб. до 260,897 млн руб. (диапазон ).
Значение Vσ = 31,77 % не превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна.
Расхождение между значениями , Мо и Ме незначительно (=198 млн руб., Мо=202,727 млн руб., Ме=200 млн руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема прибыли банков (198 млн руб.) является типичной, надежной характеристикой исследуемой совокупности банков.
1.4 Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
(8)
=5940/30=198 млн руб.
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
ЗАДАНИЕ 2По исходным данным:
1. Установите наличие и характер связи между признаками – прибыль и собственный капитал:
а) аналитической группировки;
б) корреляционной таблицы.
2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициентов детерминации и эмпирического корреляционного отношения.
Сделайте выводы по результатам выполнения задания.
Выполнение Задания 2
2.1 Установление наличия и характера связи между признаками прибыль и собственный капитал методами аналитической группировки и корреляционной таблицы
а. Применение метода аналитической группировки
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Прибыль и результативным признаком Y – Собственный капитал. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы |
Группы банков по объему прибыли, млн руб. |
Число банков |
Собственный капитал, млн руб. |
|
всего | в среднем на один банк | |||
1 | ||||
2 | ||||
3 | ||||
4 | ||||
5 | ||||
Итого |
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы |
Группы банков по объему прибыли, млн руб., х |
Число банков, fj |
Собственный капитал, млн руб. |
|
всего |
в среднем на один банк, |
|||
1 |
2 |
3 |
4 |
5=4:3 |
1 | 50-100 | 3 | 6300 | 2100 |
2 | 110-170 | 6 | 18480 | 3080 |
3 | 170-230 | 12 | 52080 | 4340 |
4 | 230-290 | 7 | 39858 | 5694 |
5 | 290-350 | 2 | 16362 | 8181 |
Итого | 30 | 133080 | 4436 |
Вывод. Анализ данных табл. 8 показывает, что с увеличением объема прибыли от группы к группе систематически возрастает и объем собственного капитала по каждой группе банков, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
б. Применение метода корреляционной таблицы.
Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j-ой строки и k-ой графы указывается число единиц совокупности, входящих в j-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – Прибыль известны из табл. 8. Для результативного признака Y – Собственный капитал величина интервала определяется по формуле (1) при k = 5, уmax = 8400 млн руб., уmin = 400 млн руб.:
h=(8400-400)/5=1600 млн руб.
Границы интервалов ряда распределения результативного признака Y имеют следующий вид (табл. 9):
Таблица 9
Номер группы |
Нижняя граница, млн руб. |
Верхняя граница, млн руб. |
1 | 400 | 2000 |
2 | 2000 | 3600 |
3 | 3600 | 5200 |
4 | 5200 | 6800 |
5 | 6800 | 8400 |
Подсчитывая с использованием принципа полуоткрытого интервала [ ) число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 10).
Таблица 10
Распределение банков по сумме прибыли
Группы банков по объему собственного капитала, млн. руб., х |
Число банков, fj |
400 – 2000 | 2 |
2000 – 3600 | 6 |
3600 – 5200 | 14 |
5200 – 6800 | 5 |
6800 - 8400 | 3 |
Итого | 30 |
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).
Таблица 11
Корреляционная таблица зависимости суммы прибыли банков от объема кредитных вложений
Группы банков по прибыли, млн руб. |
Группы банков по объему собственного капитала, млн руб. | |||||
400-2000 | 2000-3600 | 3600-5200 | 5200-6800 | 6800-8400 | Итого | |
50-110 | 1 | 2 | 3 | |||
110-170 | 1 | 2 | 3 | 6 | ||
170-230 | 2 | 8 | 2 | 12 | ||
230-290 | 3 | 3 | 1 | 7 | ||
290-350 | 2 | 2 | ||||
Итого | 2 | 6 | 14 | 5 | 3 | 30 |
Вывод. Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между объемом кредитных вложений и суммой прибыли банков.
2.2 Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
(10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
=133080/30=4436 млн руб.
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер банка п/п |
Собственный капитал, млн руб. |
|||
1 |
2 |
3 |
4 |
5 |
1 | 3900 | -536 | 287296 | 15210000 |
2 | 4500 | 64 | 4096 | 20250000 |
3 | 3000 | -1436 | 2062096 | 9000000 |
4 | 2300 | -2136 | 4562496 | 5290000 |
5 | 3700 | -736 | 541696 | 13690000 |
6 | 3200 | -1236 | 1527696 | 10240000 |
7 | 3780 | -656 | 430336 | 14288400 |
8 | 4000 | -436 | 190096 | 16000000 |
9 | 3100 | -1336 | 1784896 | 9610000 |
10 | 4600 | 164 | 26896 | 21160000 |
11 | 2200 | -2236 | 4999696 | 4840000 |
12 | 5280 | 844 | 712336 | 27878400 |
13 | 4700 | 264 | 69696 | 22090000 |
14 | 4400 | -36 | 1296 | 19360000 |
15 | 6500 | 2064 | 4260096 | 42250000 |
16 | 5000 | 564 | 318096 | 25000000 |
17 | 2500 | -1936 | 3748096 | 6250000 |
18 | 1800 | -2636 | 6948496 | 3240000 |
19 | 4200 | -236 | 55696 | 17640000 |
20 | 5600 | 1164 | 1354896 | 31360000 |
21 | 7962 | 3526 | 12432676 | 63393444 |
22 | 5850 | 1414 | 1999396 | 34222500 |
23 | 400 | -4036 | 16289296 | 160000 |
24 | 4900 | 464 | 215296 | 24010000 |
25 | 8400 | 3964 | 15713296 | 70560000 |
26 | 7088 | 2652 | 7033104 | 50239744 |
27 | 5100 | 664 | 440896 | 26010000 |
28 | 4300 | -136 | 18496 | 18490000 |
29 | 6020 | 1584 | 2509056 | 36240400 |
30 | 4800 | 364 | 132496 | 23040000 |
Итого | 133080 | 0 | 90670008 | 681012888 |
Расчет общей дисперсии по формуле (10):
=90670008/30=3022333,6
Общая дисперсия может быть также рассчитана по формуле
,
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
=681012888/30=22700429,6
=19678096
Тогда
=-=22700429,6-19678096=3022333,6
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по прибыли, млн руб. |
Число банков, |
Среднее значение в группе |
||
1 |
2 |
3 |
4 |
5 |
50-110 | 3 | 2100 | -2336 | 16370688 |
110-170 | 6 | 3080 | -1356 | 11032416 |
170-230 | 12 | 4340 | -96 | 110592 |
230-290 | 7 | 5694 | 1258 | 11077948 |
290-350 | 2 | 8181 | 3745 | 28050050 |
Итого | 30 | 66641694 |
Расчет межгрупповой дисперсии по формуле (11):
=66641694/30=2221389,8
Расчет эмпирического коэффициента детерминации по формуле (9):
=2221389,8/3022333,6=0,735 или 73,5%
Вывод. 75,3% вариации суммы прибыли банков обусловлено вариацией объема прибыли, а 24,7% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
| 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика силы связи |
Слабая | Умеренная | Заметная | Тесная | Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
=0,857 или 85,7 %
Вывод. Согласно шкале Чэддока связь между объемом прибыли и суммой собственного капитала банков является