Основные статистические расчеты

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОУ ВПО

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ





КОНТРОЛЬНАЯ РАБОТА

ПО СТАТИСТИКЕ



Студентка:

Группа:

Факультет:

Зачетная книжка:

Преподаватель:

Вариант № 18





Москва

2010

Задание


Имеются следующие выборочные данные о деятельности коммерческих банков (выборка 5%-ная механическая), млн. руб.


Номер банка

п/п

Прибыль Собственный капитал
1 170 3900
2 200 4500
3 150 3000
4 90 2300
5 130 3700
6 170 3200
7 155 3780
8 190 4000
9 180 3100
10 210 4600
11 100 2200
12 220 5280
13 250 4700
14 180 4400
15 276 6500
16 220 5000
17 140 2500
18 50 1800
19 190 4200
20 210 5600
21 346 7962
22 240 5850
23 120 400
24 230 4900
25 350 8400
26 280 7088
27 163 5100
28 200 4300
29 260 6020
30 270 4800

ЗАДАНИЕ 1


По исходным данным:

Постройте статистический ряд распределения банков по признаку прибыль, образовав пять групп с равными интервалами.

Постойте графики полученного ряда распределения, графически определите значение моды и медианы.

Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, моду и медиану.

Вычислите среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п.3 для интервального ряда распределения. Объясните причину их расхождения.

Сделайте выводы по результатам выполнения задания.

Выполнение Задания 1


1.1 Построение интервального ряда распределения банков по объему прибыли


Для построения статистического ряда, характеризующего распределение банков по прибыли, необходимо вычислить величину и границы интервалов ряда.

При построении ряда с равными интервалами величина интервала h определяется по формуле


, (1)


где – наибольшее и наименьшее значения признака в исследуемой совокупности,

k- число групп интервального ряда.

Определение величины интервала по формуле (1) при заданных k = 5, xmax = 350 млн руб., xmin = 50 млн руб.:

h=(350-50)/5=60 млн руб.

При h = 60 млн руб. границы интервалов ряда распределения имеют следующий вид (табл. 2)


Таблица 2

Номер группы

Нижняя граница,

млн руб.

Верхняя граница,

млн руб.

1 50 110
2 110 170
3 170 230
4 230 290
5 290 350

Процесс группировки единиц совокупности по признаку прибыль представлен во вспомогательной (разработочной) таблице 3


Таблица 3

Разработочная таблица для построения статистического ряда распределения и аналитической группировки

Группы банков по прибыли, млн руб. Номер банка Прибыль, млн руб.

Собственный капитал,

млн руб.

1 2 3 4
50-110 4 90 2300

11 100 2200

18 50 1800
Всего 3 240 6300
110-170 3 150 3000

5 130 3700

7 155 3780

17 140 2500

23 120 400

27 163 5100
Всего 6 858 18480
170-230 1 170 3900

2 200 4500

6 170 3200

8 190 4000

9 180 3100

10 210 4600

12 220 5280

14 180 4400

16 220 5000

19 190 4200

20 210 5600

28 200 4300
Всего 12 2340 52080
230-290 13 250 4700

15 276 6500

22 240 5850

24 230 4900

26 280 7088

29 260 6020

30 270 4800
Всего 7 1806 39858
290-350 21 346 7962

25 350 8400
Всего 2 696 16362
ИТОГО 30 5940 133080

На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая таблица 4.


Таблица 4

Распределение банков по прибыли

Номер группы Группы банков по прибыли, млн руб.,

Число банков,

f

1 50-110 3
2 110-170 6
3 170-230 12
4 230-290 7
5 290-350 2

Итого 30

Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .


Таблица 5

Структура банков по прибыли

№ группы Группы банков по прибыли, млн руб. Число банков, fj

Накопленная

частота,

Sj

Накопленная

частоcть, %



в абсолютном выражении в % к итогу

1 2 3 4 5 6
1 50-110 3 10 3 10,0
2 110-170 6 20 9 30,0
3 170-230 12 40 21 70,0
4 230-290 7 23,3 28 93,3
5 290-350 2 6,7 30 100,0

Итого 30 100,0


Вывод. Анализ статистического ряда распределения изучаемой совокупности банков показывает, что распределение банков по объему прибыли не является равномерным: преобладают банки с прибылью от 170 млн руб. до 230 млн руб. (это 12 банков, доля которых составляет 40%); 30% банков имеют прибыль менее 170 млн руб., а 70% – менее 230 млн руб.


1.2 Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов


Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.

Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).


Рис. 1 Определение моды графическим методом


Для определения моды графическим способом на гистограмме распределения правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых будет модой распределения.

Конкретное значение моды для интервального ряда рассчитывается по формуле:


(3)

где хМo – нижняя граница модального интервала,

h –величина модального интервала,

fMo – частота модального интервала,

fMo-1 – частота интервала, предшествующего модальному,

fMo+1 – частота интервала, следующего за модальным.

Согласно табл. 3 модальным интервалом построенного ряда является интервал 170 – 230 млн. руб., так как его частота максимальна (f3 = 12).

Расчет моды по формуле (3):

Mo=170+60*((12-6)/((12-6)+(12-7)))=202,727 млн руб.

Вывод. Для рассматриваемой совокупности банков наиболее распространенный объем прибыли характеризуется средней величиной 202,727 млн руб.

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5).

Для определения медианы графическим способом высоту наибольшей ординаты кумуляты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.

Рис. 2. Определение медианы графическим методом


Конкретное значение медианы для интервального ряда рассчитывается по формуле:


, (4)


где хМе– нижняя граница медианного интервала,

h – величина медианного интервала,

– сумма всех частот,

fМе – частота медианного интервала,

SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).

В демонстрационном примере медианным интервалом является интервал 170 – 230 млн. руб., так как именно в этом интервале накопленная частота Sj = 21 впервые превышает величину, равную половине численности единиц совокупности


(=).


Расчет значения медианы по формуле (4):

Ме=170+60*((30/2-9)/12)=200 млн руб.

Вывод. В рассматриваемой совокупности банков половина банков имеют в среднем объем прибыли не более 200 млн руб., а другая половина – не менее 200 млн руб.


1.3 Расчет характеристик интервального ряда распределения


Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 5 строится вспомогательная таблица 6 ( – середина j-го интервала).


Таблица 6

Расчетная таблица для нахождения характеристик ряда распределения

Группы банков по объему прибыли, млн руб.

Середина интервала,

Число банков,

fj

1

2

3

4

5

6

7

50-110 80 3 240 -117,333 13924,000 41772
110-170 140 6 840 -57,333 3364,000 20184
170-230 200 12 2400 2,667 4,000 48
230-290 260 7 1820 62,667 3844,000 26908
290-350 320 2 640 112,667 14884,000 29768
Итого
30 5940

118680

Расчет средней арифметической взвешенной: (5)

=5940/30=198 млн руб.

Расчет среднего квадратического отклонения:


(6)


σ=118680/30=62,897 млн руб.

Расчет дисперсии:

σ2 =61,641 2=3956

Расчет коэффициента вариации:

(7)

Vσ=62,897*100/198=31,77 %

Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем прибыли банков составляет 198 млн руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 62,897 млн руб. (или 31,77 %), наиболее характерные значения объема прибыли находятся в пределах от 135,103 млн руб. до 260,897 млн руб. (диапазон ).

Значение Vσ = 31,77 % не превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна.

Расхождение между значениями , Мо и Ме незначительно (=198 млн руб., Мо=202,727 млн руб., Ме=200 млн руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема прибыли банков (198 млн руб.) является типичной, надежной характеристикой исследуемой совокупности банков.


1.4 Вычисление средней арифметической по исходным данным


Для расчета применяется формула средней арифметической простой:


(8)


=5940/30=198 млн руб.

Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).

ЗАДАНИЕ 2

По исходным данным:

1. Установите наличие и характер связи между признаками – прибыль и собственный капитал:

а) аналитической группировки;

б) корреляционной таблицы.

2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициентов детерминации и эмпирического корреляционного отношения.

Сделайте выводы по результатам выполнения задания.

Выполнение Задания 2


2.1 Установление наличия и характера связи между признаками прибыль и собственный капитал методами аналитической группировки и корреляционной таблицы


а. Применение метода аналитической группировки

Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Прибыль и результативным признаком Y Собственный капитал. Макет аналитической таблицы имеет следующий вид (табл. 7):


Таблица 7

Зависимость суммы прибыли банков от объема кредитных вложений

Номер группы

Группы банков по объему прибыли,

млн руб.

Число банков

Собственный капитал,

млн руб.




всего в среднем на один банк
1



2



3



4



5



Итого




Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.

Таблица 8

Зависимость суммы прибыли банков от объема кредитных вложений

Номер группы

Группы банков по объему прибыли,

млн руб.,

х

Число банков,

fj

Собственный капитал,

млн руб.




всего

в среднем на один банк,

1

2

3

4

5=4:3

1 50-100 3 6300 2100
2 110-170 6 18480 3080
3 170-230 12 52080 4340
4 230-290 7 39858 5694
5 290-350 2 16362 8181

Итого 30 133080 4436

Вывод. Анализ данных табл. 8 показывает, что с увеличением объема прибыли от группы к группе систематически возрастает и объем собственного капитала по каждой группе банков, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

б. Применение метода корреляционной таблицы.

Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j-ой строки и k-ой графы указывается число единиц совокупности, входящих в j-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.

Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – Прибыль известны из табл. 8. Для результативного признака Y – Собственный капитал величина интервала определяется по формуле (1) при k = 5, уmax = 8400 млн руб., уmin = 400 млн руб.:

h=(8400-400)/5=1600 млн руб.

Границы интервалов ряда распределения результативного признака Y имеют следующий вид (табл. 9):


Таблица 9

Номер группы

Нижняя граница,

млн руб.

Верхняя граница,

млн руб.

1 400 2000
2 2000 3600
3 3600 5200
4 5200 6800
5 6800 8400

Подсчитывая с использованием принципа полуоткрытого интервала [ ) число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 10).


Таблица 10

Распределение банков по сумме прибыли

Группы банков по объему собственного капитала, млн. руб.,

х

Число банков,

fj

400 – 2000 2
2000 – 3600 6
3600 – 5200 14
5200 – 6800 5
6800 - 8400 3
Итого 30

Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).

Таблица 11

Корреляционная таблица зависимости суммы прибыли банков от объема кредитных вложений

Группы банков по прибыли,

млн руб.

Группы банков по объему собственного капитала, млн руб.

400-2000 2000-3600 3600-5200 5200-6800 6800-8400 Итого
50-110 1 2


3
110-170 1 2 3

6
170-230
2 8 2
12
230-290

3 3 1 7
290-350



2 2
Итого 2 6 14 5 3 30

Вывод. Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между объемом кредитных вложений и суммой прибыли банков.


2.2 Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения


Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле

, (9)


где – общая дисперсия признака Y,

– межгрупповая (факторная) дисперсия признака Y.

Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле


(10)


где yi – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:


(11)

или как средняя взвешенная по частоте групп интервального ряда:


(12)


Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет по формуле (11):

=133080/30=4436 млн руб.

Для расчета общей дисперсии применяется вспомогательная таблица 12.


Таблица 12

Вспомогательная таблица для расчета общей дисперсии

Номер

банка

п/п

Собственный капитал, млн руб.


1

2

3

4

5

1 3900 -536 287296 15210000
2 4500 64 4096 20250000
3 3000 -1436 2062096 9000000
4 2300 -2136 4562496 5290000
5 3700 -736 541696 13690000
6 3200 -1236 1527696 10240000
7 3780 -656 430336 14288400
8 4000 -436 190096 16000000
9 3100 -1336 1784896 9610000
10 4600 164 26896 21160000
11 2200 -2236 4999696 4840000
12 5280 844 712336 27878400
13 4700 264 69696 22090000
14 4400 -36 1296 19360000
15 6500 2064 4260096 42250000
16 5000 564 318096 25000000
17 2500 -1936 3748096 6250000
18 1800 -2636 6948496 3240000
19 4200 -236 55696 17640000
20 5600 1164 1354896 31360000
21 7962 3526 12432676 63393444
22 5850 1414 1999396 34222500
23 400 -4036 16289296 160000
24 4900 464 215296 24010000
25 8400 3964 15713296 70560000
26 7088 2652 7033104 50239744
27 5100 664 440896 26010000
28 4300 -136 18496 18490000
29 6020 1584 2509056 36240400
30 4800 364 132496 23040000
Итого 133080 0 90670008 681012888

Расчет общей дисперсии по формуле (10):

=90670008/30=3022333,6

Общая дисперсия может быть также рассчитана по формуле


,


где – средняя из квадратов значений результативного признака,

– квадрат средней величины значений результативного признака.

Для демонстрационного примера

=681012888/30=22700429,6

=19678096

Тогда


=-=22700429,6-19678096=3022333,6


Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле


, (13)


где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).

Таблица 13

Вспомогательная таблица для расчета межгрупповой дисперсии

Группы банков по прибыли,

млн руб.

Число банков,

Среднее значение в группе

1

2

3

4

5

50-110 3 2100 -2336 16370688
110-170 6 3080 -1356 11032416
170-230 12 4340 -96 110592
230-290 7 5694 1258 11077948
290-350 2 8181 3745 28050050
Итого 30

66641694

Расчет межгрупповой дисперсии по формуле (11):

=66641694/30=2221389,8

Расчет эмпирического коэффициента детерминации по формуле (9):

=2221389,8/3022333,6=0,735 или 73,5%

Вывод. 75,3% вариации суммы прибыли банков обусловлено вариацией объема прибыли, а 24,7% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле


(14)


Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):

Таблица 14

Шкала Чэддока

0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99

Характеристика

силы связи

Слабая Умеренная Заметная Тесная Весьма тесная

Расчет эмпирического корреляционного отношения по формуле (14):

=0,857 или 85,7 %

Вывод. Согласно шкале Чэддока связь между объемом прибыли и суммой собственного капитала банков является