Лабораторная работа № 2. ПОКАЗАТЕЛИ ЗНАЧЕНИЙ ЦЕНТРА И РАЗМАХОВ ВАРИАЦИЙ СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
Цель работы: приобретение навыков обработки и обобщения индивидуальных значений одного и того же признака у различных единиц совокупности.
Задание. Определить среднюю арифметическую интервального вариационного ряда; медиану; моду; медиану и моду графически по известной кумуляте и гистограмме ряда распределения; размах вариации; среднее линейное отклонение; дисперсию; среднее квадратическое отклонение; квартильное отклонение; первую, вторую и третью квартили; относительные показатели вариации (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации, относительный показатель квартильной вариации); показатель фондовой и децильной дифференциации.
Условие. В качестве условия используется сгруппированный вариационный ряд предшествующей лабораторной работы №1.
Таблица 4.
Номер варианты |
Рентабельность активов |
Кол-во банков (частота) |
1
|
0,8-1,04 |
2 |
2
|
1,04-1,28 |
4 |
3
|
1,28-1,52 |
7 |
4
|
1,52-1,76 |
5 |
5
|
1,76-2,0 |
1 |
6
|
2,0 и более |
1 |
ИТОГО: |
20 |
Выполнение задания. Изучение средних величин первичной статистической информации имеет важное значения для анализа изучаемого признака в исследуемой совокупности разрозненных данных. Средняя величина является обобщающей характеристикой представленного ряда величин, отражает его типичный уровень в конкретных условиях времени и места.
1. Средняя арифметическая дискретного ряда рассчитывается по формуле
, (4)
1,4075.
В интервальном вариационном ряду средняя арифметическая определяется по другой формуле
, (5)
где - середина соответствующего интервала вариант значений признака, - частота повторений данного варианта, j – номер варианты.
В таблице 5 приведены значения середин соответствующих интервалов ряда вариант.
Таблица 5.
Рентабельность активов |
Кол-во банков (частота) |
Середина интервала |
0,8-1,04 |
2 |
0,92 |
1,04-1,28 |
4 |
1,16 |
1,28-1,52 |
7 |
1,4 |
1,52-1,76 |
5 |
1,64 |
1,76-2,0 |
1 |
1,88 |
2,0 и более |
1 |
2,12 |
Значение вычисляется по формуле (5)
.
2. Медиана соответствует варианте, стоящей в середине ранжированного ряда. Её положение в ряду определяется номером
, (6)
где N – число единиц совокупности. В данном примере N = 20 (см. п. 3, лаб. раб. №1) и
. Для определения величины медианы интервального вариационного ряда (табл. 4) используется формула:
, (7)
где - нижняя граница медианного интервала, h - величина интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.
По накопленной частоте рис. 3 определяем, что медиана находится в интервале 1,28-1,52 и вспомогательные параметры соответственно равны: = 1,28; h =0,24; = 6; = 7 .
.
Полученное значение медианы представлено графически на рис. 7 как абсцисса середины промежутка ординат накопленных частот в пределах от 0 до 20 кумуляты ряда распределения. Практически это означает, что 50% банков с доходами от 50 до 100 млн. руб. имеют рентабельность активов менее 1,434 , остальные – более 1,434 .
3. Мода – наиболее часто встречающееся значение признака совокупности.
Поскольку наибольшая частота = 7 соответствует тому же интервалу 1,28-1,52, то мода находится в этом же интервале. Её величину определяют по формуле:
, (8)
где - нижняя граница модального интервала, - частота, соответствующая модальному интервалу, - предмодальная частота, - послемодальная частота.
Для приведенного вариационного ряда с равными интервалами используем формулу (7), тогда
.
Мода как и медиана может быть определена графически по известной гистограмме рис. 6. Для этого правая вершина модального прямоугольника соединяется с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых является модой ряда распределения (рис. 6).
Таким образом, в данной совокупности наиболее часто встречается рентабельность активов равная 1,424 для банков с доходами от 50 до 100 млн. руб.
Замечание 1: Различаются моды дискретного и вариационного интервального рядов. Первые устанавливаются непосредственно по определению, вторые применением формулы (7).
Замечание 2: В симметричных рядах все перечисленные средние показатели одинаковы ==. Поэтому для общей характеристики ряда достаточно вычислить среднюю арифметическую величину.
Замечание 3: Для асимметричных рядов распределения медиана является наиболее предпочтительной характеристикой центра распределения, потому что находится между средней арифметической и модой.
4. Размахом вариации называется разность между максимальным и минимальным значениями признака совокупности (рис. 1).
R = xmax - xmin . (9)
Используя данные лабораторной работы № 1 R = 2 - 0,8 = 1,2 .
5. Среднее линейное отклонение вычисляется по следующим формулам:
для сгруппированных данных рис. 3
, (10)
где K – число групп совокупности, наибольшее значение варианты;
для не сгруппированных данных рис. 1, 2 (1,4075)
. (11)
Тогда применяя формулы (9) и (10) в среде Excel, получается, = 0,2232 , = 0,26525.
а). |
б). |
|
Рис. 10 |
Замечание 4: Средние линейные отклонения для данных, сгруппированных различным образом, могут отличаться.
6. Дисперсия - это средняя из квадратов отклонений вариантов значений признака от их средней величины. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии. Различают дисперсию для сгруппированных данных
, (12)
где K – число групп совокупности, наибольшее значение варианты;
для не сгруппированных данных
. (13)
Дисперсия сгруппированных данных 1,71648/20 = 0,085824; среднее квадратическое отклонение 0,292957 вычислены по данным рис. 10 б.
Дисперсия и среднеквадратическое отклонение дискретного ряда представлены на рис. 11.
Рис. 11 |
8. Квартили – значения признака в ранжированном ряду распределения, выбранные специальным образом. Четверть единиц должна быть меньше по величине, чем Q1; другая четверть единиц заключена между значениями Q1 и Q2; третья четверть единиц - между значениями Q2 и Q3; остальные превосходят Q3 . Значения Qi () вычисляются по формула аналогичным формуле для расчета медианы:
, (14)
где - нижняя граница интервала, в котором находится первая квартиль, - сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль, - частота интервала, в котором находится первая квартиль. Таким же образом определяются Q2 и Q3 .
, (15)
, (16)
Вычислим первую, вторую и третью квартили по формулам (14)-(16):
= 1,235 ;
= 1, 434 ;
= 1,652 .
Сравним полученные величины квартилей с величинами, полученными применением статистических функций «КВАРТИЛЬ» порядка 1, 2 и 3 к дискретному ранжированному ряду (рис. 2) в программной среде Excel рис. 12.
Рис. 12
Замечание 5: Вторая квартиль должна совпадать с медианой (7) для интервального вариационного ряда (табл. 4).
Квартильное отклонение Q можно использовать для обобщения характеристики вариаций признаков в рассматриваемой совокупности, если, по каким-либо причинам, невозможно определение крайних значений рядов распределения с открытыми границами
. (17)
Для симметричных или мало-асимметричных распределений Q.
= 0,2085 = 0,19530 .
10. Относительные показатели вариации используются для сравнения колеблемости различных признаков в одной и той же совокупности или при сравнении колеблемости одного и того же признака в нескольких совокупностях.
Коэффициент осцилляции , (18)
относительное линейное отклонение , (19)
коэффициент вариации , (20)
относительный показатель квартильной вариации ; (21)
= 84,27% ;
= 15,67% ;
= 20,57% ;
= 14,54% .
Совокупность является однородной, если коэффициент вариации не превышает 33%. Поскольку = 20,57% < 33% , то по размеру рентабельности и прибыли совокупность банков является однородной.
11. Показатель фондовой дифференциации рассчитывается по первичным данным и характеризует отношение средней величины из 10% наибольших значений совокупности к средней величине из 10% наименьших значений совокупности
. (22)
Два коммерческих банка, что составляет 10% от общего количества банков, имеют наибольший уровень рентабельности 1,98 и 2 (см. рис. 2), поэтому == 1,99 . И два коммерческих банка имеют наименьший уровень рентабельности 0,8 и 0,85 , поэтому == 0,825 . Следовательно, коэффициент фондовой дифференциации будет таким:
= 2,412 .
Это означает, что размер рентабельности у 10% банков с наивысшими доходами в 2,4 раза превышает размер прибыли 10% коммерческих банков с наименьшими доходами.
Для определения децильной дифференциации используются формулы расчета квартилей. Сначала находится номер первой децили , затем девятой . 2,1 ; 18,9 .
= 1,052 ;
= 1,803 .
Коэффициент децильной дифференциации устанавливается из соотношения
. (23)
= 1,714 .
Это означает, что отношение децили наиболее рентабельных банков в совокупности к децили наименее рентабельных банков составляет 1,714. Таким образом, уровень рентабельности наиболее прибыльных банков в 1,714 раз выше уровня наименее прибыльных банков.
Выводы. Выводы содержатся в каждом пункте выполненного задания.
Варианты заданий. Варианты указаны римскими цифрами в лабораторной работе №1.