Реферат: Анализ статистической совокупности
Название: Анализ статистической совокупности Раздел: Рефераты по маркетингу Тип: реферат | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задача статистического исследования – освоить методику анализа структуры статистической совокупности с использованием компьютерных средств экономико-статистических расчетов, научится использовать аналитические группировки в выявлении взаимосвязей между явлениями. В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц. Таблица П1 Исходные данные
РЕЗУЛЬТАТИВНЫЕ ТАБЛИЦЫ И ГРАФИКИ Диаграмма 1 Аномальные значения признаков на диаграмме рассеяния Таблица 2 Аномальные единицы наблюдения
Таблица 3 Описательные статистики
Таблица 4,а Предельные ошибки выборки
Таблица 4,б Предельные ошибки выборки
Таблица 5 Выборочные показатели вариации и асимметрии
Таблица 6 Выходная таблица инструмента ГИСТОГРАММА
Таблица 7 Интервальный ряд распределения предприятий по стоимости основных производственных фондов
Диаграмма 2 Анализ выборочной совокупности. Задача 1. На построенной диаграмме рассеяния (см. Диаграмма 1) визуально видно наличие аномальных точек. Это предприятие №25 (среднегодовая стоимость основных производственных фондов – 45 млн руб.; выпуск продукции – 224 млн руб.) и предприятие №31 (среднегодовая стоимость основных производственных фондов – 330 млн руб.; выпуск продукции – 53 млн руб.). Исключим аномальные единицы наблюдения из первичных данных. Внесем аномальные единицы наблюдения в таблицу 2. Задача 2. На основе имеющихся данных составим таблицу Таблица 8 Описательные статистики выборочной совокупности
В таблицу внесены обобщающие статистические показатели совокупности, исчисляемые на основе анализа вариационных рядов распределения Задача 3. 3,а. Если величина Vσ удовлетворяет условию0%<Vσ ≤40%, то степень колеблемости незначительна. В данной совокупности выполняется это условие. 0%<23,0663639≤40% 0%<23,79170449≤40% 3,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными. 3,в.
Если Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдения при выполнении задания 1, некоторые аномалии в первичных данных продолжают сохраняться. Аномалии следует выявить и удалить из выборки. 3,г. Обобщим данные и составим таблицу Таблица 9 Распределение значений признака по диапазонам рассеяния признака относительно
Согласно вероятностной теореме П.Л. Чебышева, следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в диапазоне ( В нормально распределенных и близких к ним рядах вероятные оценки диапазонов рассеяния значений признака таковы: - 68,3% войдет в диапазон ( - 95,4% попадет в диапазон ( - 99,7% появится в диапазоне ( Соотношение (1) известно как правило «трех сигм». В нашем случае значения каждого из признаков отлично от правила «трех сигм». Значения второго признака ближе к правилу. Задача 4. 4,а. Размах вариации R= Х max -Х min . R для первого признака – 204 млн руб., для второго – 140 млн руб.. Размах вариации устанавливает предельное значение амплитуды колебаний признака. Среднее линейное отклонение по первому признаку равно 35,44, по второму - 28,42222222. В условиях симметричного и нормального, а также близких к ним распределениям между показателями σ и в имеет место равенство: в ≈ 0,8 σ. Первый признак: в ≈ 0,8*46,04815113 ≈ 36,838520904. Второй признак: в ≈ 0,8*34,06179026 ≈ 27,249432208 Рассчитанные по формуле значения приблизительно равны значениям, рассчитанным с помощью программы MSExcel. Дисперсия σ
n
2
оценивает средний квадрат отклонений ( Среднее квадратическое отклонение σ
показывает, насколько в среднем отклоняются индивидуальные значения признака хi
от их средней величины 4,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными. 4,в.
Для оценки надежности (типичности) средней величины х можно воспользоваться значением показателя вариации Vσ
. Если его значение невелико, т.е. <40% (как в нашем случае), то индивидуальные значения признака хi
мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина 4,г. Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. И для первого (0,708678471), и для второго (0,856286955) признака асимметрия левосторонняя. │As│>0,5. Следовательно, асимметрия существенная. Задача 5. Интервальный вариационный ряд распределения единиц совокупности по признаку представлен в таблице 7. Гистограмма и кумулята интервального ряда распределения предприятий изображены на Диаграмме 2. Для полученного интервального ряда значение моды рассчитывается по формуле:
Значение моды в таблице 3 – Мо=167 млн руб.. Для несгруппированных данных мода - это значение признака с наибольшей частотой появления. В интервальном ряду вычисление моды весьма условно. Поэтому между ними могут быть различия. Анализ генеральной совокупности. Задача 1. На основе имеющихся данных составим таблицу Таблица 10 Описательные статистики генеральной совокупности
В нашем случае обе дисперсии совпадают. Rn =204 млн руб. RN =6σN RN =281 млн руб. Значение размаха вариации различно, поскольку из генеральной совокупности были удалены аномальные значения признаков. Задача 2. 2, a . Средняя ошибка выборки (µЧ̃ ) первого признака - 8,550926996 млн руб., второго - 6,325115661млн руб.. 2,б.
Предельная ошибка выборки Δ
Ч̃
определяет границы, в пределах которых лежит генеральная средняя В математической статистике доказано, что: Δ Ч̃ = t * µЧ̃ . Составим таблицу Таблица 8 Предельные ошибки выборки и ожидаемые границы для генеральных средних
Таким образом, предельная ошибка выборки позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы. Задача 3. Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. Для первого признака асимметрия левосторонняя (-0,03462322), для второго – правосторонняя (0,085504193). │As│≤0,25. Следовательно, асимметрия незначительная. Для первого признака Ek>0. Следовательно, вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним. Для второго признака Ek<0. Следовательно, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от Хmax до Хmin . │Ek│ не значителен. Следовательно, кривая распределения незначительно отличается от нормальной. |