Контрольная работа: Процесс обработки статистикой информации
Название: Процесс обработки статистикой информации Раздел: Рефераты по экономико-математическому моделированию Тип: контрольная работа | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задача № 1По имеющимся данным о технико-экономических показателях работы 30 мебельных предприятий за год (исходные данные, табл.1) необходимо провести следующую расчетно-подготовительную работу: 1) Используя данные по 12 первичным показателям (табл.1), рассчитать (с 13-го по 24-й) недостающие вторичные показатели. 2) Составить одну карточку-макет, в которой должны содержаться только наименования двух взаимосвязанных признаков (факторного и результативного) и их нумерация в соответствии с нумерацией граф табл.1. 3) В соответствии с карточкой-макетом подготовить 30 карточек, в каждую из которых записать только цифровые данные по двум взаимосвязанным признакам относительно каждого предприятия. Карточка-макет :
Карточки по числу предприятий:
Задача № 2Основываясь на данных из карточек, необходимо провести следующее упорядочение. 1) По каждому признаку следует составить ранжированный ряд (в порядке убывания). 2) Для каждого ранжированного ряда надо определить количество групп и величину интервала в группах по формуле оптимального интервала , (1) где iопт - величина оптимального интервала, при котором вариационный ряд не будет громоздким, и в нем не исчезнут особенности изучаемого явления; хтах , хт in - соответственно наибольшее и наименьшее значение ранжированного ряда; N - число единиц совокупности. 3) Составить групповые таблицы отдельно по каждому из ранжированных рядов. Задача № 3 На основе составленных групповых таблиц и имеющихся 30 карточек построить аналитическую комбинационную таблицу по двум взаимосвязанным признакам. Таблица 6 - Аналитическая комбинационная таблица
Задача № 4Проанализировав данные аналитической комбинационной таблицы, провести следующие построения, расчеты и анализ данных: 1) Перестроить комбинационную таблицу с использованием средних величин. 2) На основе исчисленных групповых средних величин построить эмпирический график зависимости результативного признака у от факторного признака х, т.е. фактическую линию регрессии между ними. 3) Используя данные перестроенной комбинационной таблицы, определить по результативному межгрупповую дисперсию, среднеквадратическое отклонение и коэффициент вариации. 4) Исходя из экономической сущности зависимости между показателями по данным перестроенной комбинационной таблицы и графику, сделать предварительный вывод о характере связи между двумя показателями. статистика информация групповая таблица Таблица 7 - Перестроенная комбинационная таблица (4 и 5 столбцы добавлены самостоятельно)
Расчет таблицы 1) для факторного признака. I способ: (514,189+705,474+694,352+527,983+549,935) /5=598,387 (763,771+766,240+741,971+744,156+766,243+762,006+811,525+828, 829+785,885+869,616+866,903+883,186+819,397+792,497+145,484)/14 =741,631 (944,784+1080,645+970,109+1039,449+958,673) /5=1030,732 (1163,188+1253,172+1203,061) /3=1206,474 (1408,647+1439,286) /2=1423,967 1635,723 IIспособ: , где f = n , = N 2) для результативного признака I способ: (127,956+121,967+134,748+136,145) /4=130, 204 (150,480+145,484) /2=147,982 (165,943+160,531+160,796) /3=162,423 (173,260+175,730+174,466+179,711+173,761+174,845+178,178+ 175,982+176,949+180,781+175,037+175,100+179,640+178,086+173,690) /15=176,415 (182,672+191,447+196,057+193,673+183,161) /5=189,402 209,137 IIспособ: , где f = n , = N При сравнении общих средних величин оказалось, что их значения для результативного признака практически совпадают, а для факторного - различны. Наиболее точным является расчет первым способом, т.к. в вычислениях используются конкретные значения признака, а во втором способе учитываются границы интервала, которому принадлежат значения исследуемого признака. Рисунок 1 - Эмпирический график зависимости результативного признака Yот факторного X. Из графика видно, что зависимость между признаками носит линейный характер. На данном интервале функция возрастает, т.е. чем больше факторный признак, тем соответственно больше результативный. Считаю, что график построен верно, т.к. логично предположить, что чем больше выработка продукции на одного работающего, тем выше его средняя заработная плата. Определение межгрупповой дисперсии (2) Определение коэффициента вариации , (3) Определение среднеквадратического отклонения (4) Используя значения таблицы 7, получим Задача № 5Используя данные комбинационной таблицы и опираясь на выводы, полученные на основе графического анализа характера связи между двумя показателями, следует выделить определенные особенности и свойства изучаемой совокупности. Для этого необходимо провести ряд статистических расчетов. 1. Определить корреляционную зависимость между факторным и результативным признаками. При этом выбор уравнения связи должен производиться на основе выявления экономической сущности зависимости показателей между собой с использованием графического способа. 2. Определить показатели тесноты связи (коэффициент корреляции - r или корреляционное отношение - η ). 3. Нанести уравнение регрессии на график, полученный в задаче № 4. Проследить, как выявленная методом корреляционного анализа теоретическая линия регрессии (прямая или кривая) расположена относительно эмпирической. Определение коэффициента корреляции. Коэффициент корреляции (между двумя признаками) характеризует интенсивность связи между ними; он может изменяться в пределах от - 1,0 до +1,0. Знак коэффициента характеризует направление изменения результативного признака при увеличении факторного. (5) Таблица 8 - Расчет коэффициента корреляции
Проверим значимость коэффициента корреляции, т.е. возможность отвергнуть теорию о некоррелированности рассматриваемых величин. Для этого определим коэффициент (6) Для нашего примера В справочнике найдем табличное значение критерия значимости. При заданной вероятности Р=0,95 и N=30 . Условие, при котором отвергают гипотезу о некоррелированности исследуемых величин . Условие выполняется, следовательно гипотезу некоррелированности признаков можно отвергнуть с заданным уровнем надежности. Построение линейной регрессионной модели. Наибольшее распространение получил метод наименьших квадратов МНК, при использовании которого ставится требование, чтобы сумма квадратов разностей между эмпирическими и теоретическими значениями была минимальной. Оценка линейности связи Для решения поставленной задачи используем дисперсионный анализ. Если теоретическая линейная регрессия действительно выражает форму эмпирической связи, то отклонения эмпирической линии регрессии от теоретической будут случайными. В случае если в действительности связь не прямолинейна, отклонения не будут случайными, а будут отражать кривизну эмпирической регрессии. Поэтому вопрос о линейной регрессии может быть решен путем сравнения неслучайных и случайных отклонений. Неслучайные отклонения характеризуются дисперсией отклонения теоретической регрессии от среднего. Случайные отклонения характеризуются дисперсией остатка. Определение общей дисперсии по результативному признаку
где К1 - число степеней свободы, приходящееся на регрессию; равно числу независимых переменных (для парной регрессии К1 =1) К2 -число степеней свободы, приходящееся на остаток (К2 =N - К1 -1=28) Y - теоретическое значение результативного признака, найденное по уравнению парной регрессии. Таблица 9 - Расчет общей дисперсии
Таким образом: S1 =10040,86/1=10040,86 S2 =93010,09/28=3321,79 Для установления соответствия эмпирической регрессии линейной форме связи определяют дисперсионное отношение F=S1 /S2 и сравнивают со значением из справочника при заданной надежности. F=10040,86/3321,79=3,03, табличное значение F=4,2. Фактическое значение меньше табличного, значит прямолинейная форма связи не соответствует эмпирическим данным. Рисунок 2 - Графическая интерпретация теоретической и эмпирической регрессии Корреляционный анализ статистических данных показал относительно высокую степень связи между факторным и результативным признаками. Регрессионный анализ позволилподобрать регрессионную линейную модель методом наименьших квадратов. Насколько эта модель адекватна экспериментальным данным доказала проверка с помощью дисперсионного анализа. В частности, была проверена гипотеза о том, что регрессионная модель точнее описывает результаты эксперимента, чем среднее по всем опытам. С достоверностью 95 % эта гипотеза подтвердилась. Задача № 6Для изучения показателей производительности труда на предприятии, число рабочих на котором составляет 5000 человек, было проведено методом случайного бесповторного отбора обследование квалификации рабочих в процентном отношении (таблица 10). Таблица 10
С заданной вероятностью следует определить: а) процентное соотношение выборки для проведения обследования; б) величину средней ошибки выборки; в) предельную ошибку выборочной сpeднeй; г) пределы, в которых находится средний тарифный разряд рабочих предприятия. Средняя ошибка выборки для средней показывает расхождение выборочной и генеральной средней. При случайном бесповторном отборе она рассчитывается по следующей формуле , (8) где µ-средняя ошибка выборочной вредней; n - численность выборки; N - численность генеральной совокупности; σ2 - дисперсия выборочной совокупности. Предельная ошибка выборки рассчитывается по следующей формуле ∆=µ*t, (9) где ∆ - предельная ошибка выборки; µ - средняя ошибка выборочной средней; t=2,9 - коэффициент доверия, зависящий отзначения вероятности (р). Пределы, в которых находится данная выборочная средняя, определяются по следующей формуле , (10) где числовые значения пределов; - среднее значение выборочной совокупности; ∆ - предельная ошибка выборки. Определим процентное соотношение выборки Для этого количество рабочих каждого разряда разделим на количество всех рабочих и умножим на 100%. Для удобства составим таблицу по результатам расчета Таблица 11 - Результаты обработки исходных данных
Для нахождения величины средней ошибки выборки необходимо определить величину дисперсии. Способ I - Для этого найдем математическое ожидание , (11) где х - число рабочих разряда; р - заданная вероятность разряда Далее, дисперсия равна ( 12) Таким образом, средняя ошибка выборки Предельная ошибка выборки Средний тарифный разряд рабочих предприятия равен 3,5. Предел нахождения выборочной средней Способ II - Определим дисперсию: Предельная ошибка выборки Предел нахождения выборочной средней Оба способами дали практически одинаковый результат, что говорит о верности расчетов. Задача № 7Сведения об объемах вывозки древесины по 10 леспромхозам представлены в таблице 11. Таблица 11
Проанализировать данные динамического ряда по второму леспромхозу: 1) Исчислить базисным методом абсолютный прирост, коэффициент роста, темп роста, темп прироста и значение одного процента прироста в абсолютном выражении 2) Представить данные динамики объема вывозки древесины за 1976-1985гг. графически 3) Провести выравнивание динамического ряда по способу наименьших квадратов. Абсолютный прирост - разность между сравниваемым уровнем и уровнем более раннего периода, принятым за базу сравнения. При расчете базисным методом за базу принимают значение одного и того же уровня, например, начального. ∆i =yi - y0, (13) ∆1 =172-169=3 (тыс. м3 /год) ∆2 =183-169=14 (тыс. м3 /2года) ∆3 =189-169=20 (тыс. м3 /3года) ∆4 =198-169=29 (тыс. м3 /4года) ∆5 =212-169=43 (тыс. м3 /5лет) ∆6 =235-169=66 (тыс. м3 /6лет) ∆7 =249-169=80 (тыс. м3 /7лет) ∆8 =268-169=99 (тыс. м3 /8лет) ∆9 =301-169=132 (тыс. м3 /9лет) Коэффициент роста Ki определяется как отношение данного уровня к предыдущему или базисному, показывает относительную скорость изменения ряда. Если коэффициент роста выражается в процентах, то его называют темпом роста. Темп роста - отношение сравниваемого уровня (боле позднего) к уровню, принятому за базу сравнения (более раннему). Данный показатель говорит о том, сколько процентов составил сравниваемый уровень по отношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше уровня, принятого за базу. Ki /0 = yi /y0 , (14) K1/0 =172/169=1,018 (раз) рост 1,8% K2/0 =183/169=1,083 (раз) рост 8,3% K3/0 =189/169=1,118 (раз) рост 11,8% K4/0 =198/169=1,171 (раз) рост 17,1% K5/0 =212/169=1,254 (раз) рост 25,4% K6/0 =235/169=1,391 (раз) рост 39,1% K7/0 =249/169=1,473 (раз) рост 47,3% K8/0 =268/169=1,586 (раз) рост 58,6% K9/0 =301/169=1,781 (раз) рост 78,1% Темп прироста (относительный прирост) - отношение абсолютного изменения к базисному уровню или Тпi =Ki *100-100, (15), Тп1 =1,018*100-100=1,8 % Тп2 =1,083*100-100=8,3 % Тп3 =1,118*100-100=11,8 % Тп4 =1,171*100-100=17,1 % Тп5 =1,254*100-100=25,4 % Тп6 =1,391*100-100=39,1 % Тп7 =1,473*100-100=47,3 % Тп8 =1,586*100-100=56,8 % Тп9 =1,78*100-100=78,1 % Абсолютное значение 1% прироста равно сотой части базисного уровня 132/78=1,69 (тыс. м3) или 169/100=1,69 (тыс. м3) Простейшей системой корреляционной связи является линейная связь между двумя признаками - парная линейная корреляция. Практическое ее значение в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии = а + bt, ( 16) где - среднее значение результативного признака; t - порядковый номер периодов или моментов времени; a - свободный член уравнении; b - коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения. Параметры уравнения (16) рассчитываются методом наименьших квадратов (МНК). Система нормальных уравнений в данном случае имеет вид: Исходное условие МНК для прямой линии имеет вид: Поиск параметров уравнения можно упростить, если отчет времени производить так, чтобы сумма показателей времени изучаемого ряда динамики была равна нулю (). При четном числе уровней динамического ряда (как в нашем случае) периоды верхнее половины ряда (до середины) нумеруются - 1, - 3, - 5 и т.д., а нижней - +1, +3, +5 и т.д. При этом условии будет равна нулю, и система нормальных уравнений преобразуется следующим образом: Откуда = 217,6 и = 169,01 Расчет параметров уравнения прямой представлен в таблице 12. Таблица 12
По рассчитанным параметрам записываем уравнение прямой ряда динамики: = 217,6 +169,01* t Выравнивание динамического ряда представлено на рисунке 4. Задача № 8По двум предприятиям имеются данные о количестве выработанной продукции и себестоимости единицы продукции. Таблица 13 - исходные данные
1) Определить индексы средней себестоимости по трем видам продукции: а) Индивидуальные б) Переменного состава; в) Постоянного (фиксированного) состава; г) Структурных сдвигов 2) Провести анализ полученных результатов Индекс - это показатель сравнения двух состоянии одного и того же явления. Каждый индекс включает два вида данных: оцениваемые данные, которые принято называть отчетными и обозначать значком "1", и данные, которые используются в качестве базы сравнения, - базисные, обозначаемые значком "О". Индекс, который строится как сравнение обобщенных величин, называется сводным, или общим. Если же сравниваются необобщенные величины, то индекс называется индивидуальным. Общее изменение образуется под влиянием изменений себестоимости на отдельные товары. Таким образом, индивидуальные индексы : , (17) где р11 ,р12 - отчетная себестоимость продукции по 1-му и 2-му предприятиям; р01 ,р02 - плановая себестоимость продукции по 1-му и 2-му предприятиям Продукция А: Продукция В: Продукция Г: Индивидуальные индексы характеризуют относительное изменение себестоимости единицы каждого вида продукции в отчетном периоде по сравнению с базисным. Данные значения показывают, что себестоимость продукции А снизилась в 0,94 раза (на 6%) и в 0,75 раз (на 25%) на первом предприятии и втором предприятии соответственно. Себестоимость продукции В - снизилась в 0,98 раз (на 2%) и в 0,88 раз (на 12%); продукции Г - снизилась в 0,95 раз (на 5%) и в 0,92 раза (на 8%). Для определения общего изменения себестоимости продукции на обоих предприятиях, необходимо рассчитать агрегатный индекс. Агрегатные индексы качественных показателей могут быть рассчитаны как индексы переменного состава и индексы фиксированного состава . В индексах переменного состава сопоставляются показатели, рассчитанные на базе изменяющихся структур явлений, а в индексах фиксированного состава - на базе неизменной структуры явлений. Индексы позволяют проанализировать изменения средних величин. Отношение двух взвешенных средних с меняющимися (переменными) весами, показывающее изменение индексируемой величины, носит название индекс переменного состава. Изменение средней себестоимости , (18) где - средняя отчетная себестоимость продукции по 1-му и 2-му предприятиям; - средняя плановая себестоимость продукции по 1-му и 2-му предприятиям Формула средней себестоимости , (19) где - себестоимость продукции на i-ом предприятии - структура выработки продукции на i-ом предприятии ПродукцияА: Продукция В: Продукция Г: Тогда индекс: Продукция А: Продукция В: Продукция Г: Рассчитанный выше признак отражает не только изменение осредняемого признака, но и структуру совокупности. На основе индекса средней величины могут быть рассчитаны индексы самого осредняемого признака при постоянстве структуры (индекс постоянного состава ) и индекс структуры (структурных сдвигов ). Индекс постоянного состава , (20) Продукция А: Продукция В: Продукция Г: Рассчитанный выше индекс показывает, какого было изменение средней себестоимости продукции по двум предприятиям, если бы удельный вес выработанной продукции на предприятиях в базисном периоде был таким же, как и в отчетном. То есть себестоимость продукции А снизилась бы на 12%, продукции В - на 7% и продукции Г - на 7%. Величины индексов переменного и фиксированного состава получились практически одинаковыми, что свидетельствует об незначительных структурных сдвигах Величина взвешенной средней зависит от двух факторов - изменения отдельной себестоимости и от изменения в структуре весов. Поэтому, если веса не остаются постоянными, индекс фиксированного состава будет отличаться от индекса переменного состава в меру отношения, получившего название индекс структурных сдвигов , (21) Продукция А: Продукция В: Продукция Г: Формулы индексов (23) и (24) основаны на общепринятом правиле, по которому структура совокупности (выработки продукции) как первичная характеристика при индексации себестоимости закрепляется на уровне отчетного периода, а себестоимость как вторичная характеристика при индексации структуры закрепляется на уровне базисного периода. То есть, среднее снижение себестоимости на предприятиях было примерно таким же, как и снижение средней себестоимости для разных видов продукции. За счет изменения структуры выработки продукции средняя себестоимость продукции А снизилась на 0,2% (или на 6 коп.), продукции В увеличилась на 0,1% (или на 3 коп.). Средняя себестоимость продукции Г осталась без изменений. Задача № 9Имеются данные о выпуске однородной продукции по трем предприятиям отрасли. Таблица 14 - Исходные данные
1) Определить: а) Индексы производительности труда на каждом предприятии и по трем предприятиям вместе (переменного состава) б) Индекс фиксированного состава в) Индекс структурных сдвигов 2) Провести анализ полученных результатов Индекс производительности можно рассматривать как показатель влияния производительности труда на объем выпуска продукции. Такое предположение базируется на следующей связи признаков: произв-сть труда * ср. списочное число рабочих = объем выпуска продукции w*f= Q, (22) Системе признаков соответствует система индексов (т.е. показателей их изменений). Индекс производительности труда , (23) , (24) Предприятие №1: Предприятие №2: Предприятие №3: По трем предприятиям: Опираясь на формулы (20) и (21), используемые в задаче № 8, найдем индекс фиксированного состава и структурных сдвигов. Индекс фиксированного состава Предприятие №1: Предприятие №2: Предприятие №3: По трем предприятиям: Полученные цифры говорят об изменении производительности труда в большую сторону при условии, если бы удельный вес объема выпуска продукции в базисном периоде был таким же, как в отчетном. Индекс структурных сдвигов Предприятие №1: Предприятие №2: Предприятие №3: По трем предприятиям: Значения индексов структуры показывают, что изменение структуры производства не повлияло на производительность труда. |