Реферат: Статистика как наука 2
Название: Статистика как наука 2 Раздел: Рефераты по маркетингу Тип: реферат | |||||||||||||||||||||||||||||||||
1. 2. Предмет статистики как науки. Предметом исследования статистики является область массовых социально-экономических явлений общества. Статистика изучает количественную сторону этих явлений в неразрывной связи с их качественной стороной в конкретных условиях места и времени. Она включает в сферу своего исследования также технические и природные факторы, которые влияют на изменение количественных сторон массовых явлений. Цель статистического исследования заключается в раскрытии сущности и закономерностей массовых явлений и процессов. Основными понятиями статистической науки являются: совокупность, показатель, вариация и закономерность. Статистическая совокупность - это множество однородных элементов или явлений, связанных общими чертами и признаками, существование которых обусловлено общими причинами. Однородность не означает полного соответствия всех единиц совокупности. Речь идет о наличии общего свойства или признака для всех единиц совокупности. Статистический показатель - это количественное выражение исследуемого явления. Вариация (варьирующие признаки) - это изменение значения признака при переходе от одной единицы совокупности к другой. Статистическая закономерность - это форма проявления повторяемости, последовательности, порядка изменений в массовых явлениях под воздействием определенных причин. Они позволяют определить тенденции развития, типические массовые явления, выделить случайные, единичные явления. 3. Организация и задачи статистики на современном этапе. Для современного уровня статистической науки характерно то, что наряду с развитием статистических и экономико-математических методов анализа социально-экономических явлений все более широко используется компьютерная техника. Это не только значительно расширяет охват совокупностей, но и совершенствует саму систему статистического анализа. В настоящее время термин «статистика» используется в двух основных значениях. Во-первых, как особая отрасль практической деятельности по сбору, обработке и анализу массовых количественных данных о социально-экономическом состоянии страны, ее отдельных отраслей, отдельных регионов, отдельных предприятий. Во-вторых, как наука, которая разрабатывает теоретические положения и методы, используемые статистической практикой. Следует иметь в виду, что статистика базируется только на тех выводах, которые вытекают из анализа надлежащим образом собранных и обработанных цифровых данных. 3. Приемы и методы статистического изучения явлений общественной жизни. Особенность предмета статистики заключается в изучении массовых варьирующих явлений, что и определяет специфику статистического метода. Очевидно, что нужно собрать данные о признаках всех единиц совокупности, обобщить их и выразить в сводных показателях. Отсюда статистический метод включает: - наблюдение (сбор первичных данных по единицам совокупности); - обобщение собранных данных (их группировка, расчёт сводных показателей); - представление результатов обобщения в форме статистических таблиц, графиков с текстовыми пояснениями. Только с помощью такого метода можно раскрыть закономерности развития изучаемых явлений. 4. Основные стадии статистического исследования. Разделы статистической науки. 3 последовательные стадии (этапы) статистического исследования: 1. статистическое наблюдение; 2. сводка и группировка первичных статистических данных; 3. анализ статистической информации. Содержание работы первого этапа предполагает использование метода массовых наблюдений, которые есть не что иное, как сбор первичной статистической информации. На втором этапе собранная информация при помощи метода статистических группировок определенным способом обобщается и распределяется. И наконец, на третьем этапе с помощью метода обобщающих показателей осуществляется анализ статистической информации. Разделы статистической науки: 1) Описательная статистика. Она только констатирующая. 2) Математическая статистика. Её цель – анализ. 5. Статистическое наблюдение - первая стадия статистического исследования. Любое экономико-статистическое исследование начинается со статистического наблюдения. Статистическое наблюдение - это предварительная стадия статистического исследования, которая представляет собой планомерный, научно организованный учет (сбор) первичных статистических данных о массовых социально-экономических явлениях и процессах. Не всякий сбор данных можно назвать статистическим наблюдением. Наблюдение будет статистическим, во-первых, когда оно сопровождается регистрацией изучаемых фактов в соответствующих учетных документах для дальнейшего их обобщения, во-вторых - когда носит массовый характер. Это обеспечивает охват значительного числа случаев проявления того или иного процесса, необходимого и достаточного для того, чтобы получить данные, которые касаются не только отдельных единиц совокупности, но и всей совокупности в целом. Статистическое наблюдение должно отвечать ряду важнейших требований: а) проводиться непрерывно и систематически; б) учет массовых данных должен быть таким, чтобы не только обеспечивалась полнота данных, но и учитывалось их постоянное изменение; в) данные должны быть максимально достоверны и точны; г) исследуемые явления должны иметь не только научную, но и практическую ценность. Сбор статистических данных может проводиться как органами государственной статистики, научно-исследовательскими институтами, другими государственными структурами, так и экономическими службами банков, бирж, предприятий, фирм. Только в этом случае исследователи получают достоверную и достаточно разнообразную статистическую информацию, позволяющую всесторонне изучать социально-экономические явления. Статистическое наблюдение (сбор первичного статистического материала) состоит из трех основных этапов: подготовка статистического наблюдения; организация и производство наблюдения; контроль полученных первичных данных. 6. Виды и способы статистического наблюдения. Основные организационные формы статистического наблюдения. Все многообразие форм, видов и способов наблюдения можно представить следующим образом. По форме организации статистического наблюдения: отчетность; специально организованное статистическое обследование - перепись; регистры. По видам статистического наблюдения: а) по времени регистрации фактов (текущее или непрерывное; прерывное - периодическое, единовременное); б) по охвату единиц совокупности (сплошное; несплошное - основного массива, выборочное, монографическое). По способам получения статистической информации: непосредственное наблюдение; документальный способ; опрос - экспедиционный, анкетный, явочный, корреспондентский, саморегистрация. Основной формой статистического наблюдения является отчетность. Если первичный учет (первичный учетный документ) регистрирует различные факты, то отчетность является обобщением первичного учета. Отчетность - официальный документ, который скрепляется подписями лиц, ответственных за предоставление и достоверность собранных сведений, и утверждается органами государственной статистики. Кроме годовой может иметь место ежедневная, недельная, двухнедельная, месячная и квартальная отчетность. Отчетность может быть представлена по почте, телеграфу, телетайпу, факсу. К специально организованному статистическому наблюдению можно отнести перепись. На практике проводится перепись населения, материальных ресурсов, зеленых насаждений, незавершенных строительных объектов, оборудования и т.д. Перепись - наблюдение, повторяющееся через равные промежутки времени, задачей которого является не только определение численности и состава исследуемой совокупности, но и анализ количественных изменений в период между двумя обследованиями. Из всех переписей наиболее известны переписи населения. Формой непрерывного статистического наблюдения является регистровое наблюдение (регистр), объектами которого являются долговременные процессы, имеющие фиксированное начало, стадию развития и фиксированное время завершения. Регистр основан на системе отслеживания состояния переменных и постоянных показателей. В статистической практике различают регистры населения и регистры предприятий. В настоящее время в России существует Единый государственный регистр предприятий всех форм собственности (ЕГРПО), информационный фонд которого содержит: регистровый код, сведения о территориальной и отраслевой принадлежности, форме подчиненности, виде собственности, справочные сведения и экономические показатели (среднесписочная численность работников; средства, направляемые на потребление; остаточная стоимость основных средств; балансовая прибыль или убыток; уставный фонд). При закрытии предприятия в десятидневный срок ликвидационная комиссия информирует об этом службу ведения регистра. Рассмотрим коротко виды статистического наблюдения по времени регистрации фактов. Непрерывное (текущее) статистическое наблюдение - это систематическая регистрация фактов или явлений по мере их поступления с целью изучения их динамики. Например, регистрации актов гражданского состояния (рождения, браки, смерти), регистрация страховыми компаниями всех несчастных случаев и других неблагоприятных событий по мере их возникновения. Видами прерывного наблюдения являются единовременное и периодическое. Первое есть разовое сплошное наблюдение для сбора количественных характеристик явления или процесса в момент его исследования. Периодическое наблюдение проводится через определенные промежутки времени по схожим программе и инструментарию. Например, периодическое исследование пассажиропотоков в общественном транспорте, периодическая регистрация цен производителей по отдельным товарам (один раз в месяц или в квартал). По охвату единиц совокупности статистическое наблюдение бывает сплошным и несплошным. Сплошное наблюдение охватывает все единицы исследуемой совокупности (например, общая перепись населения). В свою очередь, несплошное наблюдение охватывает только часть исследуемой совокупности. В зависимости от того, как выбрана эта часть, несплошное наблюдение можно подразделить на выборочное (основано на принципе случайного отбора), метод основного массива (исследуются самые существенные или наиболее крупные единицы изучаемой совокупности) и так называемое монографическое наблюдение (подробное исследование отдельных единиц изучаемой совокупности с целью выявления намечающихся тенденций). Что касается способов получения статистической информации (способов статистического наблюдения), то здесь выделяют три основных способа: непосредственное наблюдение, документальное наблюдение и опрос. Достаточно надежным источником данных является непосредственное наблюдение, когда можно установить факт, подлежащий регистрации. Но данный способ требует значительных затрат труда и наличия всех необходимых условий. Чаще всего он используется при наблюдении за вводом в действие строительных объектов. Другой надежный способ - документальный, основанный на использовании в качестве источника информации различных документов учетного характера (счета, рекламации и т.д.) и способствующий получению точной информации. Способ наблюдения, при котором источником сведений являются слова респондентов, называют опросом. Его разновидности: устный (экспедиционный), анкетный, корреспондентский, явочный опрос и саморегистрация. Устный опрос может быть как прямым (непосредственное общение счетчика с респондентом), так опосредованным (например, по телефону). При анкетном способе определенное число респондентов получают специальные вопросники либо лично, либо через средства печати. Данный вид опроса применяется в исследованиях, где нужны ориентировочные результаты, не претендующие на высокую точность (изучение общественного мнения). Явочный способ используется в сплошном наблюдении, когда необходимо личное присутствие (регистрация браков, разводов, рождений и т.д.). При корреспондентском способе сведения сообщаются штатом добровольных корреспондентов, в силу чего полученный материал не всегда носит качественный характер. Наконец, при способе саморегистрации формуляры заполняются самими респондентами, а счетчики консультируют и собирают формуляры. В статистической практике различные виды статистических наблюдений могут сочетаться, дополняя друг друга. 7. Сводка - вторая стадия статистического исследования. Основное содержание и задачи сводки. Сводка (простая) - это подсчёт только общих итогов. 8. Понятие и задачи группировок. Виды группировок. Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных. Виды группировок зависят от целей и задач, которые они выполняют. С помощью метода статистических группировок выделяют качественно однородные совокупности, изучают структуры совокупности и изменения, происходящие в них, а также решают задачи по исследованию существующих связей и зависимостей. С известной мерой условности для выполнения этих задач группировки соответственно делят на типологические, структурные и аналитические. Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. При этом очень важно правильно отобрать группировочный признак, который поможет идентифицировать выбранный тип. Типологические группировки широко применяются в исследовании социально- экономических явлений. Примерами такого вида группировок могут быть группы предприятий по формам собственности, по формам хозяйствования, социальные группы населения и т.д. В типологических группировках часто используются специализированные интервалы. Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д., то есть может решаться задача по изучению структурного состава той или иной однородной совокупности, структурных изменений по тому или иному группировочному признаку. На основе структурных изменений изучаются закономерности общественных явлений. Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы. 9. Группировочные признаки. Выбор интервалов групп. Расчет величины равного интервала. Признаки, по которым проводится группировка, называют группировочными признаками. Группировочный признак иногда называют основанием группировки. Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.). При определении числа групп, как правило, учитываются задача исследования, объем совокупности и виды признаков, которые берутся в качестве основания группировки. Например, по количественному признаку возраст населения может быть разбит на самые различные группы. Их число будет зависеть от поставленных задач. Например, это могут быть группы по возрасту трудоспособного населения; экономически активного населения и т.д. Если берется, предположим, такой качественный признак, как образование, то групп будет ровно столько, сколько существует ступеней или профилей образования. В образовании по ступеням групп будет шесть (неполное среднее; среднее; неполное среднее специальное; специальное среднее; неполное высшее; высшее). По профилю образования количество групп может совпадать или с числом профессиональных групп, или с числом сфер образования (гуманитарное; инженерно-техническое; естественнонаучное). Определение числа групп тесно связано с понятием величина интервала: чем больше число групп, тем меньше величина интервала, и наоборот. Интервал - разница между максимальным и минимальным значениями признака в каждой группе. Он определяет количественные границы групп, что для статистической практики имеет большое значение, особенно когда нужно образовать качественно однородные группы. Например, исследуется совокупность предприятий по выполнению коллективных договоров. Здесь нельзя объединять предприятия, которые не выполнили обязательства, и те, которые их перевыполнили. Показатель здесь - величина интервала. Другим примером является невозможность образовывать группу 95 - 105%, поскольку это разные части совокупности. Следует образовать две группы: 95 - 100% и 101 - 105%. В этом случае границы, по которым различаются совокупности, абсолютно соблюдаются. Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Поэтому величина интервала есть разность между верхней и нижней границами интервала. Если у интервала указана лишь одна граница (у первого - верхняя, у последнего - нижняя), то речь идет об открытых интервалах. Если у интервала имеются и нижняя, и верхняя границы, то речь идет о закрытых интервалах. Закрытые интервалы подразделяются на равные и неравные (прогрессивно возрастающие, прогрессивно убывающие), а также специализированные и произвольные. Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер. Если можно заранее установить определенное количество групп, то величину равного интервала можно вычислить по формуле где i - величина равного интервала; xmax , xmin - наибольшее и наименьшее значения признака; n - число групп. Если не требуется предварительного установления числа групп, то используется другой способ определения величины равного интервала - по формуле Стерджесса где n - число наблюдений. Если величина равного интервала рассчитывается по данной формуле, то следует знаменатель предварительно округлить до целого числа (как правило, всегда большего), так как количество групп не может быть дробным числом. 10. Статистические таблицы, их виды. Правила построения статистических таблиц. Статистическая таблица - это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам. Статистическая таблица содержит два элемента: подлежащее и сказуемое. Подлежащее статистической таблицы есть перечень групп или единиц, составляющих исследуемую совокупность единиц наблюдения. Сказуемое статистической таблицы - это цифровые показатели, с помощью которых дается характеристика выделенных в подлежащем групп и единиц. Различают простые, групповые и комбинационные таблицы. В простых таблицах, как правило, содержится справочный материал, где дается перечень групп или единиц, составляющих объект изучения. При этом части подлежащего не являются группами одинакового качества, отсутствует систематизация изучаемых единиц. Сказуемое этих таблиц содержит абсолютные величины, отражающие объемы изучаемых процессов. Групповые и комбинационные таблицы предназначены для научных целей, где, в отличие от простых таблиц, в сказуемом - средние и относительные величины на основе абсолютных величин. Групповая таблица - это таблица, где статистическая совокупность разбивается на отдельные группы по какому-либо одному существенному признаку, при этом каждая группа характеризуется рядом показателей. Примером такой группировки может быть разделение российских семей на группы по месту проживания (сельское и городское), где образуются подгруппы семей по количеству детей. Анализ этих группировок по материалам переписи 1989 года позволил сделать вывод, что большинство семей, независимо от принадлежности к городскому или сельскому населению, имеют только по одному ребенку. Комбинационная таблица - это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Примером комбинационной группировки может быть распределение полиграфических предприятий по трем существенным признакам: степени оснащенности современным полиграфическим оборудованием, степени применения современных технологий и уровню производительности труда. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны. При составлении таблиц необходимо соблюдать общие правила: таблица должна быть легко обозримой; общий заголовок должен кратко выражать основное содержание; наличие строк «общих итогов»; наличие нумерации строк, которые заполняются данными; соблюдение правила округления чисел. 11. Абсолютные величины. Группы абсолютных величин. Первичная статистическая информация выражается прежде всего в виде абсолютных показателей, которые являются количественной базой всех форм учета. Абсолютные показатели характеризуют итоговую численность единиц совокупности или ее частей, размеры (объемы, уровни) изучаемых явлений и процессов, выражают временные характеристики. Абсолютные показатели могут быть только именованными числами, где единица измерения выражается в конкретных цифрах. В зависимости от сущности исследуемого явления и поставленных задач единицы измерения могут быть натуральными, условно-натуральными, стоимостными и трудовыми. Натуральные единицы измерения соответствуют потребительским или природным свойствам товара или предмета и оцениваются в физических мерах массы, длины, объема (килограмм, тонна, метр и т.д.). Разновидностью натуральных единиц выступают условно-натуральные, которые используются в тех случаях, если продукт, имея несколько разновидностей, должен переводиться в условный продукт с помощью специальных коэффициентов (молочные продукты с разным содержанием сливочной основы, мыло с разным содержанием жирных кислот и т.д.). Стоимостные единицы измерения оценивают социально-экономические процессы и явления в денежном выражении (цены, сопоставимые цены), что очень важно в условиях рыночной экономики. Трудовые единицы измерения призваны отражать затраты труда, трудоемкость технологических операций в человеко-днях, человеко-часах. Вся совокупность абсолютных величин включает как индивидуальные показатели (характеризуют значения отдельных единиц совокупности), так и суммарные показатели (характеризуют итоговое значение нескольких единиц совокупности или итоговое значение существенного признака по той или иной части совокупности). Абсолютные показатели следует также подразделить на моментные и интервальные. Моментные абсолютные показатели характеризуют факт наличия явления или процесса, его размер (объем) на определенную дату времени. Интервальные абсолютные показатели характеризуют итоговый объем явления за тот или иной период времени (например, выпуск продукции за квартал или за год и т. д.), допуская при этом последующее суммирование. Абсолютные показатели не могут дать исчерпывающего представления об изучаемой совокупности или явлении, поскольку не могут отразить структуру, взаимосвязи, динамику. Данные функции выполняют относительные показатели, которые определяются на основе абсолютных показателей. 12. Роль и значение относительных величин, их использование в экономическом анализе. Группы относительных величин. В статистике относительные показатели используют в сравнительном анализе, в обобщении и синтезе. Относительные показатели - это цифровые обобщающие показатели, они есть результат сопоставления двух статистических величин. По своей природе относительные величины производны от деления текущего (сравниваемого) абсолютного показателя на базисный показатель. Относительные показатели могут быть получены или как соотношения одноименных статистических показателей, или как соотношения разноименных статистических показателей. В первом случае получаемый относительный показатель рассчитывается или процентах, или в относительных единицах, или в промилле (в тысячных долях). Если соотносятся разноименные абсолютные показатели, то относительный показатель в большинстве случаев бывает именованным. Относительные величины, используемые в статистической практике: относительная величина структуры; относительная величина координации; относительная величина планового задания; относительная величина выполнения плана; относительная величина динамики; относительная величина сравнения; относительная величина интенсивности. Относительная величина структуры (ОВС) характеризует структуру совокупности, определяет долю (удельный вес) части в общем объеме совокупности. ОВС рассчитывают как отношение объема части совокупности к абсолютной величине всей совокупности, определяя тем самым удельный вес части в общем объеме совокупности (%): где mi - объем исследуемой части совокупности; M - общий объем исследуемой совокупности. Относительная величина координации (ОВК) характеризует соотношение между двумя частями исследуемой совокупности, одна из которых выступает как база сравнения (%): где mi - одна из частей исследуемой совокупности; mб - часть совокупности, которая является базой сравнения. Относительная величина планового задания (ОВПЗ) используется для расчета в процентном отношении увеличения (уменьшения) величины показателя плана по сравнению с его базовым уровнем в предшествующем периоде, для чего используется формула где Рпл - плановый показатель; Р0 - фактический (базовый) показатель в предшествующем периоде. Относительная величина выполнения плана (ОВВП) характеризует степень выполнения планового задания за отчетный период (%) и рассчитывается по формуле где Рт - уровень текущий; Рб - уровень базисный; где Рт - уровень текущий; Рт-1 - уровень, предшествующий текущему. Относительная величина сравнения (ОВСр) - соотношение одноименных абсолютных показателей, относящихся к разным объектам, но к одному и тому же времени (например, соотносятся темпы роста населения в разных странах за один и тот же период времени): где МА - показатель первого одноименного исследуемого объекта; МБ - показатель второго одноименного исследуемого объекта (база сравнения). Все предыдущие показатели относительных величин характеризовали соотношения одноименных статистических объектов. Однако есть группа относительных величин, которые характеризуют соотношение разноименных, но связанных между собой статистических показателей. Эту группу называют группой относительных величин интенсивности (ОВИ), которые выражаются, как правило, именованными числами. В статистической практике относительные величины интенсивности применяются при исследовании степени объемности явления по отношению к объему среды, в которой происходит распространение этого явления. ОВИ здесь показывает, сколько единиц одной совокупности (числитель) приходится на одну, на десять, на сто единиц другой совокупности (знаменатель). Примерами относительных величин интенсивности могут служить, скажем, показатели уровня технического развития производства, уровня благосостояния граждан, показатели обеспеченности населения средствами массовой информации, предметами культурно-бытового назначения и т.д. ОВИ рассчитывается по формуле где А - распространение явления; ВА - среда распространения явления А. При расчете относительных величин интенсивности может возникнуть проблема выбора адекватной явлению базы сравнения (среды распространения явления). Например, при определении показателя плотности населения нельзя брать в качестве базы сравнения общий размер территории того или иного государства, в этом случае базой сравнения может быть лишь территория в 1 км2. Критерием правильности расчета является сопоставимость по разработанной методологии расчета сравниваемых показателей, применяющихся в статистической практике. 13. Средние величины. Категории средних величин (степенные средние, структурные средние). Виды средних величин. Средние величины используются на этапе обработки и обобщения полученных первичных статистических данных. Потребность определения средних величин связана с тем, что у различных единиц исследуемых совокупностей индивидуальные значения одного и того же признака, как правило, неодинаковы. Средней величиной называют показатель, который характеризует обобщенное значение признака или группы признаков в исследуемой совокупности. Если исследуется совокупность с качественно однородными признаками, то средняя величина выступает здесь как типическая средняя. Например, для групп работников определенной отрасли с фиксированным уровнем дохода определяется типическая средняя расходов на предметы первой необходимости, т.е. типическая средняя обобщает качественно однородные значения признака в данной совокупности, каковым является доля расходов у работников данной группы на товары первой необходимости. При исследовании совокупности с качественно разнородными признаками на первый план может выступить нетипичность средних показателей. Такими, к примеру, являются средние показатели произведенного национального дохода на душу населения (разные возрастные группы), средние показатели урожайности зерновых культур по всей территории России (районы разных климатических зон и разных зерновых культур), средние показатели рождаемости населения по всем регионам страны, средние температуры за определенный период и т.д. Здесь средние величины обобщают качественно разнородные значения признаков или системных пространственных совокупностей (международное сообщество, континент, государство, регион, район и т.д.) или динамических совокупностей, протяженных во времени (век, десятилетие, год, сезон и т.д.). Такие средние величины называют системными средними. Таким образом, значение средних величин состоит в их обобщающей функции. Средняя величина заменяет большое число индивидуальных значений признака, обнаруживая общие свойства, присущие всем единицам совокупности. Это, в свою очередь, позволяет избежать случайных причин и выявить общие закономерности, обусловленные общими причинами. Используются две категории средних величин: степенные средние; структурные средние. Первая категория степенных средних включает: среднюю арифметическую, среднюю гармоническую, среднюю квадратическую и среднюю геометрическую. Вторая категория (структурные средние) - это мода и медиана. Введем следующие условные обозначения: - величины, для которых исчисляется средняя; - средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений; - частота (повторяемость индивидуальных значений признака). Различные средние выводятся из общей формулы степенной средней:
при k = 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = -2 - средняя квадратическая. Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней. 14. Средняя арифметическая (простая и взвешенная). Условия применения. Средняя арифметическая - самый распространенный вид средней. Она используется, когда расчет осуществляется по несгруппированным статистическим данным, где нужно получить среднее слагаемое. Средняя арифметическая - это такое среднее значение признака, при получении которого сохраняется неизменным общий объем признака в совокупности. Формула средней арифметической (простой) имеет вид где n - численность совокупности. Например, средняя заработная плата работников предприятия вычисляется как средняя арифметическая: Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. К примеру, необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек: При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной, которая имеет вид Так, нам необходимо рассчитать средний курс акций какого-то акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом: 1 - 800 ак. - 1010 руб. 2 - 650 ак. - 990 руб. 3 - 700 ак. - 1015 руб. 4 - 550 ак. - 900 руб. 5 - 850 ак. - 1150 руб. Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА): ОСС = 1010 ·800+990·650+1015·700+900·550+1150·850= 3 634 500; КПА = 800+650+700+550+850=3550. В этом случае средний курс стоимости акций был равен 15. Средняя гармоническая (простая и взвешенная). Условия применения. Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1. Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1: К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость: В статистической практике чаще используется гармоническая взвешенная, формула которой имеет вид Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель. 16. Средняя геометрическая (простая и взвешенная). Условия применения. Чаще всего средняя геометрическая находит свое применение при определении средних темпов роста (средних коэффициентов роста), когда индивидуальные значения признака представлены в виде относительных величин. Она используется также, если необходимо найти среднюю между минимальным и максимальным значениями признака (например, между 100 и 1000000). Существуют формулы для простой и взвешенной средней геометрической. Для простой средней геометрической Для взвешенной средней геометрической 17. Средняя квадратическая (простая и взвешенная). Условия применения . Основной сферой ее применения является измерение вариации признака в совокупности (расчет среднего квадратического отклонения). Формула простой средней квадратической Формула взвешенной средней квадратической 18. Статистический анализ структуры. Структурные средние: мода и медиана. Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду. Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина. Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10) : 2= 8,5. То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле где n - число единиц в совокупности. Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений. Численное значение медианы обычно определяют по формуле где xМе - нижняя граница медианного интервала; i - величина интервала; S-1 - накопленная частота интервала, которая предшествует медианному; f - частота медианного интервала. Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой. Чтобы найти конкретное значение моды, необходимо использовать формулу где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным. Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики. 19. Ряды распределения, их виды и приемы построения. Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения. Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.). Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу). Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд. Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются. Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки. Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений. Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака. Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд. Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота). Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается где k - число вариантов значений признака Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение. Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m: где R = xmax - xmin ; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности. 20. Графическое изображение статистических данных. Понятие о статистическом графике. Элементы статистического графика. 21. Классификация видов графиков. Для изображения рядов распределения существует 3 основные вида графиков:
22. Гистограмма распределения. Правила построения. Свойства. Для графического изображения интервальных вариационных рядов применяется гистограмма. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам интервала.
По гистограмме можно определить моду – наиболее часто встречающееся значение признака у единиц данной совокупности. Модальным считается интервал, которому соответствует максимальное значение частоты. Для нахождения моды графически на гистограмме, нужно соединить линии, как показано на рисунке, и опустить перпендикуляр из построенного прямоугольника вниз к оси абсцисс (интервалы). Мо = Хмо + i * ( fmo – ( fmo-1))/( fmo-1)+( fmo+1) Мо=400+200*((17-12)/((17-12)+(17-15,5)))=553,84 23. Полигон распределения частот. Правила построения. Свойства. Для построения полигона распределения частот, соединяем середины столбцов гистограммы. 24. Кумулятивная кривая. Правила построения. Свойства. Для построения этой кривой нужно рассчитать накопленные частоты, определяющиеся суммированием частот интервалов. Причем, последняя накопленная частота должна оказаться равной сумме всех частот. При построении кумуляты нижняя граница первого интервала будет равна нулю, а верхняя граница – вся частота данного интервала.
По кумулятивной кривой можно определить медиану. Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы. Место медианы ( Nме) =( n+1)/2 К примеру, (44,5+1)/2=22,75 Превышающие значение накопленной частоты = 29>22.75, поэтому медианный интервал – [400-600]. Ме = Хме + i * (((n+1)/2)-S(-1))/fme Me=400+200*((22,75-12)/17)=526,47
25. Показатели центра распределения вариационного ряда (средняя, мода, медиана). 1.Средняя арифметическая – значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Для дискретного ряда – Х (сред.)= ∑х i fi / ∑ fi Для интервального ряда – Х (сред.)= ∑х ´ i fi / ∑ fi 2. Мода – наиболее часто встречающееся значение признака у единиц данной совокупности. Модальным считается интервал, которому соответствует максимальное значение частоты. Хмо – это нижняя граница модального интервала Fmo – частота модального интервала fmo-1 – частота интервала, предшествующая модальному fmo+1 – частота интервала следующего за модальным Мо = Хмо + i * ( fmo – ( fmo-1))/( fmo-1)+( fmo+1) 3. Медиана. Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы. Место медианы ( Nме ) =(n+1)/2 Хме – нижняя граница медианного интервала N – количество единиц в совокупности S(-1) – накопленная частота интервала, предшествующая медианному Fme – частота медианного интервала Ме = Хме + i * ((( n+1)/2)- S(-1))/ fme 26. Соотношение средней, моды и медианы в вариационном ряду. 27. Показатели степени вариации (размах, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия). 1.Размах колебаний, или размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности. R=Xmax-Xmin 2. Среднее квадратическое отклонение – это обобщающая характеристика абсолютных размеров вариаций признака в совокупности. ∂= √∂2 3. Дисперсия – это средняя арифметическая квадратов отклонений индивидуального значения признака от общей средней. ∂2 = ∑((х i- x(сред.))2 )/ ∑ ni 4. Среднее линейное отклонение
вычисляется по формуле: d(сред.) = ∑|х i-х(сред.) | * fi / ∑ fi – для сгруппированных данных 28. Показатель однородности совокупности – коэффициент вариации. V= ∂/ x*100% - показатель относительной колеблемости . Всегда выражается в %. Если V < 33%, то совокупность считается однородной. 29. Виды дисперсий: внутригрупповая, межгрупповая и общая. Правило сложения дисперсий. Общая дисперсия – ее величина характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности. Межгрупповая дисперсия – отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора положенного в основу группировки. ∂2 = ∑((Х i(сред.)-Хо(сред.))* ni)/ ∑ ni, где Х i – среднее по отдельной группе, а Хо – для всей совокупности. Средняя внутригрупповая дисперсия – характеризует случайную вариацию, возникающую под влиянием неучтенных факторов, и не зависит от признака фактора, положенного в основу группировки. ∂2 (сред.) = ∑( ∂ i2 * ni)/ ∑ ni, где ∂ i2 – дисперсия по отдельной группе, ∂ i2 = ∑(Х-Х i)2 * F/ ∑ F Перечисленные виды дисперсий взаимосвязаны между собой следующим равенством: ∂2 = ∂2 + ∂2 (сред.) Это равенство – правило сложения дисперсий : Величина общей дисперсии равна сумме межгрупповой и средней внутригрупповой дисперсии. 30. Вариации альтернативного признака. Альтернативный признак – это качественный признак, имеющий 2 взаимоисключающие разновидности. АП принимает всего 2 значения:
p+ q=1, где p – это доля обладающих признаком q – не обладающих признаком. Среднее значение альтернативного признака рассчитывается по формуле: Х(сред.) = ((1* p)+(0* q))/ ( p+ q)= p Дисперсия альтернативного признака рассчитывается по формуле: ∂2 =((1- p)2 * p+(0- p)2 * q)/ p+ q= p* q Предельное значение вариации альтернативного признака = 0,25 , оно получается, когда p= q=0,5. 31. Показатели формы распределения (показатель асимметрии, эксцесса). Существует еще одна характеристика распределения данных, полученных по непрерывным шкалам, которую исследователь тоже должен обязательно учитывать. Это форма распределения. Данные распределения старшеклассников по возрасту являются примером нормального распределения. Нормальным является такое распределение, при котором кривая построенного по его данным графика представляет собой колоколообразную симметричную кривую. Например, если мы построим график по данным распределения старшеклассников по возрасту, то получим соответствующую колоколообразную кривую. Если же мы построим график по массиву третьеклассников и учителей, опрошенных в одной школе, мы получим две кривые. Нормальное распределение — это теоретическая кривая. Практически любые эмпирические данные в той или иной степени отклоняются от нормального распределения вероятностей, закону которого подчиняются распределения случайных величин. Но поскольку все расчеты, включающие значение среднего арифметического и стандартного отклонения, основаны на теории вероятности, в аналитическую задачу исследователя входит оценка (по крайней мере, приблизительная) того, насколько правомерно использовать данный тип анализа к полученным результатам. Поэтому даже на уровне описания (не говоря уже о множественном анализе), прежде чем приводить данные по их средним значениям (среднее арифметическое и стандартное отклонение), необходимо оценить характер формы распределения — в какой степени она приближается к нормальному распределению. Для этого используют показатели скоса (асимметрии, skewness) и эксцесса (kurtosis). В скобках указываются термины, которые обычно у разных авторов используются для обозначения одних и тех же понятий. В частности, здесь приведены англоязычные обозначения рассматриваемых характеристик, которые приводятся в компьютерной программе обработки и анализа социологических данных — SPSS. Показатель скоса (skewness) позволяет оценить степень и направленность асимметрии кривой распределения. В случае идеального нормального распределения асимметрия равна нулю. В эмпирической социологии идеальные нормальные распределения практически не встречаются. Но существуют методы оценки степени приближения полученного распределения к нормальному. Коэффициент скоса имеет числовое значение и знак, указывающий направленность скоса. Чем больше величина отличается от нуля, тем большая асимметрия у полученного распределения, и, соответственно, большая погрешность может проявиться при применении коэффициентов статистического анализа, формула которых включает значения стандартного отклонения. Существуют специальные процедуры оценки степени допустимости такой погрешности, а также искусственной нормализации шкалы. Исследователь может, при необходимости, осуществлять преобразование данных. С различными способами преобразования данных можно ознакомиться в специальной справочной и учебной литературе; но исследователю необходимо обязательно оценить степень асимметрии. (Простейшим косвенным показателем, указывающим на асимметрию, является расхождение между значениями среднего арифметического, моды и медианы; при идеальном нормальном распределении все три показателя равны). Показатель эксцесса (kurtosis) показывает, в какой степени «крутизна» полученной кривой приближается к нормальному распределению. Показатели асимметрии и эксцесса необходимы исследователю в первую очередь для того, чтобы он мог установить — в какой степени в анализе может быть использовано стандартное отклонение.
32. Кривые распределения. Критерии согласия Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения. Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения. Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона. При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга. Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона Кривую Пуассона можно выразить отношением где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда. При выравнивании эмпирических данных теоретические частоты можно определить по формуле где f' - теоретические частоты; N - общее число единиц ряда. Сравнивая полученные величины теоретических частот f' c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики. Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия. Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова. В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом , который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения где m - число групп; k = (m - 3 ) - число степеней свободы при исчислении частот нормального распределения. Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть. Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле где в - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот. По таблицам значений вероятностей - критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны. Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста). 33. Понятие нормального распределения. Графическое изображение. Свойства. Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением где у - ордината кривой нормального распределения; - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение. Если нужно получить теоретические частоты f' при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой где - сумма всех эмпирических частот вариационного ряда; h - величина интервала в группах; - среднее квадратическое отклонение; - нормированное отклонение вариантов от средней арифметической; все остальные величины легко вычисляются по специальным таблицам.
34. Вычисление критерия согласия Пирсона. Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам: Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n >=50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5. Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто. 35. Понятие о выборочном наблюдении. Виды выборочного наблюдения. Выборочное наблюдение относится к разновидности несплошного наблюдения. Оно охватывает отобранную часть единиц генеральной совокупности. Цель выборочного наблюдения - по отобранной части единиц дать характеристику всей совокупности единиц. Чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц), выборочное наблюдение должно быть специально организовано. Следовательно, в отличие от генеральной совокупности, представляющей всю совокупность исследуемых единиц, выборочная совокупность представляет ту часть единиц генеральной совокупности, которая является объектом непосредственного наблюдения. По понятным причинам выборочный метод может широко использоваться органами государственной статистики. Он позволяет при значительной экономии средств и затрат получать необходимую достоверную информацию. Гарантия репрезентативности обеспечивается применением научно обоснованных способов отбора единиц, которые подлежат обследованию. По способу отбора (способу формирования) выборки единиц из генеральной совокупности распространены следующие виды выборочного наблюдения: o простая случайная выборка (собственно-случайная); o типическая (стратифицированная); o серийная (гнездовая); o механическая; o комбинированная; o ступенчатая. Точностью статистического наблюдения называют степень соответствия величины какого-либо показателя (значение какого-либо признака), определенной по материалам статистического наблюдения, действительной его величине. 36. Ошибки наблюдения, их виды, причины возникновения и способы расчета. Расхождение между расчетным и действительным значением изучаемых величин называется ошибкой наблюдения. На третьем этапе собранный статистический материал должен пройти контроль. Как показывает практика, даже при четко организованном статистическом наблюдении встречаются погрешности и ошибки, которые требуют исправления. Поэтому целью этого этапа является как счетный, так и логический контроль полученных первичных данных. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности. Ошибки регистрации могут быть случайными и систематическими. Случайные ошибки не имеют определенной направленности и возникают под действием случайных факторов (перестановка цифр, смещение строк и граф при заполнении статистического формуляра). При обобщении массового материала эти ошибки взаимопогашаются. Систематические ошибки регистрации имеют определенную направленность, могут либо завышать, либо занижать конкретное значение показателя, что в итоге приводит к искажению действительного положения. Примерами систематической статистической ошибки при регистрации служат округление возраста населения на цифрах, заканчивающихся на 5 и 0, преуменьшение доходов в документации для налоговых органов, элементы недостоверности, которые вносят предприятия в те характеристики, от которых зависит расчет с кредиторами, и т.д. Для выявления ошибок используется счетный контроль, особенно для проверки итоговых сумм. Помимо счетного используется и логический контроль, который может поставить под сомнение правильность полученных данных, поскольку основан на логической взаимосвязи между признаками. Например, при переписи населения полученный факт, что пятилетний ребенок имеет среднее образование, ставится под сомнение и в этом случае ясно, что при заполнении формуляра допущена ошибка. Если ошибки регистрации свойственны любому наблюдению (сплошному и несплошному), то ошибки репрезентативности - только несплошному наблюдению. Они характеризуют расхождения между значениями показателя, полученного в обследуемой совокупности, и его значением по исходной (генеральной) совокупности. Ошибки репрезентативности также могут быть случайными и систематическими. Случайные ошибки возникают, если отобранная совокупность не полностью воспроизводит все признаки генеральной совокупности и величину этих ошибок можно оценить. Систематические ошибки репрезентативности могут возникать, если нарушен сам принцип отбора единиц из исходной совокупности. В этом случае проводятся проверка полноты собранных данных, арифметический контроль точности информации на предмет ее достоверности, проверка логической взаимосвязи показателей. 37. Виды выборочного наблюдения по степени охвата единиц исследуемой совокупности (большие и малые выборки). Формулы средней ошибки повторной простой случайной выборки, средней ошибки бесповторной случайной выборки, предельной ошибки повторной случайной выборки, предельной ошибки бесповторной случайной выборки, типической выборки, серийной выборки применимы для большой выборки. Малая выборка . Кроме большой выборки используются так называемые малые выборки (n < 30), которые могут иметь место в случаях нецелесообразности использования больших выборок. При расчете ошибок малой выборки необходимо учесть два момента: 1) формула средней ошибки имеет вид 2) при определении доверительных интервалов исследуемого показателя в генеральной совокупности или при нахождении вероятности допуска той или иной ошибки необходимо использовать таблицы вероятности Стьюдента, где Р = S (t, n), при этом Р определяется в зависимости от объема выборки и t. В статистике доказано, что даже в выборке весьма малого объема (20-30, а иногда 4-5 единиц) позволяют получить приемлемые для анализа результаты. Зависимость между величиной доверительного коэффициента t, а так же численностью малой выборки n с одной стороны, и вероятностью нахождения ошибки выборки в заданных пределах с другой стороны. Эта зависимость получила название – распределение Стьюдента. 38. Виды выборочного наблюдения по способу формирования выборочной совокупности (собственно-случайная (простая случайная) выборка, типическая выборка. Простая случайная выборка (собственно-случайная) есть отбор единиц из генеральной совокупности путем случайного отбора, но при условии вероятности выбора любой единицы из генеральной совокупности. Отбор проводится методом жеребьевки или по таблице случайных чисел. Типическая (стратифицированная) выборка предполагает разделение неоднородной генеральной совокупности на типологические или районированные группы по какому-либо существенному признаку, после чего из каждой группы производится случайный отбор единиц. 39. Виды выборочного наблюдения по способу формирования выборочной совокупности (серийная выборка, механическая выборка, комбинированная выборка). Для серийной (гнездовой) выборки характерно то, что генеральная совокупность первоначально разбивается на определенные равновеликие или неравновеликие серии (единицы внутри серий связаны по определенному признаку), из которых путем случайного отбора отбираются серии и затем внутри отобранных серий проводится сплошное наблюдение. Механическая выборка представляет собой отбор единиц через равные промежутки (по алфавиту, через временные промежутки, по пространственному способу и т.д.). При проведении механического отбора генеральная совокупность разбивается на равные по численности группы, из которых затем отбирается по одной единице. Комбинированная выборка основана на сочетании нескольких способов выборки. 40. Виды выборочного наблюдения по способу формирования выборочной совокупности (ступенчатая выборка, многофазная выборка). Многоступенчатая выборка есть образование внутри генеральной совокупности вначале крупных групп единиц, из которых образуются группы, меньшие по объему, и так до тех пор, пока не будут отобраны те группы или отдельные единицы, которые необходимо исследовать. Многофазная выборка – Она характеризуется тем, что так же, как и многоступенчатая выборка, включает несколько стадий отбора, но в отличие от последней на всех ее ступенях сохраняется одна и та же единица отбора. Каждая ступень отбора имеет свой объем выборки и свою программу наблюдения. |