Статистическое наблюдение, первоначальная обработка и представление ее данных
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
"ХАРЬКОВСКИЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИТУТ"
Факультет информатики и управления
Кафедра экономической кибернетики и маркетингового менеджмента
РЕФЕРАТ
по дисциплине "Математическая статистика"
на тему:
Статистическое наблюдение, первоначальная обработка и представление ее данных
Харьков 2009
Содержание
Основные понятия. Программно-методологические вопросы
Организационные вопросы статистического наблюдения
Виды, способы и организационные формы наблюдения
Статистический формуляр
Сводка и группировка статистических данных
Статистические таблицы
Статистически графики
Основные понятия. Программно-методологические вопросы
Статистическое наблюдение - первый этап любого статистического исследования. Он сводится к сбору данных о массовых явлениях путем регистрации их признаков.
Статистическое наблюдение - это спланированная, научно-организованная регистрация массовых данных, описывающих изучаемые явления или процессы.
Статистическое наблюдение может быть первичным и вторичным в зависимости от источника поступления информации. Первичное - это регистрация данных, которые поступают непосредственно от объекта - источника данных (переписи, регистрация заказов покупок, браков, результаты опросов). Вторичное - сбор ранее зарегистрированных данных и обработанных данных (банковские и бухгалтерские отчеты, итоги биржевых торгов и т.д.).
При подготовке статистического наблюдения должен быть составлен планнаблюдения, включающий в себя программно-методологические и организационные вопросы.
Программно-методологические вопросы плана определяют:
цель наблюдения (для чего проводится наблюдение);
объект наблюдения (что обследуется);
единицу совокупности (составные элементы объекта);
единицу наблюдения (источник информации);
программу наблюдения (на какие вопросы необходимо получить ответы).
Цель наблюдения - получение статистических данных, которые являются основанием для обобщенной характеристики состояния и развития явления или процесса. Конечной целью является принятие управленческих решений на основании анализа статистических данных и интерпретации полученных результатов.
Объект наблюдения - совокупность явлений, которые подлежат наблюдению. Для объекта наблюдения очень важно четко определить суть и границы объекта, чтобы избежать разного толкования (например, при какой численности работающих предприятие считается малым, крупным, средним). Объект наблюдения состоит из отдельных элементов - единиц совокупности.
Единица совокупности является носителем признаков, которые подлежат регистрации (при переписи населения это каждый человек, при обследовании проданных на бирже квартир - каждая проданная квартира).
Признак - это особенность, которая отражает существо, характер и особенности единицы совокупности. Признаки могут быть качественными (атрибутивными) и количественными. Сведения про единицы совокупности получают от единиц наблюдения. Единица наблюдения - это первичная единица, от которой получают информацию. Например, при переписи используют две единицы наблюдения: домохозяйство и отдельный его член, при обследовании проданных на бирже квартир единицей наблюдения является биржа.
Программа наблюдения - это перечень вопросов, на какие нужно получить ответ в результате наблюдения. В программу, кроме того, могут быть включены: разработка статистического инструментария, определение вида и способа наблюдения.
Статистический инструментарий - это набор статистических формуляров, инструкций и разъяснений по поводу проведения наблюдения.
Статистический формуляр - это учетный документ, который включает в себя адресную характеристику объекта наблюдения и статистические данные про него. Это могут быть переписные и отчетные листы, анкеты и т.п.
Организационные вопросы статистического наблюдения
Второй составляющей плана наблюдения являются организационные вопросы, которые определяют:
органы и персонал (кто проводит наблюдение);
место наблюдения (где проводится);
материально-техническое обеспечение (с помощью чего);
система контроля и пробные обследования (способ обеспечения точности результатов);
время и период наблюдения (когда проводится).
Контроль данных наблюдения проводится для предупреждения, выявления и исправления ошибок наблюдения. При этом полнота данных проверяется путем визуального контроля, а правильность - путем логического и арифметического контроля. Кроме того, в ходе наблюдений в качестве контрольных мероприятий могут использоваться повторные, перекрестные и контрольные опросы.
Время наблюдения - это время, к которому относят полученные данные. Оно определяет:
интервал времени, в течение которого накапливаются данные, если объектом наблюдения является процесс (например, количество договоров, заключенных за месяц);
критический момент - момент времени, по состоянию на который регистрируются факты, если объектом наблюдения является состояние (например, количество населения в регионах).
Поскольку зарегистрировать состояние одномоментно (например, в случае переписи населения) невозможно, то устанавливается период наблюдения - время на протяжении которого осуществляется регистрация данных.
По времени регистрации данных наблюдение делится на:
поточное - систематическая регистрация по мере возникновения явления или в случае непрерывного процесса (регистрация процессов производства и реализации, поступления платежей и т.п.);
периодическое - наблюдение, которое проводится через определенные, как правило, равные промежутки времени (перепись населения или производственных мощностей, регистрация ярмарочных цен);
одноразовое - наблюдение, которое проводится по мере возникновения потребности в изучении явления или процесса (маркетинговые исследования, исследование эффективности инноваций, изучение спроса, определение рейтинга).
Статистическое наблюдение должны предварять следующие подготовительные мероприятия:
подбор и обучение кадров;
составление списка единиц наблюдения;
разбивка территории на части;
определение местонахождения работников, проводящих опрос;
порядок и сроки обеспечения статистическим инструментарием и транспортными средствами.
Виды, способы и организационные формы наблюдения
Виды наблюдения различают по степени охвата единиц - сплошное (отчетность, учет и большинство переписей) и несплошное (выборочное наблюдение, наблюдение основного массива, монографическое, анкетное, мониторинг).
Выборочное наблюдение - при котором регистрируется определенная часть единиц совокупности, отобранная случайным образом.
Наблюдение основного массива - исследуются те единицы совокупности, в которых величина исследуемого признака присутствует в наибольшем объеме (города с наиболее загрязненным воздухом, банки с наиболее высоким рейтингом).
Монографическое наблюдение - детальное обследование отдельных типичных или экстраординарных единиц совокупности с целью их глубокого детализированного анализа (передовой опыт, недостатки организации и т.п.).
Анкетное наблюдение - сбор данных, основанный на принципе добровольного заполнения адресатами анкет. При этом не все распространенные регистрационные формуляры (анкеты) возвращаются с ответами. Проверить достоверность данных, собранных в процессе анкетного наблюдения, проблематично.
Мониторинг - специально организованное систематическое наблюдение за состоянием исследуемого объекта (мониторинг состояния воздуха, мониторинг валютных торгов).
Различают следующие организационные формы наблюдения:
отчетность - документы (отчеты) специально утвержденной формы, которые субъект деятельности подает в государственные органы статистики;
специально организованные наблюдения - переписи, опросы, специальные обследования и пр.;
статистические реестры - непрерывно обновляемые или пополняемые списки либо перечни единиц объекта наблюдения с указанием необходимых признаков (реестр домохозяйств, реестр земельного фонда, реестр субъектов деятельности и т.п.).
Перепись - сплошное обследование массовых явлений с целью выявления их состояния и размера по состоянию на определенную дату. Переписи проводятся одновременно для всей совокупности по единой программе.
Учет - сплошное наблюдение массовых явлений, основанное на данных опроса, осмотра или документальных записей (учет земельного фонда, учет незавершенного строительства).
Специальные наблюдения - несплошное наблюдение отдельных массовых явлений по определенной тематике. Проводится периодически или одноразово.
Опрос - обычно несплошное наблюдение мнений или оценок, которые регистрируются со слов респондентов.
Статистическое наблюдение реализуется следующими способами: непосредственный учет фактов (на основании подсчета, замера, взвешивания), документальный учет (источник данных для наблюдения - документы), опрос, экспертные оценки.
Опрос может быть осуществлен различными способами:
экспедиционный опрос - регистрация фактов специально подготовленными учетчиками с одновременной проверкой точности регистрации (перепись населения);
саморегистрация - регистрация фактов самим респондентами после предварительного инструктажа;
корреспондентский опрос - регистрация фактов по месту возникновения явлений с последующей отправкой результатов в соответствующие инстанции (обследования процесса продвижения товара);
анкетный опрос - регистрация мнений, намерений и мотивов респондентов путем самостоятельного заполнения ими анкет.
Статистический формуляр
В статистический формуляр вносится перечень вопросов, предусмотренных программой наблюдений. В статистическом формуляре указывается наименование единицы наблюдения и регистрируются сведения о ней. Статистические формуляры могут быть индивидуальными (карточными) и списочными, которые применяются только при небольшой программе наблюдений и экспедиционном способе их проведения. На обратной стороне бланка или на отдельном листе приводится инструкция по заполнению формуляров и организации наблюдений. В инструкции указываются:
цель наблюдения;
объект наблюдения;
единица наблюдения;
время наблюдения;
органы и персонал;
разъяснение вопросов формуляра;
разъяснения по правильной записи ответа;
источник сведений.
При составлении формуляров необходимо учитывать не только содержание и информативность признаков, но и возможность их статистической обработки. С этой целью при наблюдении качественных признаков используется система шкал.
Сводка и группировка статистических данных
Статистическая сводка - это второй этап статистического исследования. суть которого состоит в систематизации первичных статистических данных для получения итоговых или упорядоченных определенным образом статистических характеристик исследуемой совокупности.
Группировка - объединение статистических данных в однородные по определенным признакам группы - является основным и важнейшим моментом сводки. Признак, положенный в основу группировки называется группировочным признаком или основанием группировки. группировочные признаки могут быть как качественными (пол, вид собственности, тип предприятия), так и количественными (возраст, стаж, стоимость основных фондов и пр). Элементы совокупности объединяются в группы на основе принципов схожести (или равенства) значений группировочного признака. Для характеристики выделенных групп используется система показателей.
При формировании групп могут быть использованы стандартные группировочные признаки - классификации (классификация отраслей промышленности, форм собственности и т.п.). При использовании классификаций группировочные признаки и требования по условиям формирования групп четко определены. Для решения конкретных аналитических задач проводятся нестандартные группировки по выделенным признакам. При этом группировка по одному группировочному признаку называется простой, по двум и более - сложной. Сложная многомерная группировка осуществляется по нескольким показателям. Сложная комбинационная группировка предполагает разбиение совокупности вначале по одному признаку, затем каждая или некоторые из групп разбиваются по второму и т.д. (не рекомендуется применять более двух уровней группировки).
Группировки помогают изучить структуру и структурные изменения в совокупности, типологию социально-экономических явлений и взаимосвязь между явлениями. В зависимости от цели различают структурные типологические и аналитические группировки.
Структурная группировка распределяет однородную совокупность по определенным признакам, характеризуя объемы и весомость явления в отдельных группах.
Типологическая группировка - это распределение качественно неоднородной совокупности на классы, социально-экономические типы, группы, однородные по качеству или условиям формирования (например, сельскохозяйственные предприятия - фермерские, коллективные, частные агрофирмы и государственные предприятия; торговые предприятия - оптовые и розничные и пр.). Основная цель такой группировки - идентификация типов, при этом первоочередное значение имеет выбор группировочного признака. При типологической группировке интервалы устанавливаются таким образом, чтобы разграничить классы и явления, выделяемые теоретически (экономические, социальные).
И структурные и типологические группировки - описательные. Они характеризуют структуру совокупности, выделяя ее характерные черты и особенности. Эти группировки могут быть представлены в виде ряда распределения, характеристиками которого являются варианты и их частоты (частости).
При помощи аналитической группировки выявляют наличие и направление связи между двумя признаками, одна из которых представляет результат, вторая фактор, который влияет на результат. Обычно аналитическая группировка разбивается на группы по факторному признаку и в каждой из групп определяется средний уровень результативного признака.
При формировании групп встает вопрос об их количестве и границах каждой из них. Количество групп зависит от степени вариации группировочного признака и объема совокупности, и в каждом отдельном случае его нужно обосновать. Количество групп определяется количеством значений признака, если группировочный признак имеет качественный характер или, если признак принимает дискретные числовые значения и общее число этих значений невелико (например, размеры обуви или одежды).
Если признак принимает непрерывные числовые значения или дискретные числовые значения, но количество этих значений велико, то необходимо определить интервал для каждой группы.
Интервалы могут быть равные и неравные, открытые и закрытые. Неравные интервалы имеет смысл использовать в том случае, если диапазон изменения признака слишком большой, распределение единиц совокупности по этому интервалу достаточно неравномерно. Открытые интервалы используются в том случае, если единицы совокупности на границах диапазона слишком широко разбросаны.
Если количество интервалов трудно определить логически или на основании здравого смысла, то ориентировочное значение может быть рассчитано по формуле Стерджеса:
,
где Ва- объем совокупности.
Ширина интервала определяется по формуле:
,
где Ва- размах совокупности.
Результаты сводки и группировки оформляются в виде таблиц и могут быть проиллюстрированы при помощи графиков и диаграмм.
Статистические таблицы
Статистические таблицы - это наглядное, компактное и рациональное представление статистической информации.
В каждой таблице различают подлежащее и сказуемое.
Подлежащее - это совокупность, представленная отдельными ее единицами или частями (группами), которые подлежат анализу. Сказуемое - это система показателей, характеризующих подлежащее. В зависимости от структуры таблицы делят на простые, групповые и комбинационные. Подлежащим простой таблицы является перечисление элементов совокупности, территориальный или хронологический ряд. В групповой таблице подлежащим является группировка по одному признаку, в комбинационной - по двум и более признакам.
Сказуемое тоже может быть разработано по-разному. При простой разработке сказуемого все показатели независимы друг от друга, а при сложной - показатель может расщепляться на несколько (например, для каждого факультета указывается общее количество студентов, количество девушек и юношей).
Составление таблицы производится в два этапа: на первом этапе составляется макет таблицы, на втором - таблица заполняется статистическими данными. Макет таблицы определяет структуру таблицы. Верхние и левые крайние ячейки предназначаются для словесных заголовков - списка элементов, составляющих подлежащее, и системы показателей сказуемого.
При оформлении таблицы необходимо придерживаться определенных правил:
Название таблицы должно отражать ее основное содержание и включать объект наблюдения, время и место получения данных.
Название таблицы, заголовки граф и строк должны быть четкими, лаконичными, без сокращений.
Единица измерения указываются в названии таблицы, если она относится ко всем данным таблицы, иначе в каждой графе указывается своя единица измерения. При указании единиц измерения используются общепринятые сокращения.
Если таблица достаточно большая, то графы сказуемого нумеруются, а подлежащего - обозначаются большими буквами.
При заполнении таблицы:
при отсутствии явления ставится прочерк;
при отсутствии сведений о явлении ставится многоточие или пишется "нет сведений";
при отсутствии осмысленного содержания либо не заполняется, либо ставится знак "";
в случае, если значение меньше принятой в таблице точности - "0.0".
В таблице с одним признаком точность для всех данных должна быть одинаковой. Значения одного итого же показателя в рамках одной графы или строки должны округляться с одинаковой степенью точности.
Следует помечать графы с расчетными показателями. В них при помощи формул может раскрываться методика расчета показателей.
Если названия отдельных граф или строк повторяется, то имеет смысл объединить их под одним названием.
Таблица завершается итоговой строкой. В групповые и комбинационные таблицы целесообразно включать также итоговые графы.
Статистически графики
Статистические графики характеризуются следующими элементами:
поле - место выполнения графика (оптимальное для зрительного восприятия поле 1: 1.3 или 1: 1.5);
графический образ - символические знаки, при помощи которых изображаются статистические данные (точки, линии, плоские геометрические фигуры, силуэты, рисунки и т.п.);
пространственные ориентиры - оси координат, координатная сетка, на географических картах - географические ориентиры;
масштабные ориентиры (для перевода численной величины в графическую).
экспликация графика - пояснения графика, включая заголовок.
Классификация статистических графиков по способу построения
Статистически карты делятся на:
картограммы - схематические карты, на которых при помощи фона (штриховки) или точек, выделяются территории с разным значением изучаемого показателя;
картодиаграммы - сочетание карты местности с диаграммой.
Линейные диаграммы используют для отображения рядов динамики, рядов распределения, анализа взаимосвязи, степени выполнения плана. На линейной диаграмме может быть изображено несколько показателей.
Столбиковые (вертикальные) и полосовые (горизонтальные) диаграммы - размер изучаемого показателя соответствует длине столбика (полоски). Используются для иллюстрации временных рядов, степени выполнения плана, для сравнения объектов или явлений во времени и в пространстве, для характеристики структуры. Один из видов столбиковой диаграммы - гистограмма.
Линейные, столбиковые и полосовые диаграммы строят в прямоугольной системе координат.
Секторные диаграммы иллюстрируют структуру явления.
Радиальные диаграммы применяют для изображения рядов динамики при наличии в них сезонных колебаний. Их строят на базе полярных координат.
В фигурных диаграммах, применяемых, как правило, для рекламных целей, используют рисунки - символы. Количество рисунка или его размер характеризует размер явления.
Кроме того, для сравнения объема явления во времени и в пространстве используют круговые или квадратные диаграммы, в которых объем явления отображается при помощи площади соответствующей фигуры.
Знаки Варзара используют для одновременного отображения трех показателей, из которых один является произведением остальных. Например, валовой сбор, урожайность и посадочные площади или стоимость продажи, цена и объем реализации товара. При этом диаграммы имеют вид прямоугольников, в которых основание, высота и площадь пропорциональны указанным показателям.
Вместе с этим смотрят:
РЖнварiантнi пiдпростори. Власнi вектори i власнi значення лiнiйного оператора
РЖнтегральнi характеристики векторних полiв
Автокорреляционная функция. Примеры расчётов