Содержание

Содержание_ 2

Введение_ 3

Коэффициент ассоциации и контингенции_ 4

Программы исследований в психологии, социологии и маркетинге с применением статистических методов_ 6

Оценка параметров регрессионного уравнения линейной зависимости_ 10

Проверка статистических гипотез_ 15

Заключение_ 21

Список литературы_ 22


Введение

Статистика широко используется в управлении и имеет боль­шое познавательное значение. В современных условиях это прежде всего обусловливается проведением экономических реформ, затрагивающих интересы всех людей. В статистических данных, отображающих развитие отдель­ных сторон жизни общества и служащих информационной базой прогнозирования и принятия управленческих решений, каждый из нас ищет результаты социально-экономических преобразований.

Одним из непременных условий правильного восприятия и тем более практического использования статистической инфор­мации, квалифицированных, выводов и обоснованных решений является владение статистической методологией изучения коли­чественной стороны массовых социально-экономических явлений: знание природы статистических совокупностей, назначения и познавательных возможностей показателей статистики, условий их применения в  исследовании.

Цель данной работы заключается в изучении некоторых инструментов статистики и их практическое применение.

Для достижения  цели  были поставлены следующие задачи: дать характеристику и проиллюстрировать на примере такие инструменты статистики как коэффициент ассоциации и контингенции, составить программу исследования по социологии, психологии и маркетингу, на основе одного из исследований вычислить коэффициенты уравнения линейной зависимости, проверить статистические гипотезы по полученному уравнению.

Коэффициент ассоциации и контингенции


Важной задачей статистики является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки.

Для определения тесно­ты связи двух качественных признаков, каждый из которых состоит толь­ко из двух групп, применяются коэффициенты ассоциации и континген­ции. При исследовании связи числовой материал располагают в виде таб­лиц сопряженности например, табл. 1. Для вычисления строится табли­ца, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т. е. состоящим из двух качественно отлич­ных друг от друга значений признака (например, хороший, плохой).

Таблица  1

Таблица для вычисления коэффициентов ассоциации и контингенции

а

b

a + b

с

d

c + d

а + с

b + d

a + b + c + d


Коэффициенты определяются по формулам [1, стр. 276]:

ассоциации:

контингенции:

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка > 0,5 или Кк > 0,3.

Проиллюстрируем применение коэффициентов на примере исследования связи между участием в забастовках рабочих и окончанием ими средней школы. Результаты обследования характеризу­ются следующими данными (табл. 2).

Таблица  2

Зависимость участия рабочих в забастовках от образовательного уровня

Группы рабочих



Число рабочих



Из них

участвующих в забастовке

не участвующих в забастовке

Окончившие

100

78

22

среднюю школу




Не окончившие

100

32

68

среднюю школу




ИТОГО

200

110

90


Таким образом, связь между участием в забастовках рабочих и их об­разовательным уровнем можно считать существенной.

Программы исследований по психологии, социологии и маркетинге с применением статистических методов

С помощью статистических методов можно исследовать многие сферы человеческой деятельности. В этой главе проиллюстрируется возможность практического применения инструментов статистики  в программах исследования изменений каких – либо условий в психологии, социологии и маркетинге.

Допустим, что одна из фирм, работающих в сфере развлечений и владеющая сетью баров и ресторанов запланировала  изучить какие факторы и каким образом влияют на продажу напитков (как алкогольных, так и безалкогольных)   в увеселительных заведениях принадлежащих данной компании, а так же изучить изменения их влияния при различных температурных режимах в этих заведениях.

Для решения поставленных задач фирма обратилась к ведущим консалтинговым агентствам в области психологии, социологии и маркетинга.

Современный маркетинг также уже не в состоянии обойтись без статистического аппарата. Изучение ёмкости рынка, жизненного цикла товара невозможно без инструментов статистики.

Маркетинговым агентством была выдвинута первоначальная гипотеза о зависимости  объема выручки от реализации напитков и количеством посетителей мужского пола за день.

Агентство запланировало провести следующие мероприятия для проверки своей гипотезы:

1. В одну из пятниц во всех кафе и барах компании заказчика на кондиционерах выставить температуру 19ºС в 9.00. В течении суток произвести подсчет выручки и количество посетителей мужского пола в каждом из 34 заведений.

2. Через неделю во всех кафе и барах компании заказчика на кондиционерах  выставить температуру 23ºС в 9.00. Произвести аналогичные подсчеты.

3. После сбора интересующих  данных построить уравнения линейной регрессии зависимости выручки от продажи напитков и количества посетителей – мужчин. Проверить значимость коэффициентов регрессии, посмотреть на сколько скоррелированны эти величины, рассчитать долю дисперсии выручки которую объясняет фактор – количество мужчин посетителей.

4. В зависимости от полученных результатов дать рекомендации фирме – заказчику о мерах привлечения посетителей – мужчин. Проконсультировать заказчика по поводу наиболее благоприятно температурного режима.

Дальнейшее выявление факторов влияющих на выручку сети баров и ресторанов поручили фирме, занимающийся практической психологией.

 Психологи считают, что российские граждане в большинстве своём обладают оральным типом психики, то есть для них очень важно находиться в контакте с другим человеком. В  своем исследовании они сделали предположение, что для людей, пришедших в бар, ресторан в компании более двух человек внешние условия не имеют решающего значения (температура воздуха).

 Для проверки выдвинутого предположения о зависимости между объемом выручки бара, ресторана и количеством компании более двух человек до и после изменения температуры воздуха необходимо провести следующие мероприятия:

 1. В одну из пятниц во всех кафе и барах компании заказчика на кондиционерах выставить температуру 19ºС в 9.00. В течении суток произвести подсчет выручки и количество компаний из двух и более человек в каждом из 34 заведений.

2. Через неделю во всех кафе и барах компании заказчика на кондиционерах  выставить температуру 23ºС в 9.00. Произвести аналогичные подсчеты.

3. После сбора интересующих  данных построить уравнения линейной регрессии зависимости выручки от продажи напитков и количества компаний состоящих из более чем двух человек. Проверить значимость коэффициентов регрессии, посмотреть на сколько скоррелированны эти величины, рассчитать долю дисперсии выручки которую объясняет фактор – количество компаний посетителей из более чем двух человек. Изучить влияние  температурного режима на исходную зависимость.

4. В зависимости от полученных результатов дать рекомендации фирме – заказчику о мерах привлечения компаний из двух и более человек.

Следующим этапом исследования стало привлечение социологического агентства. Данная фирма сделала предположение о зависимости выручки от продажи напитков и среднего возраста посетителей в каждом из баров. Была разработана следующая программа исследования:

1. В одну из пятниц во всех кафе и барах компании заказчика на кондиционерах выставить температуру 19ºС в 9.00. В течении суток подсчитать выручку от продажи напитков в каждом из 34 заведений. Одновременно с этим произвести сплошной опрос посетителей кафе где необходимо выяснить их возраст.

2.  Рассчитать средний возраст посетителей в каждом из заведений.

3. Через неделю во всех кафе и барах компании заказчика на кондиционерах  выставить температуру 23ºС в 9.00. Произвести аналогичные подсчеты и опрос.

3. После сбора интересующих  данных построить уравнения линейной регрессии зависимости выручки от продажи напитков и средним возрастом посетителей в кафе. Проверить значимость коэффициентов регрессии, посмотреть на сколько скоррелированны эти величины, рассчитать долю дисперсии выручки которую объясняет фактор – средний возраст посетителей.

4.Изучить влияние  температурного режима на исходную зависимость.

5. В зависимости от полученных результатов дать рекомендации фирме – заказчику о мерах изменения возрастной структуры посетителей.



 


Оценка параметров регрессионного уравнения линейной зависимости

По описанной выше методике маркетинговым агентством было произведено  исследование зависимости выручки от реализации напитков 34 баров и кафе фирмы – заказчика.

После первого эксперимента - в одну из пятниц во всех кафе и барах компании заказчика на кондиционерах была выставлена температура 19ºС в 9.00. В течении суток произведены подсчет выручки от реализации напитков и количество посетителей мужского пола в каждом из 34 заведений.

Полученные данные представлены в таблице 4.

Таблица 4

 

количество посетителей – мужчин (х)

выручка от реализации напитков, руб.(у)

1

104

21066

2

114

23088

3

116

23706

4

98

20033

5

72

14842

6

90

18514

7

97

19716

8

82

16827

9

105

21301

10

131

26592

11

110

22166

12

89

18164

13

94

19230

14

112

22828

15

91

18349

16

123

24813

17

87

17700

18

89

18371

19

129

25924

20

87

17576

21

147

29911

22

117

23923

23

144

28991

24

100

20299

25

99

20068

26

118

23866

27

101

20548

28

128

25853

29

97

19724

30

136

27519

31

131

26352

32

84

16776

33

118

23961

34

115

23232

По полученным данным постоим график зависимости выручки от количества посетителей мужчин.

По графику можно сделать предположение о тесной зависимости между изучаемыми показателями.

Одной из систем корреляционной связи является линейная связь между двумя признаками — парная линейная корреляция. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид:

где  - среднее значение результативного признака у при определенном значении факторного признака х;

а - свободный член уравнения;

b - коэффициент регрессии, измеряющий среднее отношение откло­нения результативного признака от его средней величины к от­клонению факторного признака от его средней величины на одну единицу его измерения - вариация у, приходящаяся на единицу вариации х.

Уравнение регрессии определяется по данным о значениях признаков х и у в изучаемой совокупности, состоящей из n единиц. Параметры уравнения а и b находятся методом наименьших квадратов (МНК). [4, стр. 239]

Исходное условие МНК для прямой линии имеет вид:

Для отыскания значений параметров а и Ь, при которых f(a,b) принимает минимальное значение, частные производные функции приравниваем нулю и преобразуем получаемые уравнения, которые взываются нормальными уравнениями МНК для прямой:

Отсюда система нормальных уравнений имеет вид:

 Нормальные уравнения МНК для прямой линии регрессии явля­ются системой двух уравнений с двумя неизвестными a и b. Все остальные величины, входящие в систему, определяются по исход­ной информации.

Если первое нормальное уравнение разделить на n, получим:

Через это уравнение обычно на практике вычисляется свободный член уравнения регрессии а. Параметр b вычисляется по преобра­зованной формуле, которую можно вывести, решая систему нормаль­ных уравнений относительно b:

или

Составим вспомогательную таблицу для расчетов (у*,x*- среднее значение). 

Таблица 5

 

х

у

x-x*

y-y*

(x-x*)2

 (х-х*)(у-у*)

1

104

21066

-4

-753

15

2934

2

114

23088

6

1269

39

7890

3

116

23706

9

1888

79

16762

4

98

20033

-9

-1786

85

16474

5

72

14842

-35

-6976

1238

245429

6

90

18514

-17

-3305

294

56637

7

97

19716

-11

-2102

119

22901

8

82

16827

-26

-4992

661

128358

9

105

21301

-3

-518

8

1456

10

131

26592

24

4773

562

113114

11

110

22166

2

348

6

818

12

89

18164

-18

-3654

340

67396

13

94

19230

-13

-2588

181

34826

14

112

22828

5

1009

21

4615

15

91

18349

-17

-3470

276

57594

16

123

24813

15

2995

236

46039

17

87

17700

-20

-4119

403

82696

18

89

18371

-18

-3447

335

63073

19

129

25924

21

4106

452

87270

20

87

17576

-21

-4243

441

89103

21

147

29911

40

8092

1594

323110

22

117

23923

10

2104

94

20446

23

144

28991

37

7173

1356

264133

24

100

20299

-8

-1519

64

12127

25

99

20068

-8

-1750

68

14473

26

118

23866

10

2047

108

21234

27

101

20548

-7

-1270

45

8532

28

128

25853

21

4035

433

83913

29

97

19724

-10

-2095

104

21354

30

136

27519

29

5700

833

164502

31

131

26352

23

4534

539

105211

32

84

16776

-24

-5042

576

121051

33

118

23961

10

2143

107

22208

34

115

23232

7

1414

56

10585

сумма

3656

741829

0

0

11766

2338265

среднее

108

21818





Подставим полученные значения в формулу и рассчитаем a и  b:

Таким образом искомая зависимость выглядит следующим образом:

Y= 454.7 + 198.7х

То есть независимо от количества посетителей мужчин средняя выручка каждого из ресторанов составляет 454.7 руб., можно предположить что их тратят женщины (за которых не платят мужчины). Каждый посетитель мужского пола тратит  в среднем 198 руб.

  Проверка статистических гипотез

 При изучении корреляционной связи показателей коммер­ческой деятельности в условиях преобладания так называе­мого малого и среднего бизнеса анализу подвергаются срав­нительно небольшие по составу единиц совокупности. При численности объектов анализа до 50 единиц возникает необ­ходимость испытания параметров уравнения регрессии на их типичность. При этом осуществляется проверка, насколько вычисленные параметры характерны для отображаемого ком­плекса условий. Не являются ли полученные значения пара­метров результатами действия случайных причин.

Применительно к совокупностям, у которых п < 50, для проверки типичности параметров уравнения регрессии ис­пользуется t-критерий Стьюдента. При этом вычисляются фактические значения t-критерия [5, стр. 338]:

для параметра а:  

для параметра b:  , где

- среднее квадратическое отклоне­ние результативного признака у от расчетных значений у.

- среднее квадратическое отклоне­ние факторного признака х от общей средней х.

Полученные по формулам фактические значения ta и tb сравниваются с критическим tk, который по­лучают по таблице Стьюдента с учетом принятого уровня зна­чимости и числа степеней свободы к.

Полученные в анализе корреляционной связи параметры уравнения регрессии признаются значимыми, если  факти­ческое больше  критического:

 и

Наблю

дение

расчетное ух

остатки (е)

е2

Наблюю

дение

расчетное ух

остатки е

е2

1,0

21043,8

22,1

490,0

18,0

18182,4

188,9

35697,0

2,0

23054,0

33,6

1127,1

19,0

26042,8

-118,8

14112,2

3,0

23583,1

123,0

15137,0

20,0

17645,2

-69,7

4852,9

4,0

19984,9

48,0

2307,0

21,0

29753,3

157,7

24859,5

5,0

14827,0

15,4

236,0

22,0

23749,7

172,9

29886,7

6,0

18412,8

100,9

10174,6

23,0

29136,6

-145,3

21122,0

7,0

19653,3

63,2

3988,6

24,0

20232,3

66,8

4463,2

8,0

16708,5

118,2

13966,6

25,0

20175,4

-107,3

11518,0

9,0

21259,6

41,2

1698,7

26,0

23879,6

-13,8

189,5

10,0

26528,0

63,7

4056,8

27,0

20483,7

64,5

4166,4

11,0

22285,8

-119,5

14280,1

28,0

25951,8

-98,7

9747,8

12,0

18153,5

10,6

112,4

29,0

19792,7

-69,0

4765,3

13,0

19144,5

85,8

7367,1

30,0

27553,4

-34,4

1185,5

14,0

22727,2

100,6

10126,3

31,0

26430,5

-78,5

6155,6

15,0

18519,6

-170,7

29125,2

32,0

17047,4

-271,1

73476,7

16,0

24873,8

-60,8

3697,5

33,0

23878,3

82,9

6879,4

17,0

17828,2

-128,2

16447,0

34,0

23306,5

-74,3

5518,0

Проверим полученные нами коэффициенты на значимость:

 и  все коэффициенты значимы, отвергаем нулевую гипотезу.

Важным этапом корреляционного анализа связи является оценка практической значимости синтезированных моделей. Смысл такой оценки состоит в том, чтобы обосновать приме­нение метода функционального анализа при изучении корре­ляционной зависимости. Правомерность такого приема ана­лиза будет оправданной лишь в тех случаях, если изучаемая корреляционная связь не столь значитель­но отстоит от функциональной связи. При этом не­обходимо доказать, что применение метода функционально­го анализа при изучении корреляционной зависимости не дает существенных погрешностей.

Проверка практической значимости синтезированных в корреляционно-регрессионном анализе математических моде­лей осуществляется посредством показателей тесноты связи между признаками х и у.

Для статистической оценки тесноты связи применяются следующие показатели:

Соотношение между факторной  и общей  диспер­сиями характеризует меру тесноты связи между признаками х  и у.

Показатель R2 называется коэффициентом детерминации. Он выражает долю факторной дисперсии в общей дисперсии, т.е. характеризует, какая часть общей вариации результативного признака у объясняется изучаемым факто­ром х.

Для оценки значимости коэффициентом детерминации применя­ется критерий Фишера.

Фактическое значение критерия Fр для линейной парной регрессии определяется по формуле:

Fр=

Величина FR сравнивается с критическим значением Fk, которое определяется по таблице F-критерия с учетом приня­того уровня значимости а и числа степеней свободы кх =1 и кг= п - 2.

Если FR > Fk, то гипотеза о существенности величины коэффициента детерминации принимается.

Fр= Fk=250

Значение коэффициента детерминации значимо. Те есть полученная регрессия объясняет 99% дисперсии выручки баров.

Теснота парной линейной корреляционной связи, как и любой другой показатель, может быть измерена корреляционным отноше­нием. Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи - коэффициент корреляции, Этот показатель представляет собой стандартизованный коэффициент регрессии, т. е. коэффициент, выраженный не в абсолютных еди­ницах измерения признаков, а в долях среднего квадратического от­клонения результативного признака:

Составим расчетную таблицу:

Таблица 6

 

х

у

(x-x*)2

(y-y*)2

 (x-x*)(y-y*)

1

104

21066

15

566414

2934

2

114

23088

39

1610635

7890

3

116

23706

79

3563292

16762

4

98

20033

85

3188183

16474

5

72

14842

1238

48666875

245429

6

90

18514

294

10922134

56637

7

97

19716

119

4418413

22901

8

82

16827

661

24918658

128358

9

105

21301

8

268044

1456

10

131

26592

562

22783158

113114

11

110

22166

6

120963

818

12

89

18164

340

13354812

67396

13

94

19230

181

6698777

34826

14

112

22828

21

1018694

4615

15

91

18349

276

12037698

57594

16

123

24813

236

8967130

46039

17

87

17700

403

16962378

82696

18

89

18371

335

11883152

63073

19

129

25924

452

16855399

87270

20

87

17576

441

18002876

89103

21

147

29911

1594

65487433

323110

22

117

23923

94

4427060

20446

23

144

28991

1356

51448568

264133

24

100

20299

64

2308462

12127

25

99

20068

68

3064032

14473

26

118

23866

108

4191706

21234

27

101

20548

45

1613494

8532

28

128

25853

433

16277667

83913

29

97

19724

104

4388249

21354

30

136

27519

833

32495056

164502

31

131

26352

539

20552823

105211

32

84

16776

576

25423185

121051

33

118

23961

107

4591187

22208

34

115

23232

56

1998527

10585

сумма

3656

741829

11766

465075134

2338265

среднее

108

21818





Подставим данные из таблицы 6 в формулу для расчета коэффициента корреляции:

Полученное значение коэффициента корреляции говорит об очень тесной взаимосвязи показателей выручки и количества посетителей мужчин.

Показатели тесноты связи, исчисленные по данным срав­нительно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает не­обходимость проверки их существенности.

Для оценки значимости коэффициента корреляции r при­меняется t-критерий Стьюдента. При этом определяется фак­тическое значение критерия tr:

Вычисленное по формуле  значение tr, сравнивает­ся с критическим tk, которое берется из таблицы значений t-Стьюдента с учетом заданного уровня значимости аи чис­ла степеней свободы. Если tr > tk, то величина коэффициента корреляции при­знается существенной.

В нашем случае:

  tk=2

tr > tk следовательно отвергаем нулевую гипотезу о незначимости связи х и у.

Таким образом агентство выполнило задание фирмы владельца сети баров и кафе. Была найдена существенная связь между количеством посетителей мужчин и выручкой от реализации напитков.

Заключение


Итак, в этой работе были описаны такие инструменты статистики как коэффициент ассоциации и контингенции. Эти коэффициенты используются для определения тесно­ты связи двух качественных признаков, каждый из которых состоит толь­ко из двух групп. Эти коэффициенты в практике анализа социальных явлений.

Далее были разработаны программы исследования влияния различных факторов на выручку от продажи напитков в сети баров и ресторанов. Рассмотрелись возможности применения  статистических методов в таких отраслях науки как психология, социология и маркетинг.

На основе программы исследования влияния изменения температуры и количества посетителей – мужчин в кафе, были проанализированы взаимосвязи между показателями выручки от напитков в сети баров и кафе и количества посетителей – мужчин. Была установлена тесная и существенная корреляционная связь между этими показателями. Были проверены и опровергнуты нулевые гипотезы о незначимости коэффициентов регрессии и коэффициента детерминации.

Таким образом, по полученным результатам фирма владелец сети баров может разрабатывать рекламную компанию с учетом полученной взаимосвязи выручки и количеством посетителей мужчин.

Список литературы

1. Теория статистики: Учебник/ Под ред. проф. Р.А. Шмойловой. – М.: Финансы и статистика, 1996. – 464 с.

2. Социальная статистика: Учебник/ Под ред. чл.-кор. РАН И.И. Елисеевой. – М.: Финансы и статистика, 2003. – 480 с.

3.  Сидоренко Е.В. Методы математической обработки в психологии. - СПб.: СПбГУ, 2000. – 367 с.

4. Общая теория статистики: Учебник/ под ред. чл.-корр. РАН И.И. Елисеевой. – М.: Финансы и статистика, 1999. – 484 с.

5. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник/ под ред. О.Э. Башиной, А.А. Спирина.- М.: Финансы и статистика, 1999. – 440 с.