Задача №1
В таблице 1 содержатся данные о числе Y жителей N = 40 городов страны. Города разделены на два слоя: в первом слое – 10 наиболее крупных, во втором – все остальные города. С помощью таблицы случайных чисел сформировать следующие выборки, состоящие из n = 16 городов:
1. расслоенную выборку с пропорциональным размещением;
2. расслоенную выборку, содержащую одинаковое число единиц каждого слоя;
3. простую (нерасслоенную) случайную выборку.
Найти по каждой из этих выборок:
а) оценку среднего числа жителей всех 40 городов;
б) среднюю ошибку и 95% доверительный интервал для этой оценки;
в) оценку суммарного числа жителей всех 40 городов;
г) среднюю ошибку и 95% доверительный интервал для этой оценки.
Найти истинное значение среднего и суммарного значения по всем 40 городам. Какая выборка дала более точные результаты?
Таблица 1 (тыс. жит.):
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Y |
915 |
706 |
666 |
575 |
533 |
519 |
505 |
499 |
442 |
433 |
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Y |
432 |
414 |
376 |
374 |
356 |
353 |
334 |
326 |
310 |
298 |
|
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
|
290 |
281 |
279 |
277 |
271 |
256 |
254 |
250 |
248 |
1383 |
|
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
|
239 |
231 |
236 |
234 |
231 |
228 |
226 |
224 |
222 |
218 |
Решение:
1. Построим расслоенную выборку с пропорциональным размещением.
Наиболее широко применяемый способ заключается в том, что объемы выборок из групп устанавливаются пропорционально объемам соответствующих типических групп, т. е.
В итоге для расчетов получается такая формула:
где ni - объем выборки из i - й типической группы; n - общий объем выборки из генеральной совокупности; Ni - объем i - й типической группы; N - объем генеральной совокупности.
В нашем случае из первой группы мы должны выбрать:
из второй:
С помощью таблицы случайных величин отбираем числа:
Для первой группы – 1, 9, 2, 5
Для второй группы- 22,9,26,2,1,27,25,20,4,11,15,12
Среднее число жителей для первой группы:
Среднее число жителей для второй группы:
Тогда общая средняя равна:
Дисперсия среднего числа жителей первой группы равна:
Второй группы:
Средняя ошибка выборочной средней определяется по следующей формуле:
Предельная ошибка Δ вычисляется на основе знания средней ошибки μ по формуле:
где t - величина, вычисляемая по специальной таблице.
Пусть Р=0,95. Этому значению Р по табл. 1 приложения соответствует t=2. имеем Δ=2*15,15=30,3 т. е. предельная ошибка выборки равна приблизительно 30,3.
Переходим к определению пределов. Чтобы вычислить нижний предел, нужно из выборочной средней вычесть предельную ошибку выборки:
453,56—30,3=423,26
Верхний предел получаем, прибавив к выборочной средней предельную ошибку:
453,56+30,3=483,86
Тогда имеем следующие пределы для генеральной средней :
2. Построим расслоенную выборку, содержащую одинаковое число единиц каждого слоя.
С помощью таблицы случайных величин отбираем числа:
Для первой группы – 1, 9, 2, 5, 6, 3, 7, 4;
Для второй группы- 9,26,2,27,25,4,11,12.
Среднее число жителей для первой группы:
Среднее число жителей для второй группы:
Тогда общая средняя равна:
Дисперсия среднего числа жителей первой группы равна:
Второй группы:
Средняя ошибка выборочной средней определяется по следующей формуле:
Предельная ошибка выборки приблизительно равна:
Переходим к определению пределов:
Нижний предел:
450,94-33,1=417,84.
Верхний предел:
450,94+33,1=484,04.
Тогда имеем следующие пределы для генеральной средней :
3. Построим простую (нерасслоенную) случайную выборку.
Из таблицы случайных чисел отбираем числа, не превосходящие 40, до тех пор, пока не наберем нужных 16 чисел. Получаем:
10, 9, 25, 33, 1, 35, 34, 37, 20, 5, 24, 8, 19,3, 23, 7
Выписанные числа будем считать порядковыми номерами тех элементов генеральной совокупности, которые попали в выборку.
Для дальнейшей работы полезно полученные числа расположить в возрастающем порядке.
№ города |
1 |
3 |
5 |
7 |
8 |
9 |
10 |
19 |
Y |
915 |
666 |
533 |
505 |
499 |
442 |
433 |
310 |
№ города |
20 |
23 |
24 |
25 |
33 |
34 |
35 |
37 |
Y |
298 |
279 |
374 |
271 |
236 |
234 |
231 |
226 |
Среднее число жителей:
Дисперсия среднего числа жителей равна:
Средняя ошибка выборочной средней определяется по следующей формуле:
,
где n - численность выборки;
N - численность генеральной совокупности;
- дисперсия признака x.
Предельная ошибка выборки приблизительно равна:
Переходим к определению пределов:
Нижний предел:
408,875-154,62=254,255
Верхний предел:
408,875+154,62=563,495
Тогда имеем следующие пределы для генеральной средней :
Истинное значение среднего значения по всем 40 городам равно 386,35. Третья выборка дала более точный результат.
Задача №2
Опытный фермер оценивает на глаз урожай персиков, , с каждого дерева в саду с N = V деревьев. Он определил, что их общий вес фунтов. Для некоторой простой случайной выборки объемом n = 10 деревьев все плоды были собраны и взвешены, что дало следующие результаты (см. таблицу 2). Вычислите оценку по регрессии действительного веса и найдите её стандартную ошибку и 95% доверительный интервал.
Таблица 2:
Номер дерева |
||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Действительный вес, yi |
71,98 |
49,56 |
59 |
68,44 |
79,06 |
53,1 |
46,02 |
67,26 |
83,78 |
74,34 |
Оценка веса, xi |
69,62 |
55,46 |
61,36 |
70,8 |
79,06 |
56,64 |
51,92 |
68,44 |
89,68 |
68,44 |
Решение:
Составим уравнение регрессии:
,
где b – коэффициент регрессии:
Для вычисления коэффициента регрессии составим вспомогательную таблицу:
69,62 |
71,98 |
2,478 |
6,726 |
16,66703 |
6,140484 |
55,46 |
49,56 |
-11,682 |
-15,694 |
183,3373 |
136,4691 |
61,36 |
59 |
-5,782 |
-6,254 |
36,16063 |
33,43152 |
70,8 |
68,44 |
3,658 |
3,186 |
11,65439 |
13,38096 |
79,06 |
79,06 |
11,918 |
13,806 |
164,5399 |
142,0387 |
56,64 |
51,3 |
-10,502 |
-12,154 |
127,6413 |
110,292 |
51,92 |
46,02 |
-15,222 |
-19,234 |
292,7799 |
231,7093 |
68,44 |
67,26 |
1,298 |
2,006 |
2,603788 |
1,684804 |
89,68 |
83,78 |
22,538 |
18,256 |
417,539 |
507,9614 |
68,44 |
74,34 |
1,298 |
9,086 |
11,79363 |
1,684804 |
67,142 |
65,254 |
|
|
1264,717 |
1184,793 |
Коэффициент регрессии b = 1,067.
Тогда оценка по регрессии суммарного значения будет равна: .
Найдем :
Дисперсия величины вычисляется по приближенной формуле:
Стандартная ошибка величины равна: .