Выборочное наблюдение

5. Выборочное наблюдение

5.1. Понятие выборочного наблюдения

Выборочный метод используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением. Например, дегустация, испытание кирпичей на прочность и т.п. Выборочное наблюдение используется также для проверки результатов сплошного наблюдения.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают п, во всей ГС – N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, т.е. от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая..

м

5.2. Способы формирования выборки

1. Случайная выборка: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному объему выборки. На практике вместо жеребьевки используют генераторы случайных чисел. Данный способ отбора может быть повторным (когда каждая единица, отобранная в выборку, после проведения наблюдения возвращается в ГС и может быть вновь подвергнута обследованию) и бесповторным (когда обследованные единицы в ГС не возвращаются и не могут быть обследованы повторно). При повторном отборе вероятность попадания в выборку для каждой единицы ГС остается неизменной, а при бесповторном отборе она меняется (увеличивается), но для оставшихся в ГС после отбора из нее нескольких единиц, вероятность попадания в выборку одинакова.

Механическая: отбираются единицы генеральной совокупности с постоянным шагом N/п. Так, если она генеральная совокупность содержит 100 тыс.ед., а требуется выбрать 1 тыс.ед., то в выборку попадет каждая сотая единица.

Типическая (стратифицированная, расслоенная) выборка осуществляется из неоднородной генеральной совокупности, когда ее предварительно разбивают на однородные группы, после чего производят отбор единиц из каждой группы в выборочную совокупность случайный или механическим способом пропорционально их численности в генеральной совокупности. Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Разбиение генеральной совокупности на группы обеспечивает большую репрезентативность типической выборки.

Серийная выборка: случайным или механическим способом выбирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение. Применение серийной выборки обусловлено тем, что многие товары для их транспортировки и хранения упаковываются в пачки, ящики, коробки и т.д. Поэтому при контроле качества товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать в случайном порядке по одной единице товара.

5.3. Средняя ошибка выборки

После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним относят среднюю величину изучаемого признака и долю единиц, обладающих каким-либо значением этого признака. Однако, если ГС произвести несколько выборок, определив при этом их обобщающие характеристики, то можно установить, что их значения будут различными, кроме того, они будут отличаться и от реального их значения в ГС, если такое определить с помощью сплошного наблюдения. Другими словами, обобщающие характеристики, рассчитанные по данным выборки, будут отличаться от их реальных значений в ГС, поэтому введем следующие условные обозначения (табл. 23).

Таблица SEQ Таблица \* ARABIC 23. Условные обозначения

Показатель

Совокупность

генеральная

выборочная

Число единиц совокупности

N

n

Число групп в совокупности

M

m

Среднее значение

Доля единиц, обладающих каким-либо значением признака

d

Общая дисперсия

Факторная (межгрупповая) дисперсия

δ2

δ2

Случайная (внутригрупповая) дисперсия

σi2

σi2

Разность между значением обобщающих характеристик выборочной и генеральной совокупностей называется ошибкой выборки, которая подразделяется на ошибку регистрации и ошибку репрезентативности. Первая возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая возникает из-за несоблюдения принципа случайности отбора единиц в выборку. Ее сложнее обнаружить и устранить, она гораздо больше первой и потому ее измерение является основной задачей выборочного наблюдения.

5.4. Предельная ошибка выборки

Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки .

∆=t×µ

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки. Определяется t по таблице удвоенной нормированной функции Лапласса.

Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950, которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t и рассчитывают предельную ошибку выборки.

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности по формуле (70) – для среднего значения, и по формуле (71) – для доли единиц, обладающих каким-либо значением признака:

или(–) (+)(70)

или(–) d (+)(71)

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

Случайная выборка.

Определение средней ошибки при нахождении среднего значения признака в генеральной совокупности

При нахождении среднего значения признака по генеральной совокупности формулы для средней ошибки используются следующие:

Повторная случайная выборка

= ;

Бесповторная случайная выборка

=

Из формул видно, что средняя ошибка меньше у бесповторной выборки, что и обусловливает ее более широкое применение.

Определение средней ошибки при нахождении доли с определенным значением признака в генеральной совокупности

Когда требуется узнать долю значений с определенными значением признака в генеральной совокупности, рассчитывают дисперсию для доли и подставляют её вместо дисперсии для значения признака.

Выборочная дисперсия для доли с определенным значением признака рассчитывается по следующей формуле:

σ2%=d×(1-d)

После этого рассчитываем среднюю ошибку:

Повторная случайная выборка

µ=σ2%n;

Бесповторная случайная выборка

µ=σ2%n×(1-nN)

Определение необходимой численности выборочной совокупности для достижения заданной предельной ошибки выборки

Часто при разработке программы выборочного наблюдения определяется конкретное значение предельной ошибки с заданным уровнем вероятности. Неизвестной при этом остается минимальная численность выборки, обеспечивающая заданную точность.

Необходимую численности выборки можно определить по формулам.

для повторной выборки n = ;

для бесповторной выборки n = .

При определении необходимой численности выборки для определения доли значений в генеральной совокупности с определенным значением признака вместо общей дисперсии по выборке в формуле используют общую дисперсию доли по выборке σ2%.

Определение вероятности предполагаемого значения показателей

Для определения вероятности выбранных значений необходимо найти коэффициент t, используя который находим вероятность события по таблице удвоенной нормированной функции Лапласа. Определяется t по формуле.

t=∆µ;

Такие же формулы применяются для механической выборки.

Типическая выборка

При определении средней ошибки типической выборки используется

случайная (внутригрупповая) дисперсия по выборке σi2.

Средняя ошибка выборки определяется по следующим формулам:

Типическая повторная выборка:

µ=σi2n

типическая бесповторная выборка

µ=σi2n×(1-nN)

Напомним формулу случайной дисперсии:

σi2  =(σi2*ni)n

Где σi2 – дисперсия, рассчитанная внутри i-ой группы,

ni- количество элементов в i-ой группе (частота группы),

n – число элементов во всей выборке

Случайная дисперсия для доли значений по выборке рассчитывается аналогично

σi2%= (σi2%×ni)n

где Где σi2% – дисперсия доли, рассчитанная внутри i-ой группы выборки,

ni- количество элементов в i-ой группе (частота группы),

n – число элементов во всей выборке

Выборочная дисперсия для доли с определенным значением признака рассчитывается по следующей формуле:

σ2%=d×(1-d)

Повторная случайная выборка

µ=σi2%n

;

Бесповторная случайная выборка

µ=σi2%n×(1-nN)

Серийная выборка

При вычислении средней ошибки выборки при серийном отборе используется факторная (межгрупповая) дисперсия. Вместо понятия количество элементов в выборке (n) применяется понятие число отобранных серий (групп) в выборке (m). Серии могут быть равновеликие (во всех сериях одинаковое количество элементов) и неравновеликие (в всех сериях неодинаковое количество элементов). Чаще всего применяется отбор с равновеликими сериями, поэтому формулы приведены именно для этого случая.

Формула межгрупповой дисперсии для серийной выборки (δ2) в несколько преобразованном виде при вычислении интервалов значений признака выглядит так:

δ2=(xi-x)2m,

Где xi - среднее значение признака в i-ой серии,

x - среднее значение по всей выборке,

m - число равновеликих серий в выборке.

При расчете среднего значения изучаемого признака cредняя ошибка выборки рассчитывается по следующим формулам:

Для повторной выборки:

µ=δ2m

Для бесповторной выборки

µ=δ2m×(1-mM)

При определении доли с определенным значением признака факторную дисперсию находят по следующей формуле:

δ%2=(di-d)2m

Где di – доля значений с определенным значением признака в i-ой серии,

d - доля значений с определенным значением признака по всей выборке,

m - число равновеликих серий в выборке.

При расчете доли элементов с определенным значением признака cредняя ошибка выборки рассчитывается по следующим формулам:

Для повторной выборки:

µ=δ%2m

Для бесповторной выборки

µ=δ%2m×(1-mM)

5.6. Методические указания

Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 24):

Таблица SEQ Таблица \* ARABIC 24. Результаты бесповторного выборочного наблюдения на предприятии

Доход, у.е.

до 300

300-500

500-700

700-1000

более 1000

Число рабочих

8

28

44

17

3

С вероятностью 0,950 определить:

среднемесячный размер дохода работников данного предприятия;

долю рабочих предприятия, имеющих месячный доход более 700 у.е.;

необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.;

необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

Решение. Для расчета обобщающих характеристик выборки построим вспомогательную таблицу 25.

Таблица SEQ Таблица \* ARABIC 25. Вспомогательные расчеты для решения задачи

X

f

Х’

Xf

-)2

(Х’ -)2f

до 300

8

200

1600

137641

1101128

300 - 500

28

400

11200

29241

818748

500 - 700

44

600

26400

841

37004

700 - 1000

17

850

14450

77841

1323297

более 1000

3

1150

3450

335241

1005723

Итого

100

 

57100

 

4285900

По формуле (11) рассчитаем средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (28) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: = 4285900/100 = 42859.

Теперь можно определить среднюю ошибку выборки по формуле (66): = = 19,640 (у.е.).

В нашей задаче = 0,950, значит t = 1,96. Тогда предельная ошибка выборки по формуле (67):

= 1,96*19,64 = 38,494 (у.е.).

Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в ГС необходимо определить их долю: w = 20/100 = 0,2 или 20%, а затем ее дисперсию по формуле  = w(1-w) = 0,2*(1–0,2) = 0,16. Тогда можно рассчитать среднюю ошибку выборки по формуле (66): = = 0,038 или 3,8%. А затем и предельную ошибку выборки по формуле (67):

= 1,96*0,038 = 0,075 или 7,5%.

Доверительный интервал среднего дохода находим по формуле (70):

571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е.

Аналогично определяем доверительный интервал для доли по формуле (71):

0,2-0,075 p0,2+0,075 или 0,125 p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%.

В нашей задаче выборка бесповторная, значит, воспользуемся формулой (73), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (= 42859) и доли рабочих с доходами более 700 у.е. (= 0,16):

nб/повт = = 62 (чел.),nб/повт= = 197 (чел.).

Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

5.7. Контрольные задания

Для изучения вкладов населения в коммерческом банке города была проведена 5%-я случайная бесповторная выборка лицевых счетов, в результате которой в таблице 26 получено распределение клиентов по размеру вкладов.

Таблица SEQ Таблица \* ARABIC 26. Варианты выполнения контрольного задания

Размер вклада, у.е.

Число вкладчиков, чел.

Вариант

1

2

3

4

5

6

7

8

9

10

до 5000

10

80

100

50

60

30

90

20

70

40

5 000 – 15 000

40

60

150

30

40

110

75

65

90

80

15 000 – 30 000

25

35

70

90

120

90

130

140

60

95

30 000 – 50 000

30

45

40

5

80

30

60

75

20

115

свыше 50 000

15

10

30

25

50

15

25

5

10

5

С вероятностью 0,954 определить:

средний размер вклада во всем банке;

долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;

необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;

необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.

n = ;

← Предыдущая
Страница 1
Следующая →

Файл

8. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ.docx

8. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ.docx
Размер: 698.4 Кб

.

Пожаловаться на материал

Понятие выборочного наблюдения. Способы формирования выборки. Средняя ошибка выборки. Предельная ошибка выборки Выборочный метод используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Искать ещё по теме...

Похожие материалы:

Охарактеризуйте особливості географічного розташування та природно-ресурсний потенціал Фінляндії

Загальні відомості про країну. Природні умови і ресурси. Державно-політичний устрій та територіально-адміністративний поділ Республіки Фінляндія. Проаналізуйте основні етапи історичного розвитку фінської державності. Процес формування державної символіки Республіки Фінляндія. Проблеми економічного розвитку Фінляндії на рубежі 20-21 ст. Сучасні політичні партії Фінляндії.

Резина как технический материал. Учебная (ознакомительная) практика

индивидуальное задание Кафедра «Химическая технология» Факультет «Химический»

Основы безопасности жизнедеятельности

Основы безопасности жизнедеятельности ОБЖ РК. Гражданская оборона. Стихийные бедствия. Классификация чрезвычайных ситуаций. Государственный контроль за соблюдением трудового законодательства Республики Казахстан.

Д.Ф. Харламова и ее мемуары

К востоку от г. Сланцы в с. Сижно расположена старинная церковь во имя Св. Арх. Михаила. Харламовы 

Розыск должника, его имущества, розыск ребенка: порядок и органы, осуществляющие розыск.ст.65

Основания: Осуществляем если исполнительные действия, предусмотренные ФЗ, не позволили установить местонахождение должника, его имущества или местонахождение ребенка.

Сохранить?

Пропустить...

Введите код

Ok