Выборочное наблюдение

5. Выборочное наблюдение

5.1. Понятие выборочного наблюдения

Выборочный метод используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением. Например, дегустация, испытание кирпичей на прочность и т.п. Выборочное наблюдение используется также для проверки результатов сплошного наблюдения.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают п, во всей ГС – N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, т.е. от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая..

м

5.2. Способы формирования выборки

1. Случайная выборка: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному объему выборки. На практике вместо жеребьевки используют генераторы случайных чисел. Данный способ отбора может быть повторным (когда каждая единица, отобранная в выборку, после проведения наблюдения возвращается в ГС и может быть вновь подвергнута обследованию) и бесповторным (когда обследованные единицы в ГС не возвращаются и не могут быть обследованы повторно). При повторном отборе вероятность попадания в выборку для каждой единицы ГС остается неизменной, а при бесповторном отборе она меняется (увеличивается), но для оставшихся в ГС после отбора из нее нескольких единиц, вероятность попадания в выборку одинакова.

Механическая: отбираются единицы генеральной совокупности с постоянным шагом N/п. Так, если она генеральная совокупность содержит 100 тыс.ед., а требуется выбрать 1 тыс.ед., то в выборку попадет каждая сотая единица.

Типическая (стратифицированная, расслоенная) выборка осуществляется из неоднородной генеральной совокупности, когда ее предварительно разбивают на однородные группы, после чего производят отбор единиц из каждой группы в выборочную совокупность случайный или механическим способом пропорционально их численности в генеральной совокупности. Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Разбиение генеральной совокупности на группы обеспечивает большую репрезентативность типической выборки.

Серийная выборка: случайным или механическим способом выбирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение. Применение серийной выборки обусловлено тем, что многие товары для их транспортировки и хранения упаковываются в пачки, ящики, коробки и т.д. Поэтому при контроле качества товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать в случайном порядке по одной единице товара.

5.3. Средняя ошибка выборки

После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним относят среднюю величину изучаемого признака и долю единиц, обладающих каким-либо значением этого признака. Однако, если ГС произвести несколько выборок, определив при этом их обобщающие характеристики, то можно установить, что их значения будут различными, кроме того, они будут отличаться и от реального их значения в ГС, если такое определить с помощью сплошного наблюдения. Другими словами, обобщающие характеристики, рассчитанные по данным выборки, будут отличаться от их реальных значений в ГС, поэтому введем следующие условные обозначения (табл. 23).

Таблица SEQ Таблица \* ARABIC 23. Условные обозначения

Показатель

Совокупность

генеральная

выборочная

Число единиц совокупности

N

n

Число групп в совокупности

M

m

Среднее значение

Доля единиц, обладающих каким-либо значением признака

d

Общая дисперсия

Факторная (межгрупповая) дисперсия

δ2

δ2

Случайная (внутригрупповая) дисперсия

σi2

σi2

Разность между значением обобщающих характеристик выборочной и генеральной совокупностей называется ошибкой выборки, которая подразделяется на ошибку регистрации и ошибку репрезентативности. Первая возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая возникает из-за несоблюдения принципа случайности отбора единиц в выборку. Ее сложнее обнаружить и устранить, она гораздо больше первой и потому ее измерение является основной задачей выборочного наблюдения.

5.4. Предельная ошибка выборки

Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки .

∆=t×µ

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки. Определяется t по таблице удвоенной нормированной функции Лапласса.

Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950, которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t и рассчитывают предельную ошибку выборки.

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности по формуле (70) – для среднего значения, и по формуле (71) – для доли единиц, обладающих каким-либо значением признака:

или(–) (+)(70)

или(–) d (+)(71)

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

Случайная выборка.

Определение средней ошибки при нахождении среднего значения признака в генеральной совокупности

При нахождении среднего значения признака по генеральной совокупности формулы для средней ошибки используются следующие:

Повторная случайная выборка

= ;

Бесповторная случайная выборка

=

Из формул видно, что средняя ошибка меньше у бесповторной выборки, что и обусловливает ее более широкое применение.

Определение средней ошибки при нахождении доли с определенным значением признака в генеральной совокупности

Когда требуется узнать долю значений с определенными значением признака в генеральной совокупности, рассчитывают дисперсию для доли и подставляют её вместо дисперсии для значения признака.

Выборочная дисперсия для доли с определенным значением признака рассчитывается по следующей формуле:

σ2%=d×(1-d)

После этого рассчитываем среднюю ошибку:

Повторная случайная выборка

µ=σ2%n;

Бесповторная случайная выборка

µ=σ2%n×(1-nN)

Определение необходимой численности выборочной совокупности для достижения заданной предельной ошибки выборки

Часто при разработке программы выборочного наблюдения определяется конкретное значение предельной ошибки с заданным уровнем вероятности. Неизвестной при этом остается минимальная численность выборки, обеспечивающая заданную точность.

Необходимую численности выборки можно определить по формулам.

для повторной выборки n = ;

для бесповторной выборки n = .

При определении необходимой численности выборки для определения доли значений в генеральной совокупности с определенным значением признака вместо общей дисперсии по выборке в формуле используют общую дисперсию доли по выборке σ2%.

Определение вероятности предполагаемого значения показателей

Для определения вероятности выбранных значений необходимо найти коэффициент t, используя который находим вероятность события по таблице удвоенной нормированной функции Лапласа. Определяется t по формуле.

t=∆µ;

Такие же формулы применяются для механической выборки.

Типическая выборка

При определении средней ошибки типической выборки используется

случайная (внутригрупповая) дисперсия по выборке σi2.

Средняя ошибка выборки определяется по следующим формулам:

Типическая повторная выборка:

µ=σi2n

типическая бесповторная выборка

µ=σi2n×(1-nN)

Напомним формулу случайной дисперсии:

σi2  =(σi2*ni)n

Где σi2 – дисперсия, рассчитанная внутри i-ой группы,

ni- количество элементов в i-ой группе (частота группы),

n – число элементов во всей выборке

Случайная дисперсия для доли значений по выборке рассчитывается аналогично

σi2%= (σi2%×ni)n

где Где σi2% – дисперсия доли, рассчитанная внутри i-ой группы выборки,

ni- количество элементов в i-ой группе (частота группы),

n – число элементов во всей выборке

Выборочная дисперсия для доли с определенным значением признака рассчитывается по следующей формуле:

σ2%=d×(1-d)

Повторная случайная выборка

µ=σi2%n

;

Бесповторная случайная выборка

µ=σi2%n×(1-nN)

Серийная выборка

При вычислении средней ошибки выборки при серийном отборе используется факторная (межгрупповая) дисперсия. Вместо понятия количество элементов в выборке (n) применяется понятие число отобранных серий (групп) в выборке (m). Серии могут быть равновеликие (во всех сериях одинаковое количество элементов) и неравновеликие (в всех сериях неодинаковое количество элементов). Чаще всего применяется отбор с равновеликими сериями, поэтому формулы приведены именно для этого случая.

Формула межгрупповой дисперсии для серийной выборки (δ2) в несколько преобразованном виде при вычислении интервалов значений признака выглядит так:

δ2=(xi-x)2m,

Где xi - среднее значение признака в i-ой серии,

x - среднее значение по всей выборке,

m - число равновеликих серий в выборке.

При расчете среднего значения изучаемого признака cредняя ошибка выборки рассчитывается по следующим формулам:

Для повторной выборки:

µ=δ2m

Для бесповторной выборки

µ=δ2m×(1-mM)

При определении доли с определенным значением признака факторную дисперсию находят по следующей формуле:

δ%2=(di-d)2m

Где di – доля значений с определенным значением признака в i-ой серии,

d - доля значений с определенным значением признака по всей выборке,

m - число равновеликих серий в выборке.

При расчете доли элементов с определенным значением признака cредняя ошибка выборки рассчитывается по следующим формулам:

Для повторной выборки:

µ=δ%2m

Для бесповторной выборки

µ=δ%2m×(1-mM)

5.6. Методические указания

Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 24):

Таблица SEQ Таблица \* ARABIC 24. Результаты бесповторного выборочного наблюдения на предприятии

Доход, у.е.

до 300

300-500

500-700

700-1000

более 1000

Число рабочих

8

28

44

17

3

С вероятностью 0,950 определить:

среднемесячный размер дохода работников данного предприятия;

долю рабочих предприятия, имеющих месячный доход более 700 у.е.;

необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.;

необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

Решение. Для расчета обобщающих характеристик выборки построим вспомогательную таблицу 25.

Таблица SEQ Таблица \* ARABIC 25. Вспомогательные расчеты для решения задачи

X

f

Х’

Xf

-)2

(Х’ -)2f

до 300

8

200

1600

137641

1101128

300 - 500

28

400

11200

29241

818748

500 - 700

44

600

26400

841

37004

700 - 1000

17

850

14450

77841

1323297

более 1000

3

1150

3450

335241

1005723

Итого

100

 

57100

 

4285900

По формуле (11) рассчитаем средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (28) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: = 4285900/100 = 42859.

Теперь можно определить среднюю ошибку выборки по формуле (66): = = 19,640 (у.е.).

В нашей задаче = 0,950, значит t = 1,96. Тогда предельная ошибка выборки по формуле (67):

= 1,96*19,64 = 38,494 (у.е.).

Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в ГС необходимо определить их долю: w = 20/100 = 0,2 или 20%, а затем ее дисперсию по формуле  = w(1-w) = 0,2*(1–0,2) = 0,16. Тогда можно рассчитать среднюю ошибку выборки по формуле (66): = = 0,038 или 3,8%. А затем и предельную ошибку выборки по формуле (67):

= 1,96*0,038 = 0,075 или 7,5%.

Доверительный интервал среднего дохода находим по формуле (70):

571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е.

Аналогично определяем доверительный интервал для доли по формуле (71):

0,2-0,075 p0,2+0,075 или 0,125 p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%.

В нашей задаче выборка бесповторная, значит, воспользуемся формулой (73), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (= 42859) и доли рабочих с доходами более 700 у.е. (= 0,16):

nб/повт = = 62 (чел.),nб/повт= = 197 (чел.).

Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

5.7. Контрольные задания

Для изучения вкладов населения в коммерческом банке города была проведена 5%-я случайная бесповторная выборка лицевых счетов, в результате которой в таблице 26 получено распределение клиентов по размеру вкладов.

Таблица SEQ Таблица \* ARABIC 26. Варианты выполнения контрольного задания

Размер вклада, у.е.

Число вкладчиков, чел.

Вариант

1

2

3

4

5

6

7

8

9

10

до 5000

10

80

100

50

60

30

90

20

70

40

5 000 – 15 000

40

60

150

30

40

110

75

65

90

80

15 000 – 30 000

25

35

70

90

120

90

130

140

60

95

30 000 – 50 000

30

45

40

5

80

30

60

75

20

115

свыше 50 000

15

10

30

25

50

15

25

5

10

5

С вероятностью 0,954 определить:

средний размер вклада во всем банке;

долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;

необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;

необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.

n = ;

← Предыдущая
Страница 1
Следующая →

Файл

8. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ.docx

8. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ.docx
Размер: 698.4 Кб

.

Пожаловаться на материал

Понятие выборочного наблюдения. Способы формирования выборки. Средняя ошибка выборки. Предельная ошибка выборки Выборочный метод используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Искать ещё по теме...

Похожие материалы:

Физиология. Ответы

Вопросы и ответы к экзаменам. Физиология - это наука о жизнедеятельности человеческого организма, о деятельности его отдельных органов и систем органов.

Этнические стереотипы

Переход от планиметрии к стереометрии. Особенности и значение первых уроков стереометрии

Школьный курс геометрии состоит из двух частей: планиметрии и стереометрии. Задачи, которые следует использовать для формирования у школьников пространственных представлений, должны быть двух типов

Определения

Физико-химические методы анализа в аналитической химии

Курсовой проект. Аналитическая химия – это наука о способах идентификации химических соединений, о принципах и методах определения химического состава веществ и их структуры.

Сохранить?

Пропустить...

Введите код

Ok