Ошибки выборки

При всех своих достоинствах выборочное наблюдение всегда связано с определенными ошибками получаемых характеристик. Эти ошибки называются ошибками репрезентативности (представительности).

Ошибка репрезентативности (ошибка выборки) – это расхождение между выборочной и генеральной характеристикой (средней), т.е. характеристикой, которая может быть получена при проведении сплошного наблюдения. Ошибки репрезентативности, или, ошибки представительности, характерны только для несплошного наблюдения.

Ошибки репрезентативностиобусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную. Получаемые расхождения или ошибки репрезентативности позволяют заключить, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует различать систематические и случайные ошибки репрезентативности.

Систематическиеошибки репрезентативностисвязаны с нарушением принципов формирования выборочной совокупности: установленных правил сбора или обработки информации. Например, вследствие каких-либо причин, связанных с организацией отбора, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными.

Случайныеошибки репрезентативностиобусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Случайные ошибки возникают в результате того, что значения признаков по выборочной совокупности не характеризуют в полном объёме генеральную совокупность. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Получаемые случайные ошибки могут быть статистически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность.

Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.

В каждом конкретном случае ошибки репрезентативности рассчитываются по специальным формулам, зависящим от вида, метода и способа формирования выборочной совокупности.

Величина случайной ошибки репрезентативности зависит от следующих факторов:

1. Принятый способ формирования выборки (что является единицей отбора, какой способ отбора единиц используется, как размещаются отбираемые единицы в генеральной совокупности).

2. Объём выборки.

3. Степень вариации (колеблемости) изучаемого признака в генеральной совокупности.

Надёжность выборочной совокупности проверяется показателями средней и предельной ошибки выборки. В общем виде ошибка средней величины количественного признака определяется как .

Величина выборочной средней будет меняться в зависимости от состава выборочной совокупности. Таким образом, эти показатели являются случайными величинами, т.е. могут принимать различные значения. В связи с этим необходимо определить среднюю ошибку выборки, т.е. среднюю из возможных ошибок.

Значение средней ошибки выборки будет зависеть от объёма выборочной совокупности и степени варьирования изучаемого признака.

Во-первых, чем больше единиц попадает в выборочную совокупность, тем полнее она характеризует (представляет, или репрезентирует) генеральную. Следовательно, тем меньше средняя ошибка выборки и наоборот.

Во-вторых, чем меньше вариация изучаемого признака, а, следовательно, и дисперсия, тем меньше и средняя ошибка.

Указанные зависимости используются при расчётах величины средней ошибки выборки, когда не известны характеристики генеральной совокупности (например, ) и нет возможности определить фактические ошибки выборки по рассмотренным выше формулам.

Величина средней ошибки выборки различна для отдельных разновидностей случайного отбора.

Таблица 24

Характеристика видов средней ошибки выборки1

Вид отбора Ошибка средней
1. Собственно-случайный
1.1. повторный
1.2. бесповторный , где
– доля выборки
2. Механический2
3. Типический , где
– средняя из внутригрупповых дисперсий по выборочной совокупности3;

3.1. повторный
3.2. бесповторный
4. Серийный , где
r – число отобранных серий; – межгрупповая дисперсия серийной выборки4
4.1. повторный
4.2. бесповторный , где
R – общее число серий

1 расшифровку условных обозначений см. в п. 9.1

2 При достаточно большой совокупности этот отбор близок к собственно-случайному бесповторному отбору.

3 Средняя из внутригрупповых дисперсий по выборочной совокупности рассчитывается как: , где – внутригрупповая дисперсия для i-й группы; ni – численность i-й группы; n – численность выборочной совокупности.

Загрузка...

4 Межгрупповая дисперсия серийной выборки рассчитывается как: , где – средняя i-й серии; – общая средняя по выборочной совокупности.

Однако вследствие того, что точное значение дисперсии признака в генеральной совокупности ( ) чаще всего не известно, на практике используют выборочную дисперсию ( ). В соответствии с действием закона больших чисел выборочная совокупность при достаточно большом объёме выборки достаточно точно воспроизводит свойства генеральной совокупности.

При собственно-случайном бесповторном отборе происходит сокращение численности генеральной совокупности на величину . Множитель будет всегда меньше единицы, поэтому средняя ошибка выборки при бесповторном отборе всегда будет меньше, чем при повторном.

Если число единиц генеральной совокупности N неизвестно или численность выборочной совокупности n очень мало по сравнению с N, то значение множителя будет близко к единице. В этом случае им можно будет пренебречь, даже если выборка организуется как бесповторная.

При механической выборке также может появиться опасность систематической ошибки, обусловленной случайным совпадением выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности. Так, при переписи населения 1989 г. в ходе 25%-го выборочного обследования семей имела место опасность попадания в выборку квартир только одного типа (например, только однокомнатных или только трехкомнатных), так как на лестничных площадках многих типовых домов располагаются именно по 4 квартиры. Чтобы избежать систематической ошибки, в каждом новом подъезде счетчик менял начало отбора.

Типическая выборка даёт более точные результаты по сравнению с другими способами отбора, т.к. представительство каждой типологической группы обеспечивает репрезентативность выборки. В этом случае исключается влияние межгрупповой дисперсии на среднюю ошибку выборки. При определении средней ошибки типической выборки в качестве показателя вариации используется средняя из внутригрупповых дисперсий:

Следовательно, на величине полученной ошибки будет сказываться различие между единицами внутри этих групп, т.е. внутригрупповая вариация. Поэтому, ошибка типической выборки будет определяться величиной не общей дисперсии, а только ее части – средней из внутригрупповых дисперсий.

При использовании серийной выборки из генеральной совокупности случайным образом отбираются равновеликие группы единиц (серии, гнёзда), которые затем полностью и подробно изучаются.

В связи с тем, что при серийном отборе внутри отобранных групп обследуются все без исключения единицы, внутригрупповая вариация признака не отразится на ошибках выборочного наблюдения. В то же время, обследуются не все группы, а только попавшие в выборку.

В выделенных группах (сериях) исследуются все единицы. В связи с этим средняя ошибка выборки при условии отбора равновеликих серий зависит только от межгрупповой (или межсерийной) дисперсии.

Ошибка выборки или отклонение выборочной средней от средней генеральной находится в прямой зависимости от дисперсии изучаемого признака в генеральной совокупности, и в обратной зависимости – от объема выборки.

При проведении выборочного наблюдения дисперсия изучаемого признака в генеральной совокупности, как правило, не известна.

В связи с тем, что на практике в большинстве случаев из генеральной совокупности в определенный момент времени производится только одна выборка, дисперсия изучаемого признака по этой выборке и используется при расчете ошибки.

В каждой конкретной выборке разность между выборочной и генеральной средней может быть меньше, больше или равной средней ошибке выборки ( ˂ ; ˃ ; ). При этом каждый из перечисленных вариантов имеет различную вероятность появления. В связи с этим можно считать, что разность между выборочной и генеральной средней является предельной ошибкой, связанной со средней ошибкой и определённой вероятностью появления. Предельная ошибка необходима для определения возможных границ значений характеристик генеральной совокупности. Согласно теореме А.М.Ляпунова при достаточно большом количестве наблюдений вероятность того, что разность между выборочной и генеральной средней не превзойдёт по своему абсолютному значению некоторую величину , равна интегралу Лапласа (интегральной функции Лапласа).

Величина и есть предельная ошибка выборки. Если обозначим её как , то получим:

.

Предельная ошибка выборки равна t числу средних ошибок выборки.

Значения интеграла Лапласа при различных величинах t как коэффициента кратности средней ошибки выборки представлены в специальных статистических таблицах. Рассмотрим наиболее часто используемые уровни доверительной вероятности (значения интеграла Лапласа) и соответствующие значения t для выборок большого объёма ( ):

P 0,683 0,950 0,954 0,997
t 1,000 1,960 2,000 3,000

Судя по значениям, приведённым выше можно утверждать, что в 68,3% случаев предельная ошибка не превысит значения . При t=2 с вероятностью 0,954 можно утверждать что расхождение между выборочной средней и генеральной средней будет не больше двукратной величины средней ошибки выборки ( ) и т.д.

Как можно судить по последнему приведённому в таблице значению интегральной функции (0,997), вероятность появления ошибки равной или большей утроенному значению средней ошибки ( ) равна 0,3% (или 1-0,997 = 0,003). Такое маловероятное событие считается практически невозможным, поэтому величину можно принять за предел возможной ошибки выборки.

Кроме абсолютных значений предельной ошибки нередко рассчитывают и предельную относительную ошибку выборочной средней:

.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

+ 66 = 76