Приведенная ниже формула для расчета объема выборки используется в тех случаях, когда опрашиваемым (респондентам) задается только один вопрос, на который существует только два варианта ответа. Например, «Да» и «Нет»; «Пользуюсь» и «Не пользуюсь». Конечно, данную формулу можно применять только при проведении простейших исследований. Если Вам нужно определить объем выборки при проведении более масштабных исследований, например анкетирования, то следует использовать другие формулы.

Простая формула для расчета объема выборки

где: n – объем выборки;

z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности. Этот показатель характеризует возможность, вероятность попадания ответов в специальный - доверительный интервал. На практике уровень доверительности часто принимают за 95% или 99%. Тогда значения z будут соответственно 1,96 и 2,58;

p – вариация для выборки, в долях. По сути, p - это вероятность того, что респонденты выберут той или иной вариант ответа. Допустим, если мы считаем, что четверть опрашиваемых выберут ответ «Да», то p будет равно 25%, то есть p = 0,25;

q = (1 – p);

e – допустимая ошибка, в долях.

Пример расчета объема выборки

Компания планирует провести социологическое исследование с целью выявить долю курящих лиц в населении города. Для этого сотрудники компании будут задавать прохожим один вопрос: «Вы курите?». Возможных вариантов ответа, таким образом, только два: «Да» и «Нет».

Объем выборки в этом случае рассчитывается следующим образом. Уровень доверительности принимается за 95%, тогда нормированное отклонение z = 1,96 . Вариацию принимаем за 50%, то есть условно считаем, что половина респондентов может ответить на вопрос о том, курят ли они - «Да». Тогда p = 0,5 . Отсюда находим q = 1 – p = 1 – 0,5 = 0,5 . Допустимую ошибку выборки принимаем за 10%, то есть e = 0,1 .

Подставляем эти данные в формулу и считаем:

Получаем объем выборки n = 96 человек .

Область применения данной формулы

При проведении простых исследований, когда нужно получить ответ всего на один простой вопрос. При этом шкала ответов, как правило, дихотомического характера. То есть предлагаются (или подразумеваются) варианты ответов по типу «Да» - «Нет», «Черное» - «Белое», и т.д.

Особенности данной формулы расчета объема выборки

Галяутдинов Р.Р.


© Копирование материала допустимо только при указании прямой гиперссылки на

Размер выборки требуется определить перед началом большинства количественных исследований. Определение размера выборки не требуется для качественных исследований (обратите внимание, что здесь понимаются формально количественные методы, такие как контент-анализ; простые описательные проекты относятся к количественным). Расчет размера выборки может не выполнять перед проведением предварительных, пилотных исследований (однако такие исследования обычно выполняются перед реальным планированием научного исследования). В случае сомнений, обязательно обратитесь в то учреждение, которое финансирует исследование или включает его в свой план исследований - отсутствие данные о размере выборки одна из наиболее частых причин отказа в утверждении темы

Почему размер выборки важен для исследователя?

При проведении исследований, которые определяют распространенность некоей характеристики в популяции (например, распространенность астмы у детей), расчет размера выборки необходим для того, чтобы полученные оценки имели желаемую степень точности. Например, распространенность заболевания в 10%, полученная на выборке размером в 20 человек будет иметь 95% доверительный интервал от 1% до 31%, что никак нельзя признать ни точно, ни информативной оценкой. С другой стороны, распространенность заболевания в 10%, полученная на выборке размером в 400 человек будет иметь 95% доверительный интервал от 7% до 13%, что может рассматриваться, как достаточно точный результат. оценка размеров выборки позволяет избежать первого из этих двух вариантов.

В исследованиях, направленных на выявление эффекта (например, разность эффективности двух методов лечения, относительный риск заболевания при наличии или отсутствии фактора риска) оценка размера выборки важна для того, чтобы удостовериться в том, что если клинически или биологически важный эффект существует, то он с высокой степенью вероятности будет обнаружен, иными словами анализ даст статистически значимые результаты. Если размер выборки невелик то даже в случае значительных различий между группами будет невозможно доказать, что они являются следствием чего-то иного, кроме как выборочной вариабельности.

Информация необходимая для расчета размера выборки

Методы оценки размера выборки описаны в ряде учебников по статистике, включая Altman, 1991; Bland, 2000; Armitage, Berry и Matthews, 2002. Две книги специализируются на описании методов оценки размеров выборки в разных ситуациях. Для качественных параметров следует проконсультироваться с работой Manchin и соавт. (1998), для качественных - Lemeshow и соавт. (1996). В обеих книгах приведены таблицы, облегчающие расчет размеров выборки. В случае последовательных испытаний, необходимо обратиться к работе Whitehead (1997).Собственно расчеты размера выборки могут быть выполнены с использованием одной из многочисленных компьютерных программ. Так, программа Stata позволяет анализировать размер выборки, необходимый для сравнения средних и пропорций, а также анализа распространенности. Значительно большее количество опций предлагают специализированные пакеты, такие как nQuery Advisor или UnifyPow.

Расчет размера выборки зависит от следующих факторов, которые надо будет сообщить статистику-консультанту:

  • Изучаемые в исследовании переменные, включая их типы
  • Необходимая мощность исследования
  • Необходимый уровень статистической значимости
  • Размер эффекта, который имеет клиническую значимость
  • Стандартное отклонение для количественных переменных
  • Будет ли использоваться одно- или двусторонний тест значимости
  • Дизайн исследования, иными словами является ли исследование:
    • Рандомизированным контролируемым испытанием
    • Кластерным рандомизированным исследованием
    • Исследованием эквивалентности
    • Нерандомизированным исседованием вмешательства
    • Обсервационным исследованием
    • Исследованием распространенности
    • Изучением чувствительности и специфичности теста

При этом потребуется ответить на ряд дополнительных вопросов:

  • Включаются ли в исследование парные данные?
  • Будут ли в исследовании измерены повторно одни и те же переменные у одного и того же человека?
  • Равны ли включаемые в исследование группы по численности?
  • Являются ли данные иерархическими?

Следует принять во внимание, что нерандомизированные исследования различий или взаимосвязей обычно требуют значительно больший размер выборки для того, чтобы принять во внимание при анализе влияние третьих переменных. При этом исследователя интересует абсолютный размер выборки, а не процент, который она составляет от популяции в целом.

Какие статистические термины используются при описании процесса планировании размера выборки

Нулевая и альтернативная гипотезы

Многие типы статистического анализа направлены на сравнение двух видов лечения, процедур или групп пациентов. Численное значение, которое суммирует интересующие исследователя различия называется эффектом. В других исследованиях эффектом может являться коэффициент корреляции, отношение шансов или относительный риск. Затем мы выдвигаем нулевую и альтернативную гипотезы. Обычно нулевая гипотеза гласит, что эффекта нет (различия между группами равны нулю, относительный риск равен единице, корреляционный коэффициент равен нулю), альтернативная гипотеза предполагает, что эффект есть.

Доверительная вероятность (р-оценка)

р-оценка это вероятность наблюдения в исследовании такого же или более сильного эффекта при условии справедливости нулевой гипотезы. Обычно выражается как пропорция (например, р=0.03)

Уровень значимости

Уровень значимости - это пороговое значение для р-оценки, ниже которого нулевая гипотеза должна быть отвергнута и сделано заключение о том, что имеются доказательства эффекта. Обычно уровень значимости устанавливается на значении 5% (Уровень значимости, несмотря на прямую связь с р-оценкой выражается в процентах: 5% уровень значимости эквивалентен р=0.05). Если наблюдаемой значение меньше 5%, то имеется незначительная вероятность, что в исследовании были бы получены такие результаты, если бы истинного эффекта не было. Поэтому принимается гипотеза о наличии эффекта

Уровень значимости 5% также означает, что имеется практически 5% вероятность придти к выводу о наличии эффекта, хотя на самом деле его нет. Иногда более адекватным является использование 1% уровня значимости, особенно если очень важно избежать заключения о том, что эффект существует тогда, когда на самом деле его нет.

Мощность

Мощность - это вероятность того, что нулевая гипотеза будет адекватно отвергнута, иными словами тогда, когда действительно существуют доказательства реальных различий или взаимосвязей. Ее можно рассматривать как "100 процентов минус вероятность пропуска истинного эффекта". поэтому чем выше мощность, тем меньше вероятность пропуска истинного эффекта. Мощность обычно фиксируется на уровне 80%, 90% или 95%. Мощность не должна быть меньше 80%. Если крайне важно, чтобы исследование не пропустило существующего эффекта, надо стремиться достичь мощности 90% или более.

Клинически важный размер эффекта

Это наименьшие различия между средними групп или процентами событий в них (для отношений шансов самый близкий к единице риск), которые еще можно рассматривать как биологически или клинически значимые. Должна быть сформирована выборка такого размера, чтобы если подобные различия существуют, то в исследовании были бы получены статистически значимые результаты.

Односторонний или двухсторонний тест значимости

При двухстороннем тесте нулевая гипотеза заключается в отсутствии различий, а альтернативная гипотеза предполагает, что различия между группами могут идти в любом направлении. При одностороннем тесте альтернативная гипотеза определяет предполагаемое направление различий, например, что терапия лучше, чем плацебо, а нулевая гипотеза включает ситуации, когда эффект препарата и плацебо одинаков и когда препарат приводит к худшему, по сравнению с плацебо, результату.

Если нет серьезных причин для того, чтобы это не делать, следует пользоваться двухсторонней гипотезой. Ожидание того, что различия пойдут в том или ином направлении недостаточное основание для того, чтобы пользоваться односторонним тестом. Исследователи-медики часто оказываются удивлены, если полученный результат идет в разрез с тем, что ожидалось, очень часто подобная находка имеет иные последствия, по сравнению с отсутствием различий и поэтому она должна быть адекватным образом описана. Односторонний тест не позволяет этого сделать. Примеры ситуаций, в которых односторонний тест может оказаться приемлемы приведены в книге Bland и Altman (1994).

Какие переменные должны учитываться при расчете размера выборки

Расчет размера выборки должен базироваться на анализе основной переменной исхода в данном исследовании.

Если в исследование будут включены дополнительные переменные, которые также рассматриваются, как имеющие важное научное значение, то размер выборки должен таковым, чтобы позволить адекватный анализ этих переменных. Для всех важных в научном плане переменных должен быть проведен и представлен расчет размера выборки.

Учет процента отклика и потерь при наблюдении

Расчетный размер выборки указывает количество пациентов в финальной, анализируемой в конце исследования группе. Поэтому количество лиц, которые должны быть вовлечены в исследование должно быть увеличено в соответствии с ожидаемым откликом, потерям при наблюдении, отказом от следования протоколу и другим возможным причинам потери экспериментальных субъектов. Необходимо четко описать взаимосвязь между ожидаемым количеством участников и объемом формируемой выборки.

Соответствие целям исследования и методам статистического анализа

Адекватность размера выборки должна также быть оценена в соответствии с целью исследования. Например, если целью исследования является демонстрация того, что новое лекарство лучше существующего, необходимо добиться того, чтобы размер выборки позволял обнаружить клинически значимые различия между двумя методами лечения. Однако иногда требуется продемонстрировать, что два лекарственных средства клинически эквивалентны. Этот тип исследований часто называют испытанием эквивалентности или "негативным" испытанием. Вопросы определения размера выборки для этих исследований детально описаны в работе Pocock (1983). Размер выборки в исследованиях, направленных на демонстрацию эквивалентности лекарств больше, чем в исследованиях, которые направлены на выявление различий в эффективности. Обязательно следует убедиться в том, что расчеты размеров выборки связаны с целями и задачами исследования и базируются на данных об основной переменной исхода.

Размеры выборки также должны быть адекватны используемым в исследовании методам анализа, поскольку как размер выборки, так и анализ зависят от выбранного дизайна исследования. Обязательно следует удостовериться в том, что предполагаемые методы анализа и расчеты размера выборки совместимы друг с другом.

Примеры расчета размера выборки.

Если планируемое исследование требует оценки одной единственной частоты, сравнения двух средних или сравнения двух частот, расчеты размера выборки (обычно) остаточно просты и поэтому представлены ниже. Однако мы рекомендуем в любом случае проконсультироваться со статистиком по поводу расчетов размера выборки.

Оценка одной единственной частоты

Примечание: приведенная ниже формула базируется на т.н. "методе примерного нормального распределения" и, если только не планируется создавать очень большую выборку, не рекомендуется для оценки частот близких к 0 или 1 (0: или 100%. В подобных случаях следует пользоваться "точными" методами. Подобная ситуация может наблюдаться при изучении чувствительности и специфичности нового метода диагностики, где предполагается наличие частот, близких к 1 (100%). В данном случае следует проконсультироваться со статистиком или, как минимум, воспользоваться специализированными компьютерными программами.

Сценарий: Используя почтовый опросник оценить распространенность нарушений дыхания у пациентов с бронхиальной астмой, находящихся под наблюдением врача общей практики (Thomas и соавт., 2001)

Требующаяся информация:

  • Основная переменная исхода = наличие или отсутствие нарушений дыхания
  • Предполагаемая частота нарушений = 30% (0.3)
  • Требуемая ширина 95% доверительного интервала = 10% (т.е. +/-5% или от 25% до 35%)

Формула для оценки размера выборки одной единственной частоты:

n=15.4*p*(1-p)/W 2

где n - требуемый размер выборки, р - ожидаемая частота результата (в данном случае 0,3) и W - ширина доверительного интервала (в данном случае 0.1)

Подставляя в формулу значения, получаем:

n=15.4*0.3*(1-0.3)/0.1 2 =324

"Для получения доверительного интервала в +/-5% вокруг оценки распространенности в 30% потребуется выборка из 324 человек. Учитывая 70% частоту отклика на предложение участвовать в исследовании, будет распространено 480 опросников"

Сравнение двух частот

Сценарий: Планируется провести рандомизированное плацебо-контролируемое испытание эффективности колонии-стимулирующего фактора для снижения риска сепсиса у недоношенных детей. Ранее проведенное исследование продемонстрировало, что частота развития сепсиса у таких детей составляет 50% в течение 2 недель после рождения и исследователи считают, что снижение этой частоты до 34% будет являться клинически значимым.

Требующаяся информация:

  • Основная переменная исхода= наличие или отсутствие сепсиса у новорожденных через 14 дней после рождения (терапия проводится на протяжении максимум 72 часов после рождения). Это качественная переменная, представленная частотами.
  • Величина значимых различий = 16% или 0.16 (т.е. 50%-34%)
  • Уровень значимости=5%
  • Мощность=80%
  • Тест=двухсторонний

Формула для расчета размера выборки при сравнении двух частот следующая:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

где n=размер выборки для каждой группы (общий размер выборки в два раза больше)

р 1 =первая частота - в данном случае 0.50

р 2 =вторая частота - в данном случае 0.34

р 1 -р 2 =клинически значимые различия, в данном случае 0.16

Таблица значений для А и В

Уровень значимости

Мощность

Подставляя значения в формулу получим:

n= 2 *[(0.5*0.5+(0.34*0.66)]/ 2 =146

Таким образом, мы получаем количество наблюдений, необходимое для включения в каждую из групп. Общая численность выборки будет в два раза больше, т.е. 292 ребенка

Описание результатов расчета размера выборки может выглядеть следующим образом:

"Выборка в 292 новорожденных (146 в группе лечения и плацебо) будет достаточным для того, чтобы выявить различия в частоте сепсиса 16% с 80% мощностью на 5% уровне достоверности. 16% различия равны разности между 50% частотой сепсиса к 14 дню наблюдения в группе плацебо и 34% частотой в группе лечения."

Сравнение двух средних

Примечание: описанные ниже расчеты справедливы только для случая, когда две группы имеют один и тот же размер.

Сценарий: планируется рандомизированное контролируемое испытание по сравнению краткосрочного психологического лечения в сравнении с обычным лечением для борьбы с суицидальными тенденциями у пациентов, госпитализированных после суицидальной попытки отравления. Суицидальные тенденции измеряются с помощью шкалы Бека. Стандартное отклонение для оценок по этой шкале составляет 7.7 (данные предшествующих исследований) и клинически значимыми считаются различия в 5 баллов по шкале Бека. Предполагается, что из группы лечения выйдут до трети пациентов (Guthrie и соавт., 2001)

Необходимая информация:

  • Основная переменная исхода= шкала суицидальных тенденций Бека. Непрерывная переменная описываемая средними значениями
  • Стандартное отклонение=7.7 баллов
  • Размер клинически значимого эффекта= 5 баллов
  • Уровень значимости=5%
  • Мощность=80%
  • Тест=двухсторонний

Формула для расчета размера выборки при сравнении двух средних следующая:

n= 2 *2*SD 2 /DIFF 2

где n=размер выборки для каждой группы (общий размер выборки в два раза бльше)

SD= стандартное отклонения для основной переменной исхода, в данном случае 7.7

DIFF=клинически важный эффект, в данном случае 5.0

А - зависит от уровня значимости (см. таблицу) - в данном случае 1.96

В - зависит от мощности (см. таблицу) - в данном случае 0.84

Таблица значений для А и В

Уровень значимости

Мощность

Подставляя необходимые значения в формулу получаем:

n= 2 *2*7.7 2 /5.0 2 =38

Таким образом, мы получаем количество наблюдений, необходимое для включения в каждую из групп. Общая численность выборки будет в два раза больше, т.е. 76 человек.

Адекватное описание оценки размеров выборки будет выглядеть следующим образом:

"Для выявления различий в 5 баллов по шкале суицидальных тенденций Бека на 5% уровне значимости с 80% мощностью, принимая стандартное отклонение равным 7.7 баллам, потребуется 38 человек в группу вмешательства и контроля. Это число было увеличено до 60 в группе (общее количество наблюдений 120), для того, чтобы компенсировать потери при наблюдении, составляющие обычно около трети обследуемых"

Примеры неадекватных описаний оценок размера необходимой выборки

Пример 1

"Предшествующее исследование в данной области использовало выборку в 150 человек и получило высоко достоверные результаты (р=0.014), поэтому в данное исследование включается аналогичное количество пациентов"

Предшествующие исследования могли оказаться просто "везучими" в том смысле, что найденные ими значимые результаты являются следствием случайного варьирования выборочных средних. Необходимо рассчитывать размер выборки для данного исследования - включая такие детали, как мощность исследования, уровень значимости, основная изучаемая переменная, размер клинически значимого эффекта, стандартное отклонение (для количественных переменных) и размер каждой группы, если в исследовании будет несколько групп

Пример 2.

"Расчет размера выборки не проводился, поскольку предварительная информация для ее оценки отсутствовала"

Необходимо тщательно проанализировать литературу, чтобы найти информацию, необходимую для расчета размера выборки. Если такой информации нет, можно организовать небольшое предварительное исследование для сбора этой информации.

Если отсутствуют данные о значении стандартного отклонения, расчеты размера выборки могут быть даны в более общем виде, например различия, являющиеся клинически эффективными могут быть описаны не в абсолютных значениях, а в единицах стандартного отклонения.

Вместе с тем, если пишется заявка на грант, направленный на финансирование пилотного исследования для сбора информации, необходимой для расчета размера выборки последующего крупного исследования, то в такой заявке расчет размера выборки не проводится.

"В клинику в течение года поступает 50 пациентов с данным заболеванием. Около 10% из них могут отказаться от участия в исследовании. Поэтому в течение двух лет можно будет набрать выборку размером в 90 человек"

Хотя большинство исследований должны уравновешивать возможности их организации с мощностью, размер выборки не должен определяться на основании только количества доступных для исследования пациентов.

В ситуациях, когда количество пациентов является ограничивающим размер выборки фактором, расчеты все равно должны проводиться для того, чтобы установить а) мощность исследования с данным количеством пациентов по отношению к клинически важным различиям или б) размер эффекта, который может быть выявлен в исследовании данного размера (учитывая его мощность).

В тех случаях, когда доступное количество пациентов слишком мало для того, чтобы выявить клинически значимые различия, можно подумать об увеличении продолжительности исследования или проведения совместного с несколькими исследователями многоцентрового испытания.

Литература

  1. Altman DG. (1991) Practical Statistics for Medical Research. Chapman and Hall, London.
  2. Armitage P, Berry G, Matthews JNS. (2002) Statistical Methods in Medical Research, 4th ed. Blackwell, Oxford.
  3. Bland JM and Altman DG. (1994). One and two sided tests of significance. British Medical Journal 309 248.
  4. Bland M. (2000) An Introduction to Medical Statistics, 3rd. ed. Oxford University Press, Oxford.
  5. Elashoff JD. (2000) nQuery Advisor Version 4.0 User"s Guide. Los Angeles, CA.
  6. Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) Randomised controlled trial of brief psychological intervention after deliberate self poisoning. British Medical Journal 323, 135-138.
  7. Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Adequacy of sample size in health studies. John Wiley & Sons, Chichester.
  8. Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Statistical Tables for the Design of Clinical Studies, Second Edition Blackwell, Oxford.
  9. Pocock SJ. (1983) Clinical Trials: A Practical Approach. John Wiley and Sons, Chichester.
  10. Thomas M, McKinley RK, Freeman E, Foy C. (2001) Prevalence of dysfunctional breathing in patients treated for asthma in primary care: cross sectional survey. British Medical Journal 322, 1098-1100.
  11. Whitehead, J. (1997) The Design and Analysis of Sequential Clinical Trials, revised 2nd. ed. Chichester, Wiley.
Наименование параметра Значение
Тема статьи: Тема 5: Расчет выборки
Рубрика (тематическая категория) Маркетинг

Зачастую размеры исследуемой совокупности велики или для получения информации от всœей совокупности крайне важно затратить чересчур много времени и средств. В этих случаях формируют и исследуют выборочную совокупность. Но следует помнить, что полученные данные всœегда содержат в себе ошибку, о результатах наблюдения можно судить лишь с определœенной степенью достоверности.

Генеральная совокупность - ϶ᴛᴏ множество всœех единиц, являющихся объектами исследования, из которых производится отбор.

Выборочная совокупность – совокупность отобранных для опроса единиц.

Способы построения выборки:

1. Простая случайная выборка – каждый элемент генеральной совокупности имеет равную вероятность попасть в выборочную совокупность. Производится с помощью генератора случайных чисел;

2. Систематическая – первый элемент выборочной совокупности отбирается произвольно, а затем в выборочную совокупность включается каждый i-ый элемент;

3. Стратифицированная (структурированная) – генеральная совокупность делится на несколько страт (групп), а затем способом простой случайной ил систематической выборки производится отбор в каждой из групп;

4. Кластерная выборка – генеральная совокупность делится на кластеры, затем случайным отбором выбирается несколько кластеров и производится исследование всœех объектов выбранных кластеров.

Методы отбора:

1. Повторная выборка – ту или иную единицу, попавшую в выборку после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всœеми прочими единицами при повторном отборе снова попасть в выборку. Общая численность единиц генеральной совокупности в процессе выборки остается неизменной.

2. Бесповторная выборка – единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем отборе не участвует. Общая численность единиц генеральной совокупности сокращается в процессе выборки.

Подходы к определœению размера выборки:

1. Произвольный – бездоказательно принимается, что выборка должна составлять 5 – 10 % от генеральной совокупности. Данный подход является простым в использовании, однако не представляется возможным установить точность полученных результатов. При достаточно большой генеральной совокупности он должна быть весьма дорогим.

2. На базе предыдущего опыта – объём должна быть установлен из ранее проводимых исследований. Подход обладает определœенной логикой при условии, что предыдущая выборка определœена верно.

3. Ориентация на стоимость проведения – в бюджете маркетинговых исследований предусматриваются затраты на проведение обследований, которые нельзя превышать. Достоверность полученной информации не гарантируется, может иметь место избыточная выборка.

4. Статистические методы – при любых выборочных исследованиях возникают ошибки. Для расчета объёма выборки задаются две величины:

  • Доверительный интервал (допустимая ошибка выборки (∆) – некоторая величина, на которую генеральные результаты могут отличаться выборочных результатов. Это допустимое отклонение наблюдаемых значений от истинных. Размер этого допущения определяется исследователœем с учетом требований к точности информации.
  • Доверительная вероятность – означает степень уверенности в том, что значение наблюдаемого элемента попадет в заданный диапазон доверительного интервала. Чаще всœего используется 95% доверительная вероятность.

Наиболее часто встречающиеся вероятности при проведении исследований:

Выборочная дисперсия (дисперсия признака в выборочной совокупности):

N – число единиц генеральной совокупности.

При этом принимается по предыдущему обследованию, либо рассчитывается:

Если известно наибольшее и наименьшее значения признака в генеральной совокупности:

;

http://www.quans.ru/research/control/select-calc/

Выборочная совокупность должна быть репрезентативной, то есть обеспечивать пропорциональное представительство существенных признаков генеральной совокупности в выборке.

Репрезентативность можно проиллюстрировать следующим примером. Предположим, совокупность - это всœе учащиеся школы (600 человек из 20 классов, по 30 человек в каждом классе). Предмет изучения - отношение к курению. Выборка, состоящая из 60 учеников старших классов гораздо хуже представляет совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого класса. Главной причиной тому - неравное возрастное распределœение в классах. Следовательно, в первом случая репрезентативность выборки низкая, а во втором случае репрезентативность высокая (при прочих равных условиях).

При использовании метода наблюдений нужно стремиться преодолеть синдромы Дракулы и Франкенштейна. Первый состоит в стремлении ʼʼвысосатьʼʼ всю мыслимую и немыслимую информацию из непрезентативных наблюдений. Второй - в стремлении бездумно использовать количественные характеристики. Путь к успеху - продуманное использование как количественных, так и качественных методов; проведение как крупномасштабных обследований, так и наблюдений в малых группах.

Главным препятствием на пути создания эффективных прогнозов с помощью метода опросов является знаменитый парадокс Ла-Пьера, гласящий, что люди не всœегда поступают так, как они говорят.

Тема 5: Расчет выборки - понятие и виды. Классификация и особенности категории "Тема 5: Расчет выборки" 2017, 2018.

Необходимое количество респондентов зависит от целей опроса и того, насколько важна достоверность результатов. Чем выше достоверность Вы хотите получить, тем ниже должен быть допустимый предел погрешности.

Определения

Численность совокупности

Численность совокупности - это размер всей группы, которую Вы хотите представить в опросе.

  • Совокупность : вся группа, о которой Вы хотите сделать выводы.
  • Выборка : группа, которую Вы опрашиваете.

Подумайте о потенциальном размере Вашей целевой совокупности. Например, если Вы отправляете опрос пользователям iPhone мужского пола, проживающим в определенном регионе, Вам может потребоваться провести небольшое исследование с целью определить, сколько всего мужчин соответствует этим критериям.

Предел погрешности

Предел погрешности указывает, насколько результаты отклоняются от фактических значений. Это процентное значение, означающее, с какой вероятностью мнения и поведение выборки опроса отклоняются от мнения и поведения общей совокупности. Чтобы рассчитать предел погрешности, используйте наш калькулятор предела погрешности .

Чем меньше предел погрешности, тем точнее будет ответ при определенном уровне доверия.

В общем случае, чем больше размер выборки, тем меньше предел погрешности. Чем ближе размер выборки к численности совокупности, тем более репрезентативными будут результаты. И именно поэтому, посмотрев на таблицу ниже, Вы можете заметить, что с уменьшением рекомендованного размера выборки увеличивается допустимая погрешность.

Допустим, мы опросили 400 человек о том, поддерживают ли они президента своей страны, и 55% ответило утвердительно. Если уровень доверия равен 95%, а пределы погрешности составляют ±5%, то при стократном повторении опроса в одних и тех же условиях 95 раз из 100 ответ находился бы в пределах между 50% и 60%.

Уровень доверия

Уровень доверия указывает, насколько достоверными являются полученные результаты. Общепринятые стандарты, используемые исследователями: 90%, 95% и 99%.

Уровень доверия 95% означает, что, если повторить один и тот же опрос при одинаковых условиях 100 раз, 95 раз из 100 результаты будут приблизительно находиться в пределах погрешности.

При определении размера выборки используется z-оценка уровня доверия. Z-оценка - это мера стандартного отклонения определенной доли от средней величины.

Уровень доверия

90% 1,65
95% 1,96
99% 2,58

Процентное значение

Требования к размеру выборки могут меняться в зависимости от процентной доли выборки, которая дает определенный ответ. Например, если в предыдущем опросе было обнаружено, что 75% клиентов выражают удовлетворенность Вашим продуктом, и Вы хотите провести такой опрос снова, можно использовать p = 0,75 для расчета требуемого размера выборки.

Если опрос проводится в первый раз, то, поскольку опросы обычно содержат более одного вопроса (и поэтому оценивать требуется более одного процентного значения), мы рекомендуем использовать p = 0,5 для расчета оптимального размера выборки. Это дает нам примерный размер выборки, который не будет ни слишком консервативным ни слишком свободным.

Ниже приведена таблица, в которой указаны рекомендованные значения численности совокупности* для предела погрешности при уровне доверия 95%.

Численность совокупности Размер выборки для предела погрешности

100 000 и более

* Мы рассчитали рекомендованные размеры выборки по указанной выше формуле. В некоторых случаях размеры выборки были округлены вверх до 5 или 10. Для более точного расчета используйте наш калькулятор размера выборки .

Вы отправляете родителям детей Вашей школы опрос с вопросом о том, поддерживают ли они продление учебного дня. Вопрос имеет варианты ответа «Да» и «Нет».

Общее количество родителей (численность совокупности) - 10 000, и Вас устраивает предел погрешности ±10%. По таблице выше Вы можете определить, что в опросе должно принять участие не менее 100 человек.

70% из 100 опрошенных родителей ответили, что согласны на продление учебного дня. Таким образом, можно предположить, что если бы в опросе участвовали все 10 000 родителей, 60-80% людей поддержало бы продление учебного дня.

Сколько людей следует попросить пройти опрос?

Может определять, какому количеству людей нужно отправить опрос. Чем выше процентная доля ответивших, тем меньше людей необходимо попросить пройти опрос.

Например, если Вам нужно 100 респондентов и Вы ожидаете, что 25% людей, приглашенных принять участие в опросе, ответят на него, Вам необходимо пригласить 400 человек.

СОВЕТ. Если Вам требуется гарантированное количество респондентов, приобретите ответы на опрос в SurveyMonkey Audience. Вы укажете необходимое количество ответов, и мы найдем респондентов, соответствующих Вашим критериям целевой аудитории.

Когда Вы задаете вопрос «Сколько мне потребуется респондентов для опроса?», Вы на самом деле спрашиваете: «Насколько большой должна быть моя выборка, чтобы точно оценить мою совокупность?» Принимая во внимание сложность этих понятий, мы разбили процесс на 5 шагов, давая Вам возможность легко рассчитать идеальный объем выборки и обеспечить точность результатов опроса.

5 шагов, с помощью которых Вы убедитесь, что Ваша выборка точно оценивает генеральную совокупность:

Шаг 1

Что представляет собой Ваша генеральная совокупность?

Под термином «генеральная совокупность» мы понимаем целую группу людей, мнение которой Вы собираетесь выяснить (выборка будет состоять из членов этой совокупности, которые фактически примут участие в опросе).

К примеру, если Вы хотите понять, как найти рынок сбыта для зубной пасты во Франции, Вашей совокупностью будут жители Франции. А если Вы пытаетесь определить, сколько дней отпуска предпочли бы иметь люди, работающие на компанию по производству зубной пасты, то Ваша генеральная совокупность - сотрудники этой компании.

Независимо от того, страна это или компания, установление генеральной совокупности - это важный первый шаг. После того как Вы определились с генеральной совокупностью, установите (приблизительно) ее численность. Например, во Франции живут около 65 миллионов человек, а в компании-производителе зубной пасты работает, скорее всего, гораздо меньше сотрудников.

Получили нужную цифру? Хорошо, тогда идем дальше…

Шаг 2

Какова требуемая точность?

Этот шаг является своего рода оценкой того, на какой риск Вы готовы пойти в отношении возможной неточности ответов на опрос в связи тем фактом, что Вы не опрашиваете всю генеральную совокупность. Поэтому Вам следует ответить на два вопроса:

  1. Насколько уверенными Вы должны быть в том, что полученные ответы отображают мнения генеральной совокупности?
    Это Ваш предел погрешности. Итак, допустим, 90% членов выборки любят жевательную резинку со вкусом винограда. Предел погрешности в 5% добавляет по 5% с каждой стороны этого числа, что означает, что фактически 85-95% участников выборки любят жевательную резинку со вкусом винограда. 5% - наиболее часто используемый предел погрешности, но Вы можете устанавливать его значение от 1% до 10% в зависимости от опроса. Не рекомендуется поднимать этот показатель выше 10%.
  2. Насколько уверенными Вы должны быть в том, что выборка в точности представляет генеральную совокупность?

    Это Ваш уровень доверия. Уровень доверия - это вероятность того, что выборка является значимой для полученных результатов. Расчет, как правило, производится следующим образом. Если бы Вы в случайном порядке определили еще 30 выборок из данной совокупности, то как часто полученный Вами результат для одной выборки существенно отличался бы от результатов для других 30 выборок? Уровень доверия в 95% означает, что в 95% случаев результаты совпадали бы. 95% - наиболее часто используемое значение, но Вы можете установить его на уровне 90% или 99% в зависимости от опроса. Опускать значение уровня доверия ниже 90% не рекомендуется.

Шаг 3

Какого размера выборка мне нужна?

В таблице, размещенной ниже, выберите приблизительный размер целевой совокупности и предел погрешности для определения количества требуемых завершенных опросов.

Теперь, когда у Вас есть значения шага 1 и шага 2, по удобной таблице ниже определите размер требуемой выборки…

Генеральная совокупность Предел погрешности Уровень доверия
10% 5% 1% 90% 95% 99%
100 50 80 99 74 80 88
500 81 218 476 176 218 286
1000 88 278 906 215 278 400
10 000 96 370 4900 264 370 623
100 000 96 383 8763 270 383 660
1 000 000+ 97 384 9513 271 384 664

Примечание . Данные приведены только в качестве ориентировочных инструкций. Кроме того, для генеральной совокупности свыше 1 млн. цифры можно округлять до сотен.

Шаг 4

Насколько отзывчивыми окажутся люди?

К сожалению, не все, кому Вы отправите опрос, дадут на него ответ.

Процент людей, заполнивших бланк полученного опроса, называют «процентной долей ответивших». Определение процентной доли ответивших на Ваш опрос поможет установить общее число экземпляров опроса, которое необходимо разослать для получения требуемого числа ответов.

Процентная доля ответивших прямым образом зависит от ряда факторов, таких как отношения с целевой аудиторией, продолжительность и сложность опроса, предлагаемые поощрения и тема опроса. Для онлайн-опросов, в которых с получателями предварительно не были установлены отношения, процентная доля ответивших в 20-30% считается очень высокой. Более консервативным и вероятным является значение 10-14%, если Вы до этого не проводили опрос в данной совокупности.

Шаг 5

Так скольким же людям отсылать опрос?

Это легкий этап!

Просто разделите число, полученное на шаге 3, на число, полученное на шаге 4. Это и есть Ваше волшебное число.

К примеру, если Вам нужно, чтобы опрос заполнили 100 женщин, пользующихся шампунем, и Вы считаете, что 10% женщин, которым Вы отправили опрос, его заполнят, требуется отослать опрос 1000 женщин (100/10%)!