Схема испытаний Бернулли. Формула Бернулли
Пусть производится несколько испытаний. Причем, вероятность появления события $A$ в каждом испытании не зависит от исходов других испытаний. Такие испытания называются независимыми относительно события А. В разных независимых испытаниях событие А, может иметь либо различные вероятности, либо одну и туже. Мы будем рассматривать лишь такие независимые испытания, в которых событие $A$ имеет одну и ту же вероятность.
Под сложным событием будем понимать совмещение простых событий. Пусть производится n-испытаний. В каждом испытании событие $A$ может появиться или не появиться. Будем считать, что в каждом испытании вероятность появления события $A$ одна и та же и равна $p$. Тогда вероятность $\overline A $ { или не наступления А } равна $P({ \overline A })=q=1-p$.
Пусть требуется вычислить вероятность того, что в n -испытаниях событие $A$ наступит k - раз и $n-k$ раз - не наступит. Такую вероятность будем обозначать $P_n (k)$. Причем, последовательность наступления события $A$ не важна. Например: $({ AAA\overline A , AA\overline A A, A\overline A AA, \overline A AAA })$
$P_5 (3)-$ в пяти испытаниях событие $A$ появилось 3 раза и 2 - не появилось. Такую вероятность можно найти по формуле Бернулли.
Вывод формулы Бернулли
По теореме умножения вероятностей независимых событий, вероятность того, что событие $A$ наступит $k$ раз и $n-k$ раз не наступит, будет равна $p^k\cdot q^ { n-k } $. И таких сложных событий может быть столько, сколько можно составить $C_n^k $. Так как, сложные события несовместны, то по теореме о сумме вероятностей несовместных событий, нам надо сложить вероятности всех сложных событий, а их ровно $C_n^k $. Тогда вероятность появления события $A$ ровно k раз в n испытаниях, есть $P_n ({ A,\,k })=P_n (k)=C_n^k \cdot p^k\cdot q^ { n-k } $ формула Бернулли .
Пример. Игральная кость подбрасывается 4 раза. Найти вероятность того, что единица появится в половине случаев.
Решение. $A=$ { появление единицы }
$ P(A)=p=\frac { 1 } { 6 } \, \,P({ \overline A })=q=1-\frac { 1 } { 6 } =\frac { 5 } { 6 } $ $ P_4 (2)=C_4^2 \cdot p^2\cdot q^ { 4-2 } =\frac { 4! } { 2!\cdot 2! } \cdot 6^2\cdot ({ \frac { 5 } { 6 } })^2=0,115 $
Легко видеть, что при больших значениях n достаточно трудно подсчитать вероятность из-за громадных чисел. Оказывается эту вероятность можно посчитать не только с помощью формулы Бернулли.
Рассмотрим Биномиальное распределение, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL БИНОМ.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения p, математического ожидания распределения и стандартного отклонения. Также рассмотрим распределение Бернулли.
Определение . Пусть проводятся n испытаний, в каждом из которых может произойти только 2 события: событие «успех» с вероятностью p или событие «неудача» с вероятностью q =1-p (так называемая Схема Бернулли, Bernoulli trials ).
Вероятность получения ровно x успехов в этих n испытаниях равна:
Количество успехов в выборке x является случайной величиной, которая имеет Биномиальное распределение (англ. Binomial distribution ) p и n – являются параметрами этого распределения.
Напомним, что для применения схемы Бернулли и соответственно Биномиального распределения, должны быть выполнены следующие условия:
- каждое испытание должно иметь ровно два исхода, условно называемых «успехом» и «неудачей».
- результат каждого испытания не должен зависеть от результатов предыдущих испытаний (независимость испытаний).
- вероятность успеха p должна быть постоянной для всех испытаний.
Биномиальное распределение в MS EXCEL
В MS EXCEL, начиная с версии 2010, для Биномиального распределения имеется функция БИНОМ.РАСП() , английское название - BINOM.DIST(), которая позволяет вычислить вероятность того, что в выборке будет ровно х «успехов» (т.е. функцию плотности вероятности p(x), см. формулу выше), и интегральную функцию распределения (вероятность того, что в выборке будет x или меньше «успехов», включая 0).
До MS EXCEL 2010 в EXCEL была функция БИНОМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). БИНОМРАСП() оставлена в MS EXCEL 2010 для совместимости.
В файле примера приведены графики плотности распределения вероятности и .
Биномиальное распределения имеет обозначение B (n ; p ) .
Примечание : Для построения интегральной функции распределения идеально подходит диаграмма типа График , для плотности распределения – Гистограмма с группировкой . Подробнее о построении диаграмм читайте статью Основные типы диаграмм.
Примечание : Для удобства написания формул в файле примера созданы Имена для параметров Биномиального распределения : n и p.
В файле примера приведены различные расчеты вероятности с помощью функций MS EXCEL:
Как видно на картинке выше, предполагается, что:
- В бесконечной совокупности, из которой делается выборка, содержится 10% (или 0,1) годных элементов (параметр p , третий аргумент функции =БИНОМ.РАСП() )
- Чтобы вычислить вероятность, того что в выборке из 10 элементов (параметр n , второй аргумент функции) будет ровно 5 годных элементов (первый аргумент), нужно записать формулу: =БИНОМ.РАСП(5; 10; 0,1; ЛОЖЬ)
- Последний, четвертый элемент, установлен =ЛОЖЬ, т.е. возвращается значение функции плотности распределения .
Если значение четвертого аргумента =ИСТИНА, то функция БИНОМ.РАСП() возвращает значение интегральной функции распределения или просто Функцию распределения . В этом случае можно рассчитать вероятность того, что в выборке количество годных элементов будет из определенного диапазона, например, 2 или меньше (включая 0).
Для этого нужно записать формулу:
= БИНОМ.РАСП(2; 10; 0,1; ИСТИНА)
Примечание
: При нецелом значении х, . Например, следующие формулы вернут одно и тоже значение:
=БИНОМ.РАСП(2
; 10; 0,1; ИСТИНА)
=БИНОМ.РАСП(2,9
; 10; 0,1; ИСТИНА)
Примечание : В файле примера плотность вероятности и функция распределения также вычислены с использованием определения и функции ЧИСЛКОМБ() .
Показатели распределения
В файле примера на листе Пример имеются формулы для расчета некоторых показателей распределения:
- =n*p;
- (квадрата стандартного отклонения) = n*p*(1-p);
- = (n+1)*p;
- =(1-2*p)*КОРЕНЬ(n*p*(1-p)).
Выведем формулу математического ожидания Биномиального распределения , используя Схему Бернулли .
По определению случайная величина Х в схеме Бернулли (Bernoulli random variable) имеет функцию распределения :
Это распределение называется распределение Бернулли .
Примечание : распределение Бернулли – частный случай Биномиального распределения с параметром n=1.
Сгенерируем 3 массива по 100 чисел с различными вероятностями успеха: 0,1; 0,5 и 0,9. Для этого в окне Генерация случайных чисел установим следующие параметры для каждой вероятности p:
Примечание : Если установить опцию Случайное рассеивание (Random Seed ), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию =25 можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами .
В итоге будем иметь 3 столбца по 100 чисел, на основании которых можно, например, оценить вероятность успеха p по формуле: Число успехов/100 (см. файл примера лист ГенерацияБернулли ).
Примечание : Для распределения Бернулли с p=0,5 можно использовать формулу =СЛУЧМЕЖДУ(0;1) , которая соответствует .
Генерация случайных чисел. Биномиальное распределение
Предположим, что в выборке обнаружилось 7 дефектных изделий. Это означает, что «очень вероятна» ситуация, что изменилась доля дефектных изделий p , которая является характеристикой нашего производственного процесса. Хотя такая ситуация «очень вероятна», но существует вероятность (альфа-риск, ошибка 1-го рода, «ложная тревога»), что все же p осталась без изменений, а увеличенное количество дефектных изделий обусловлено случайностью выборки.
Как видно на рисунке ниже, 7 – количество дефектных изделий, которое допустимо для процесса с p=0,21 при том же значении Альфа . Это служит иллюстрацией, что при превышении порогового значения дефектных изделий в выборке, p «скорее всего» увеличилось. Фраза «скорее всего» означает, что существует всего лишь 10% вероятность (100%-90%) того, что отклонение доли дефектных изделий выше порогового вызвано только сучайными причинами.
Таким образом, превышение порогового количества дефектных изделий в выборке, может служить сигналом, что процесс расстроился и стал выпускать бо льший процент бракованных изделий.
Примечание : До MS EXCEL 2010 в EXCEL была функция КРИТБИНОМ() , которая эквивалентна БИНОМ.ОБР() . КРИТБИНОМ() оставлена в MS EXCEL 2010 и выше для совместимости.
Связь Биномиального распределения с другими распределениями
Если параметр n
Биномиального распределения
стремится к бесконечности, а p
стремится к 0, то в этом случае Биномиальное распределение
может быть аппроксимировано .
Можно сформулировать условия, когда приближение распределением Пуассона
работает хорошо:
- p <0,1 (чем меньше p и больше n , тем приближение точнее);
- p >0,9 (учитывая, что q =1- p , вычисления в этом случае необходимо производить через q (а х нужно заменить на n - x ). Следовательно, чем меньше q и больше n , тем приближение точнее).
При 0,1<=p<=0,9 и n*p>10 Биномиальное распределение можно аппроксимировать .
В свою очередь, Биномиальное распределение может служить хорошим приближением , когда размер совокупности N Гипергеометрического распределения гораздо больше размера выборки n (т.е., N>>n или n/N<<1).
Подробнее о связи вышеуказанных распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.
СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .
Если производится несколько испытаний, причем вероятность события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называют независимыми относительно события А .
В разных независимых испытаниях событие А может иметь либо различные вероятности, либо одну и ту же вероятность. Будем далее рассматривать лишь такие независимые испытания, в которых событие А имеет одну и ту же вероятность.
Ниже воспользуемся понятием сложного события, понимая под ним совмещение нескольких отдельных событий, которые называют простыми .
Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Условимся считать, что вероятность события A в каждом испытании одна и та же, а именно равна р . Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q = 1 - p .
Поставим перед собой задачу вычислить вероятность того, что при n испытаниях событие А осуществится ровно k раз и, следовательно, не осуществится n - k раз. Важно подчеркнуть, что не требуется, чтобы событие А повторилось ровно k раз в определенной последовательности.
Например, если речь идет о появлении события А три раза в четырех испытаниях, то возможны следующие сложные события: ААА, ААА, ААА, ААА . Запись ААА означает, что в первом, втором и третьем испытаниях событие А наступило, а в четвертом испытании оно не появилось, т.е. наступило противоположное событие А; соответственный смысл имеют и другие записи.
Искомую вероятность обозначим Р п (k) . Например, символ Р 5 (3) означает вероятность того, что в пяти испытаниях событие появится ровно 3 раза и, следовательно, не наступит 2 раза.
Поставленную задачу можно решить с помощью так называемой формулы Бернулли.
Вывод формулы Бернулли . Вероятность одного сложного события, состоящего в том, что в п испытаниях событие А наступит k раз и не наступит п - k раз, по теореме умножения вероятностей независимых событий равна p k q n - k . Таких сложных событий может быть столько, сколько можно составить сочетаний из п элементов по k элементов, т.е. С n k .
Так как эти сложные события несовместны , то по теореме сложения вероятностей несовместных событий искомая вероятность равна сумме вероятностей всех возможных сложных событий . Поскольку же вероятности всех этих сложных событий одинаковы, то искомая вероятность (появления k раз события А в п испытаниях) равна вероятности одного сложного события, умноженной на их число:
Полученную формулу называют формулой Бернулли .
Пример 1 . Вероятность того, что расход электроэнергии в течение одних суток не превысит установленной нормы, равна р = 0,75 . Найти вероятность того, что в ближайшие 6 суток расход электроэнергии в течение 4 суток не превысит нормы.
Решение . Вероятность нормального расхода электроэнергии в продолжение каждых из 6 суток постоянна и равна р = 0,75 . Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна q = 1 - р = 1 - 0,75 = 0,25.
Искомая вероятность по формуле Бернулли равна:
11. Боголюбов А.Н. Математики. Механики: биографический справочник. – Киев: Наукова думка, 1983.
2. Гулай Т.А., Долгополова А.Ф., Литвин Д.Б. Анализ и оценка приоритетности разделов математических дисциплин, изучаемых студентами экономических специальностей аграрных вузов // Вестник АПК Ставрополья. – 2013. – № 1 (9). – С. 6-10.
3. Долгополова А.Ф., Гулай Т.А., Литвин Д.Б. Перспективы применения математических методов в экономических исследованиях // Аграрная наука, творчество, рост. – 2013. – С. 255-257.
В математике довольно часто встречаются задачи, в которых присутствует большое количество повторений одного и того же условия, испытания или эксперимента. Результатом каждого испытания будет считаться совершенно другой результат от наступившего предыдущего. Зависимости в результатах так же наблюдаться не будет. В качестве результата испытания можно различить несколько возможностей элементарных последствий: возникновение события (А) или же возникновение события, которое дополняет А.
Тогда попробуем предположить, что вероятность возникновения события Р(А) регулярна и равна р (0<р<1).
Примерами такого испытания может быть большое количество задач, таких как подбрасывание монетки, извлечение из темного мешка черно-белых шаров или же рождение черно-белых кроликов.
Такой эксперимент называют конфигурацией повторных независимых испытаний или схемой Бернулли.
Якоб Бернулли родился в семье фармацевта. Отец пытался наставить сына на медицинский путь, но Я. Бернулли увлекся математикой самостоятельно, а позже это стало его профессией. Ему принадлежат различные трофеи в работах на темы по теории вероятностей и чисел, рядов и дифференциальном исчислении. Изучив теорию вероятности по одной изработ Гюйгенса «О расчетах в азартной игре», Якоб увлекся этим. В данной книге не было даже четкого определения концепции «вероятность». Именно Я. Бернулли ввел в математику большую часть современных понятий теории вероятностей. Так же Бернулли первымвыразил свой вариант закона больших чисел. Имя Якоба носят различные работы, теоремы и схемы: «Числа Бернулли», «Многочлен Бернулли», «Дифференциальное уравнение Бернулли», «Распределение Бернулли» и «Уравнение Бернулли».
Вернемся к повторениям. Как уже было указано выше, то в итоге различных испытаний возможны два исхода: либо появится событие А, либо противоположность этому событию. Сама схема Бернулли обозначает производство n-го количества типовых вольных опытов, и в каждом из этих опытов может появится нужное нам событие А (вероятность этого события известна: Р(А)=р), вероятность противоположного события событию А обозначена за q=P(A)=1-p. Требуется определение вероятности, что при проведении испытаний неизвестного количества событие А появится ровно k раз.
Важно помнить о главном условии при решении задач при помощи схемы Бернулли-это постоянство. Без него схема теряет всякий смысл.
Этой схемой можно пользоваться для решения задач различного уровня сложности: от простых (та же монетка) до сложных (проценты). Однако чаще схема Бернулли применяется в решении таких задач, которые связаны с контролем свойств различной продукции и уверенности в самых разных механизмах. Только для решения задачи до начала работы должны быть известны заранее все условия и значения.
Не все задачи в теории вероятностей сводятся к постоянству в условиях. Даже если взять в пример черные и белые шары в темном мешке: при вытягивании одного шара соотношение количества и цветов шариков в мешке изменилось, а значит изменилась и сама вероятность.
Однако если же условия у нас постоянны, то мы можем точно определить требуемую от нас вероятность того, что событие А произойдет ровно kраз из n возможных.
Этот факт Якоб Бернулли скомпоновал в теорему, которую впоследствии стали называть его именем. «Теорема Бернулли» является одной из главных теорем в теории вероятности. Впервые ее опубликовали в труде Я.Бернулли «Искусство предположений». Что же представляет из себя эта теорема? «Если вероятность р наступления события А в каждом испытании постоянна, то вероятность Рk,n того, что событие наступит k раз в n испытаниях, не зависящих друг от друга равна: , где q=1-p».
В доказательство действенности формулы можно привести задачи.
Задача № 1:
Из n стеклянных банок за месяц хранения k разбиваются. Наугад взяли m банок. Найти вероятность, что среди этих банок l не разобьются. n=250, k=10, m=8,l=4.
Решение: Имеем схему Бернулли со значениями:
p=10/250=0,04 (вероятность того, что банки разобьются);
n=8 (число испытаний);
k=8-4=4 (количество разбитых банок).
Используем формулу Бернулли
Получили:
Ответ: 0,0141
Задача № 2:
Вероятность изготовления неисправного изделия на производстве равна 0,2. Найти вероятность того, что из 10 изготовленных на этом производстве изделий ровно k должны быть исправны. Выполнить решение для k = 0, 1, 10.
Нам интересно событие A - изготовление исправных деталей, случающееся раз в час с вероятностью p=1-0,2=0,8. Надо найти вероятность того, что данное событие совершится k раз. Событию A противоположно событие «не A», т.е. изготовление неисправного изделия.
Следовательно, мы имеем: n=10; p=0,8; q=0,2.
В итоге найдем вероятность того, что из 10 изготовленных изделий все изделия неисправны (k=0), что одно изделие исправно (k=1), что неисправных нет вообще (k=10):
В заключении хотелось бы отметить, что в современности многие ученые пытаются доказать, что «формула Бернулли» не соответствует законам природы и можно решить задачи, не применяя ее к использованию. Конечно это возможно, большинство задач по теории вероятности возможно выполнить без формулы Бернулли, главное не запутаться в больших объемах цифр.
Библиографическая ссылка
Хомутова Е.А., Калиниченко В.А. ФОРМУЛА БЕРНУЛЛИ В ТЕОРИИ ВЕРОЯТНОСТИ // Международный студенческий научный вестник. – 2015. – № 3-4.;URL: http://eduherald.ru/ru/article/view?id=14141 (дата обращения: 12.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
Производится n опытов по схеме Бернулли с вероятностью успеха p . Пусть X - число успехов. Случайная величина X имеет область значений {0,1,2,...,n}. Вероятности этих значений можно найти по формуле:
, где C m n - число сочетаний из n по m .
Ряд распределения имеет вид:
x | 0 | 1 | ... | m | n |
p | (1-p) n | np(1-p) n-1 | ... | C m n p m (1-p) n-m | p n |
Назначение сервиса . Онлайн-калькулятор используется для построения биноминальным ряда распределения и вычисления всех характеристик ряда: математического ожидания, дисперсии и среднеквадратического отклонения. Отчет с решением оформляется в формате Word (пример).
Видеоинструкция
Схема испытаний Бернулли
Числовые характеристики случайной величины, распределенной по биноминальному закону
Математическое ожидание случайной величины Х, распределенной по биноминальному закону.M[X]=np
Дисперсия случайной величины Х, распределенной по биноминальному закону.
D[X]=npq
Пример №1
. Изделие может оказаться дефектным с вероятностью р = 0.3 каждое. Из партии выбирают три изделия. Х – число дефектных деталей среди отобранных. Найти (все ответы вводить в виде десятичных дробей): а) ряд распределения Х; б) функцию распределения F(x) .
Решение
. Случайная величина X имеет область значений {0,1,2,3}.
Найдем ряд распределения X.
P 3 (0) = (1-p) n = (1-0.3) 3 = 0.34
P 3 (1) = np(1-p) n-1 = 3(1-0.3) 3-1 = 0.44
P 3 (3) = p n = 0.3 3 = 0.027
x i | 0 | 1 | 2 | 3 |
p i | 0.34 | 0.44 | 0.19 | 0.027 |
Математическое ожидание находим по формуле M[X]= np = 3*0.3 = 0.9
Проверка: m = ∑x i p i .
Математическое ожидание M[X] .
M[x] = 0*0.34 + 1*0.44 + 2*0.19 + 3*0.027 = 0.9
Дисперсию находим по формуле D[X]=npq = 3*0.3*(1-0.3) = 0.63
Проверка: d = ∑x 2 i p i - M[x] 2 .
Дисперсия D[X] .
D[X] = 0 2 *0.34 + 1 2 *0.44 + 2 2 *0.19 + 3 2 *0.027 - 0.9 2 = 0.63
Среднее квадратическое отклонение σ(x) .
Функция распределения F(X) .
F(xF(0F(1F(2F(x>3) = 1
- Вероятность появления события в одном испытании равна 0.6 . Производится 5 испытаний. Составить закон распределения случайной величины Х – числа появлений события.
- Составить закон распределения случайной величины Х числа попаданий при четырех выстрелах, если вероятность попадания в цель при одном выстреле равна 0.8 .
- Монету подбрасывают 7 раз. Найти математическое ожидание и дисперсию числа появлений герба. Примечание: здесь вероятность появление герба равна p = 1/2 (т.к. у монеты две стороны).
Пример №2 . Вероятность появления события в отдельном испытании равна 0.6 . Применяя теорему Бернулли, определите число независимых испытаний, начиная с которого вероятность отклонения частоты события от его вероятности по абсолютной величине меньше 0.1 , больше 0.97 . (Ответ: 801)
Пример №3
. Студенты выполняют контрольную работу в классе информатики. Работа состоит из трех задач. Для получения хорошей оценки нужно найти правильные ответы не меньше чем на две задачи. К каждой задаче дается 5 ответов из которых только одна правильная. Студент выбирает ответ наугад. Какая вероятность того, что он получит хорошую оценку?
Решение
. Вероятность правильно ответить на вопрос: p=1/5=0.2; n=3.
Эти данные необходимо ввести в калькулятор. В ответ см. для P(2)+P(3).
Пример №4 . Вероятность попадания стрелка в мишень при одном выстреле равна (m+n)/(m+n+2) . Производится n+4 выстрела. Найти вероятность того, что он промахнется не более двух раз.
Примечание . Вероятность того, что он промахнется не более двух раз включает в себя следующие события: ни разу не промахнется P(4), промахнется один раз P(3), промахнется два раза P(2).
Пример №5 . Определите распределение вероятностей числа отказавших самолётов, если влетает 4 машины. Вероятность безотказной работы самолета Р=0.99 . Число отказавших в каждом вылете самолётов распределено по биноминальному закону.