Распределение Пуассона.

Рассмотрим наиболее типичную ситуацию, в которой возникает распределение Пуассона. Пусть событие А появляется некоторое число раз в фиксированном участке пространства (интервале, площади, объеме) или промежутке времени с постоянной интенсивностью. Для определенности рассмотрим последовательное появление событий во времени, называемое потоком событий. Графически поток событий можно иллюстрировать множеством точек, расположенных на оси времени.

Это может быть поток вызовов в сфере обслуживания (ремонт бытовой техники, вызов скорой помощи и др.), поток вызовов на АТС, отказ в работе некоторых частей системы, радиоактивный распад, куски ткани или металлические листы и число дефектов на каждом из них и др. Наиболее полезным распределение Пуассона оказывается в тех задачах, где требуется определить лишь число положительных исходов («успехов»).

Представим себе булку с изюмом, разделенную на маленькие кусочки равной величины. Вследствие случайного распределения изюминок нельзя ожидать, что все кусочки будут содержать их одинаковое число. Когда среднее число изюминок, содержащееся в этих кусочках, известно, тогда распределение Пуассона задает вероятность того, что любой взятый кусочек содержит X =k (k = 0,1,2,...,)число изюминок.

Иначе говоря, распределение Пуассона определяет, какая часть длинной серии кусочков будет содержать равное 0, или 1, или 2, или и т.д. число изюминок.

Сделаем следующие предположения.

1. Вероятность появления некоторого числа событий в данном промежутке времени зависит только от длины этого промежутка, а не от его положения на временной оси. Это свойство стационарности.

2. Появление более одного события в достаточно малом промежутке времени практически невозможно, т.е. условная вероятность появления в этом же интервале другого события стремится к нулю при ® 0. Это свойство ординарности.

3. Вероятность появления данного числа событий на фиксированном промежутке времени не зависит от числа событий, появляющихся в другие промежутки времени. Это свойство отсутствия последействия.

Поток событий, удовлетворяющий перечисленным предложениям, называется простейшим .

Рассмотрим достаточно малый промежуток времени . На основании свойства 2 событие может появиться на этом промежутке один раз или совсем не появиться. Обозначим вероятность появления события через р , а непоявления – через q = 1-p. Вероятность р постоянна (свойство 3) и зависит только от величины (свойство 1). Математическое ожидание числа появлений события в промежутке будет равно 0×q + 1×p = p . Тогда среднее число появления событий в единицу времени называется интенсивностью потока и обозначается через a, т.е. a = .

Рассмотрим конечный отрезок времени t и разделим его на n частей = . Появления событий в каждом из этих промежутков независимы (свойство 2). Определим вероятность того, что в отрезке времени t при постоянной интенсивности потока а событие появится ровно X = k раз и не появится n – k . Так как событие может в каждом из n промежутков появиться не более чем 1 раз, то для появления его k раз на отрезке длительностью t оно должно появиться в любых k промежутках из общего числа n. Всего таких комбинаций , а вероятность каждой равна . Следовательно, по теореме сложения вероятностей получим для искомой вероятности известную формулу Бернулли

Это равенство записано как приближенное, так как исходной посылкой при его выводе послужило свойство 2, выполняемое тем точнее, чем меньше . Для получения точного равенства перейдем к пределу при ® 0 или, что то же, n ® . Получим после замены

P = a = и q = 1 – .

Введем новый параметр = at , означающий среднее число появлений события в отрезке t . После несложных преобразований и переходу к пределу в сомножителях получим.

= 1, = ,

Окончательно получим

, k = 0, 1, 2, ...

е = 2,718... –основание натурального логарифма.

Определение . Случайная величина Х , которая принимает только целые, положительные значения 0, 1, 2, ... имеет закон распределения Пуассона с параметром , если

для k = 0, 1, 2, ...

Распределение Пуассона было предложено французским математиком С.Д. Пуассоном (1781-1840 гг). Оно используется для решения задач исчисления вероятностей относительно редких, случайных взаимно независимых событий в единицу времени, длины, площади и объема.

Для случая, когда а) – велико и б) k = , справедлива формула Стирлинга:

Для расчета последующих значений используется рекуррентная формула

P (k + 1) = P (k ).

Пример 1. Чему равна вероятность того, что из 1000 человек в данный день родились: а) ни одного, б) один, в) два, г) три человека?

Решение. Так как p = 1/365, то q = 1 – 1/365 = 364/365 » 1.

Тогда

а) ,

б) ,

в) ,

г) .

Следовательно, если имеются выборки из 1000 человек, то среднее число человек, которые родились в определенный день, соответственно будут равны 65; 178; 244; 223.

Пример 2. Определить значение , при котором с вероятностью Р событие появилось хотя бы один раз.

Решение. Событие А = {появиться хотя бы один раз} и = {не появиться ни одного раза}. Следовательно .

Отсюда и .

Например, для Р = 0,5 , для Р = 0,95 .

Пример 3. На ткацких станках, обслуживаемых одной ткачихой, в течение часа происходит 90 обрывов нити. Найти вероятность того, что за 4 минуты произойдет хотя бы один обрыв нити.

Решение. По условию t = 4 мин. и среднее число обрывов за одну минуту , откуда . Требуемая вероятность равна .

Свойства . Математическое ожидание и дисперсия случайной величины, имеющей распределение Пуассона с параметром , равны:

M (X ) = D (X ) = .

Эти выражения получаются прямыми вычислениями:

Здесь была осуществлена замена n = k – 1 и использован тот факт, что .

Выполнив преобразования, аналогичные использованным при выводе М (X ), получим

Распределение Пуассона используется для аппроксимации биноминального распределения при больших n

Биномиальный закон распределения относится к случаям, когда была сделана выборка фиксированного объема. Распределение Пуассона относится к случаям, когда число случайных событий происходит на определенных длине, площади, объеме или времени, при этом определяющим параметром распределения является среднее число событийт , а не объем выборки п и вероятность успеха р. Например, количество несоответствий в выборке или количество несоответствий, приходящихся на единицу продукции.

Распределение вероятностей для числа успехов х имеет при этом следующий вид:

Или можно сказать, что дискретная случайная величина X распределена по закону Пуассона, если ее возможные значения 0,1, 2, ...т, ...п, а вероятность появления таких значений определяется соотношением:

(14)

где m или λ- некоторая положительная величина, называемая параметром распределения Пуассона.

Закон Пуассона распространяется на «редко» происходящие события, при этом возможность очередной удачи (например, сбоя) сохраняется непрерывно, является постоянной и не зависит от числа предыдущих удач или неудач (когда речь идет о процессах, развивающихся во времени, это называют «независимостью от прошлого»). Классическим примером, когда применим закон Пуассона, является число телефонных вызовов на телефонной станции в течение заданного интервала времени. Другими примерами могут быть число чернильных клякс на странице, неаккуратно написанной рукописи, или число соринок, оказавшихся на кузове автомобиля во время его окраски. Закон распределения Пуассона измеряет число дефектов, а не число бракованных изделий.

Распределению Пуассона подчиняется количество случайных событий, которые появляются в фиксированные промежутки времени или в фиксированной области пространства, При λ<1 значение P(m) монотонно убывает с ростом m то, a при λ> 1 значениеP(m)с ростом т проходит через максимум вблизи /

Особенностью распределения Пуассона является равенство дисперсии математическому ожиданию. Параметры распределения Пуассона

M(x) = σ 2 = λ (15)

Эта особенность распределения Пуассона позволяет на практике утверждать, что экспериментально полученное распределение случайной величины подчинено распределению Пуассона, если выборочные значения математического ожидания и дисперсии примерно равны.

Закон редких событий применяется в машиностроении для выборочного контроля готовой продукции, когда по техническим условиям в принимаемой партии продукции допускается некоторый процент брака (обычно небольшой) q<<0.1.

Если вероятность q события А очень мала (q≤0,1), а число испытаний велико, то вероятность того, что событие А наступит m раз в n испытаниях, будет равна



,

где λ = М(х) = nq

Для вычисления распределения Пуассона можно пользоваться следующими рекуррентными соотношениями

и (16)

Распределение Пуассона играет важную роль в статистических методах обеспечения качества, поскольку с его помощью можно аппроксимировать гипергеометрическое и биномиальное распределения.

Такая аппроксимация допустима, когда , при условии, что qn имеет конечный предел и q<0.1. Когда п →∞ , а р → 0, среднее п р = т = const.

При помощи закона редких событий можно вычислить вероятность того, что в выборке из n единиц будет содержаться: 0,1,2,3, и т.д. бракованных деталей, т.е. заданное m раз. Можно также вычислить вероятность появления в такой выборке m штук дефектных деталей и более. Эта вероятность на основании правила сложения вероятностей будет равна-:

Пример 1 . В партии имеются бракованные детали, доля которых составляет 0,1. Последовательно берут 10 деталей и обследуют, после чего их возвращают в партию, т.е. испытания носят независимый характер. Какова вероятность того, что при проверке 10 деталей попадется одна бракованная?

Решение Из условия задачи q=0,1; n=10; m=1.Очевидно, что р=1-q=0,9.

Полученный результат можно отнести и к тому случаю, когда извлекается подряд 10 деталей без возврата их обратно в партию. При достаточно большой партии, например, 1000 шт., вероятность извлечения деталей изменится ничтожно мало. Поэтому при таких условиях извлечение бракованной детали можно рассматривать как событие, не зависящее от результатов предшествующих испытаний.

Пример 2. В партии имеется 1% бракованных дета- лей. Какова вероятность того, что при взятии из партии выборки объемом 50 единиц продукции в ней будет находиться 0, 1, 2, 3 ,4дефектных деталей??

Решение. Здесь q=0.01, nq=50*0.01=0.5

Таким образом, для эффективного применения распределения Пуассона как аппроксимации биномиального необходимо, чтобы вероятность успеха р была существенно меньше q . a п р = т была порядка единицы (или нескольких единиц).

Таким образом, в статистических методах обеспечения качества

гипергеометрический закон применим для выборок любого объема п и любого уровня несоответствий q ,

биномиальный закон и закон Пуассона являются его частными случаями соответственно при условии, если n/N<0,1 и

Рассмотрим распределение Пуассона, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL ПУАССОН.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения, его математического ожидания и стандартного отклонения.

Сначала дадим сухое формальное определение распределения, затем приведем примеры ситуаций, когда распределение Пуассона (англ. Poisson distribution ) является адекватной моделью для описания случайной величины.

Если случайные события происходят в заданный период времени (или в определенном объеме вещества) со средней частотой λ(лямбда ), то число событий x , произошедших за этот период времени, будет иметь распределение Пуассона .

Применение распределения Пуассона

Примеры, когда Распределение Пуассона является адекватной моделью:

  • число вызовов, поступивших на телефонную станцию за определенный период времени;
  • число частиц, подвергнувшихся радиоактивному распаду за определенный период времени;
  • число дефектов в куске ткани фиксированной длины.

Распределение Пуассона является адекватной моделью, если выполняются следующие условия:

  • события происходят независимо друг от друга, т.е. вероятность последующего события не зависит от предыдущего;
  • средняя частота событий постоянна. Как следствие, вероятность события пропорциональна длине интервала наблюдения;
  • два события не могут произойти одновременно;
  • число событий должно принимать значения 0; 1; 2…

Примечание : Хорошей подсказкой, что наблюдаемая случайная величина имеет распределение Пуассона, является тот факт, что приблизительно равно (см. ниже).

Ниже представлены примеры ситуаций, когда Распределение Пуассона не может быть применено:

  • число студентов, которые выходят из университета в течение часа (т.к. средний поток студентов не постоянен: во время занятий студентов мало, а в перерыве между занятиями число студентов резко возрастает);
  • число землетрясений амплитудой 5 баллов в год в Калифорнии (т.к. одно землетрясение может вызвать повторные толчки сходной амплитуды – события не независимы);
  • число дней, которые пациенты проводят в отделении интенсивной терапии (т.к. число дней, которое пациенты проводят в отделении интенсивной терапии всегда больше 0).

Примечание : Распределение Пуассона является приближением более точных дискретных распределений: и .

Примечание : О взаимосвязи распределения Пуассона и Биномиального распределения можно прочитать в статье . О взаимосвязи распределения Пуассона и Экспоненциального распределения можно прочитать в статье про .

Распределение Пуассона в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Распределения Пуассона имеется функция ПУАССОН.РАСП() , английское название - POISSON.DIST(), которая позволяет вычислить не только вероятность того, что за заданный период времени произойдет х событий (функцию плотности вероятности p(x), см. формулу выше), но и (вероятность того, что за заданный период времени произойдет не меньше x событий).

До MS EXCEL 2010 в EXCEL была функция ПУАССОН() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). ПУАССОН() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Распределение Пуассона имеет скошенную форму (длинный хвост справа у функции вероятности), но при увеличении параметра λ становится все более симметричным.

Примечание : Среднее и дисперсия (квадрат ) равны параметру распределения Пуассона – λ (см. файл примера лист Пример ).

Задача

Типичным применением Распределения Пуассона в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения , то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание : Если x не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2 ; 4; ЛОЖЬ) и =ПУАССОН.РАСП(2,9 ; 4; ЛОЖЬ) вернут одинаковый результат.

Генерация случайных чисел и оценка λ

При значениях λ>15 , Распределение Пуассона хорошо аппроксимируется Нормальным распределением со следующими параметрами: μ, σ 2 .

Подробнее о связи этих распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .

Основные законы распределения случайной величины

ЛЕКЦИЯ 9

(продолжение)

Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р . Для определения вероятности k – появлений события А в этих испытаниях используют, как вам уже известно, формулу Бернулли. Однако, как быть если n велико, а вероятность р события А достаточно мала (). В таких случаях прибегают к асимптотической формуле Пуассона.

Итак, поставим своей задачей найти вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно k раз.

Сделаем важное допущение: пусть произведение сохраняет постоянное значение, а именно . Это означает, что среднее число появлений события в различных сериях испытаний, то есть при различных значениях n , остаётся неизменным.

Воспользуемся формулой Бернулли для вычисления интересующей нас вероятности:

Приняв во внимание, что n имеет очень большое значение, вместо найдём . При этом будет найдено лишь приближённое значение отыскиваемой вероятности: n хотя и велико, но всё же конечно, а при отыскании предела мы устремим n к бесконечности.

В результате (для простоты записи знак приближённого равенства опущен) запишем

.

Эта формула выражает закон распределения Пуассона вероятностей массовых (n велико) редких (р мало) событий.

Таким образом, будем говорить, что дискретная случайная величина , принимающая счётное множество значений, подчиняется закону распределения Пуассона, если вероятности её возможных значений задаются выражением:

Свойства распределения Пуассона:

Действительно:

2. .

3. если , то из биномиального распределения следует закон распределения Пуассона.

ПРИМЕР 1 .Завод отправил на базу 5000 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,0002. Найти вероятность того, что на базу прибудут: а) три негодных изделия; б) не более трёх повреждённых изделия.

Решение : по условию n =5000, p =0,0002. Найдём .

а) k = 3. Искомая вероятность по формуле Пуассона приближённо равна

.

б) Пусть случайная величина Х – число изделий, повреждённых в пути, то есть . Очевидно, что данная случайная величина распределена по биномиальному закону. Следовательно, искомую вероятность можно вычислить по формуле

Но, так как , то по свойству 3 о можем воспользоваться законом распределения Пуассона, то есть, можем записать.

Снова напомним ситуацию, которая была названа схемой Бернулли: производится n независимых испытаний, в каждом из которых некоторое событие А может появиться с одной и той же вероятностью р . Тогда для определения вероятности того, что в этих n испытаниях событие А появится ровно k раз (такая вероятность обозначалась P n (k ) ) может быть точно вычислена по формуле Бернулли , гдеq =1− p . Однако при большом числе испытаний n расчеты по формуле Бернулли становятся очень неудобными, так как приводят к действиям с очень большими числами. Поэтому (если помните это когда-то проходилось при изучении схемы и формулы Бернулли при изучении первой части теории вероятностей «Случайные события») при больших n предлагались значительно более удобные (хотя и приближенные) формулы, которые оказывались тем точнее, чем больше n (формула Пуассона, локальная и интегральная формула Муавра-Лапласа). Если в схеме Бернулли число опытов n велико, а вероятность р появления события А в каждом испытании мала, то хорошее приближение дает упомянутая формула Пуассона
, где параметра = n p . Эта формула и приводит к распределению Пуассона. Дадим точные определения

Дискретная случайная величина Х имеет распределение Пуассона , если она принимает значения 0, 1, 2, ... с вероятностями р 0 , р 1 , ... , которые вычисляются по формуле

а число а является параметром распределения Пуассона. Обращаем внимание, что возможных значений с.в. Х бесконечно много это все целые неотрицательные числа. Таким образом, д.с.в Х с распределением Пуассона имеет следующий закон распределения:

При вычислении математического ожидания (по их определению для д.с.в. с известным законом распределения) придется теперь считать не конечные суммы, а суммы соответствующих бесконечных рядов (так как таблица закона распределения имеет бесконечно много столбцов). Если же посчитать суммы этих рядов, то окажется, что и математическое ожидание, и дисперсия случайной величины Х с распределением Пуассона совпадает с параметром а этого распределения:

,
.

Найдем моду d (X ) распределенной по Пуассону случайной величины Х . Применим тот же самый прием, что был использован для вычисления моды биномиально распределенной случайной величины. По определению моды d (X )= k , если вероятность
наибольшая среди всех вероятностей р 0 , р 1 , ... . Найдем такое число k (это целое неотрицательное число). При таком k вероятность p k должна быть не меньше соседних с ней вероятностей: p k −1 p k p k +1 . Подставив вместо каждой вероятности соответствующую формулу, получим, что число k должно удовлетворять двойному неравенству:

.

Если расписать формулы для факториалов и провести простые преобразования, можно получить, что левое неравенство дает k ≤ а , а правое k ≥ а −1 . Таким образом, число k удовлетворяет двойному неравенству а −1 ≤ k ≤ а , т.е. принадлежит отрезку [а −1, а ] . Поскольку длина этого отрезка, очевидно, равна 1 , то в него может попасть либо одно, либо 2 целых числа. Если число а целое, то в отрезке [а −1, а ] имеется 2 целых числа, лежащих на концах отрезка. Если же число а не целое, то в этом отрезке есть только одно целое число.

Таким образом, если число а целое, то мода распределенной по Пуассону случайной величины Х принимает 2 соседних значения: d (X )=а−1 и d (X )=а . Если же число а не целое, то мода имеет одно значение d (X )= k , где k есть единственное целое число, удовлетворяющее неравенству а −1 ≤ k ≤ а , т.е. d (X )= [а ] .

Пример . Завод отправил на базу 5000 изделий. Вероятность того, что в пути изделие повредится, равно 0.0002 . Какова вероятность, что повредится 18 изделий? Каково среднее значение поврежденных изделий? Каково наивероятнейшее число поврежденных изделий и какова его вероятность?