Учебник по математической статистике |
|||||||||||||||||||||||||
Глава 1. Основные распределения и их моделирование"Математические модели – объект и орудие труда математика" ВведениеВыше мы определили статистическую модель и ее отношение к
вероятностной модели: в обоих случаях модель задается плотностью
распределения f(x) наблюдаемой случайной величины
Пусть из каких-то соображений (например, основываясь на
центральной предельной теореме теории вероятностей)
постулируется, что
(здесь
Поскольку в дальнейшем мы будем иметь дело с конкретными значениями, которые широко используется в практических приложениях, мы сначала приведем для напоминания и удобства изложения и последующих ссылок – справочник основных вероятностных распределений, сопровождая их некоторыми относящимися к теме комментариями. Это очень важный материал, поскольку он является базой для решения всех примеров и последующих задач. §1.1 Основные дискретные модели математической статистикиВ этом параграфе мы дадим определения и опишем необходимые нам в последующем основные свойства наиболее известных дискретных вероятностных распределений (как одномерных, так и многомерных), а также проиллюстрируем их использование в вероятностных и статистических задачах. Замечательным фактом является то, что существует несколько распределений большой общности, встречающихся в самых разнообразных задачах теории вероятностей и математической статистики. Прежде всего это биномиальное распределение, распределение Пуассона и нормальное распределение – с первого мы и начнем. 1. Схема Бернулли и биномиальное распределение.
Говорят, что случайная величина
P{ В терминах плотности f(x) это можно записать в виде f(x) = f(x | p) = pxq1-x, x = 0,1, q = 1 – p (2) В символьных обозначениях сказанное выражается кратко так:
E Если все случайные величины последовательности {X, X, …} (конечной или бесконечной) независимы и имеют одно и то же распределение Bi(1,p), то мы имеем последовательность испытаний Бернулли или, кратко, бернуллиевскую последовательность, называемую так по имени Якоба Бернулли (1654 - 1705) – выдающегося швейцарского математика, впервые изучавшего такую схему (его основополагающие труды в области теории вероятностей изложены в посмертно изданном сочинении "Искусство предположений" (1713). Пусть {X1, …, Xn} – бернуллиевская последовательность с параметром p. Тогда сумма X = X1 + …+ Xn имеет биномиальное распределение с параметрами n и p, что кратко записывается в виде: L(X) = Bi(n, p). Эта случайная величина принимает, очевидно, лишь значения 0, 1, …, n и при этом
Термин "биномиальное распределение" связан с тем, что вероятности (4) являются членами известного "бинома Ньютона":
Таким образом, биномиальную модель Bi(n, p) описывает распределение числа "успехов" в n испытаниях Бернулли с неизменной вероятностью "успеха" p. Здесь EX = np и DX = npq. (5) Полезно знать также следующее свойство биномиального распределения: если случайные величины X , …, X независимы и L(Xj) = Bi(nj, p), j = 1, …, k, то L(X1 + …+ Xk) = Bi(n1 +…+ nk, p). Это свойство биномиального распределения Bi(n, p) называется воспроизводимостью по параметру n. Если параметр p нам неизвестен (а так на практике чаще всего
и бывает!), то мы имеем биномиальную статистическую модель
Bi(n, Пример 1. Рассмотрим
ситуацию, описанную в примере 1 Введения.
Если в данном эксперименте реализуется схема выбора
с возвращением, и если условия эксперимента обеспечивают
независимость извлечения очередного шара от результатов
предыдущих извлечений (практически это достигается тщательным
перемешиванием содержимого урны перед каждым очередным извлечением),
то мы имеем бернуллиевскую модель Bi(1,
Пример 2. Рассмотрим подробно описанный в примере 4
Введения эпизод с преподобным Галиани. Здесь мы имеем
эксперимент, состоящий в пятикратном бросании трех игральных
костей. Интересующая нас величина, характеризующая один опыт,
- число выпавших шестерок на трех костях. Обозначим ее
P{X = 15} = f(15 | 15,
Следовательно, при справедливости гипотезы H0 вероятность наблюдаемого события, т.е. X = 15, равна 6-15, что ничтожно мало (!). Наверное, любой бы разумный человек на месте преподобного усомнился в истинности гипотезы H0 в данном случае (при таком наблюдаемом ходе эксперимента). Замечание. Обратим внимание на следующее. В данном
случае, если отбросить несущественные для математики
эмоциональные нюансы (пари), а оставить лишь физическую суть
эксперимента (в его ходе было брошено 3*5 = 15 костей), то можно
сразу говорить о случайной выборке объема n = 15 из
распределения Бернулли Bi(1,
2. Отрицательное биномиальное распределение.
С бесконечной последовательностью испытаний Бернулли
{X1, X2, …} связано еще одно важное
дискретное распределение, которое обозначается
Заметим, что выражение f(x | r, p) совпадает с х-м членом разложения функции qr(1 – p)-r в ряд по степеням р; т.е. отрицательного бинома (отсюда и название):
В частном случае r = 1 распределение (1, p) называется геометрическим: это есть распределение числа частиц, предшествующих первому нулю в бернуллиевской последовательности. Формула (6) в этом случае принимает вид
Если случайная величина
Полезно знать также свойство воспроизводимости распределения
Если параметр р неизвестен, то имеем отрицательную
биномиальную статистическую модель
Замечание. В формуле (6) биномиальный коэффициент
3. Распределение Пуассона. Случайная величина
Что кратко записывается в виде L( Это одно из важнейших дискретных вероятностных распределений впервые было исследовано в 1837 г. С.Пуассоном (французский математик, механик и физик, 1781 – 1840 гг.), именем которого оно и называется. Пуассоновская модель П( Пример 3. Дни рождения (из книги В.Феллера
"Введение в теорию вероятностей и ее применения" Т1. – М.: Мир,
1984, с. 171 - 172). Какова вероятность px того, что в группе из
500 человек ровно х родились 1 января? Если эти 500 человек
выбраны случайно, то можно применить схему из 500 испытаний
Бернулли с вероятностью успеха р = 1/365. Для пуассоновского
приближения положим
Распределение Пуассона воспроизводимо по своему параметру,
т.е. если X1, … , Xk –
независимые случайные величины и
L(Xj) = П( Если параметр 4. Гипергеометрическое распределение.
Случайная величина
Такое распределение возникает в следующей схеме. Рассмотрим
ситуацию, описанную в примере 1 Введения, и предположим, что n
шаров извлекаются наугад без возвращения. Тогда, если
Заметим, что вероятности (10) отличны от нуля лишь при x ≤ a1 и n - x ≤ a2, т.е. когда целое х лежит в интервале max(0, n - a2) ≤ x ≤ min(n, a1). Если
"Обобщение понятия зачастую бывает полезно для постижения его сущности". А.Н.Колмогоров (1903-1987), великий русский ученый, один из крупнейших математиков ХХ века, академик АН СССР,создатель современной аксиоматики теории вероятностей. 5. Распределение Маркова-Пойа. Это распределение является обобщением одновременно и биномиального и гипергеометрического распределений и возникает оно в следующей урновой схеме. Вновь вернемся к примеру 1 Введения и рассмотрим следующий эксперимент. Из урны, содержащей первоначально a1 белых и a2 = a - a1 черных шаров, выбирается наугад (т.е. равновероятно) один шар, фиксируется его цвет и шар возвращается в урну с одновременным добавлением с новых шаров того же цвета. Затем из урны (содержащей теперь а + с шаров) снова производится случайное извлечение одного шара и повторяется тот же процесс. Здесь с может быть любым целым числом и, в частности, при с = 0 (новые шары не добавляются), мы имеем случайный выбор с возвращением, рассмотренный в примере 1.1, а при с = -1 (извлеченный шар в урну не возвращается) – схему случайного выбора без возвращения, рассмотренную в предыдущем п. 4 (в последнем случае процесс извлечения шаров кончается через а шагов из-за отсутствия шаров в урне). При с > 0 эта схема выбора обладает эффектом последействия 6 если извлекается шар какого-то цвета, то шанс (вероятность) извлечь шар такого же цвета при следующем испытании возрастает. Такая урновая схема может служить приближенной моделью явлений, подобных эпидемиям, когда осуществление некоторых событий увеличивает шанс их повторения. Пусть
Если воспользоваться биномиальными коэффициентами и учесть, что любого действительного а и натурального х
то формулу (12) при с ≠ 0 (тогда числитель и знаменатель можно разделить на cn) можно записать также в любой из следующих двух форм:
Подчеркнем, что из (12) при с = 0 мы получаем
биномиальное распределение Bi(n, p),
Если L(
Интересна история открытия этого распределения. Впервые оно появляется в рвботах выыдающегося русского математика, академика А.А. Маркова (1856 - 1922), который провел исчерпывающий анализ этого распределения и опубликовал свои результаты в Известиях Петербургской Академии Наук в 1917 г. Но, по-видимому, эта публикация "осталась незамеченной" за рубежом, так как, спустя 6 лет, в 1923 г. появляется работа Ф. Эггенбергера и Д. Пойа, где вводится такое же распределение и доказываются для него некоторые частные результаты. С этих пор данное распределение стало называться в зарубежной литературе именем одного из его авторов – Пойа (выдающийся венгерский математик, 1887- 1985), хотя более исторически оправдано название "распределение Маркова-Пойа". 6. Полиномиальное распределение.
M(n; p) с параметрами n и p,
где n – натуральное число и p = (p1, … , pN),
0 < pi < 1, i = 1, … , N,
p1+ … + pN = 1,
- это распределение случайного вектора
где x = (x1, … , xN)
– произвольный вектор с целыми неотрицательными компонентами,
причем x1 + … + xN = n.
Кратко это записывается так:
L( Название "полиномиальное распределение" связано с тем, что вероятность (15) представляет собой общий член в разложении полинома (p1 + … + p1)n по степеням p1, … , pN:
Здесь
Такое распределение возникает в схеме полиномиальных
испытаний, т.е. независимых испытаний с N возможными
исходами, вероятности которых не меняются от испытания к
испытанию и равны p1, … , pN
соответственно: если произведено n испытаний и
Отметим еще, что часто вместо термина "полиномиальное" используется его синоним "мультиномиальное". В приложениях обычно вектор вероятностей
p = (p1, … , pN)
неизвестен – в этом случае мы имеем полиномиальную статистическую модель
Пример 3. (обобщение примера 1 Введения).
Имеется урна с шарами N различных цветов, которые мы условно
обозначим A1, … , AN.
Пусть aj – число шаров цвета Aj,
j = 1, … , N, и
а = a1 + … + aN
- общее число шаров в урне. Рассмотрим следующий эксперимент:
из урны по схеме выбора с возвращением наугад (т.е.
равновероятно) извлекается n шаров (т.е. каждый раз любой шар
может быть извлечен с одинаковой вероятностью 1/а и независимо
от результатов предыдущих извлечений). Обозначим
7. Многомерное распределение Маркова-Пойа.
Вновь обратимся к ситуации, описанной в примере 3, и
рассмотрим теперь такой эксперимент: последовательно в
каждый момент времени n = 1, 2, … из
урны наугад извлекается один шар, фиксируется его цвет,
и шар возвращается обратно в урну с добавлением новых шаров
того же цвета, что и извлеченный шар (тем самым состав урны
каждый раз увеличивается на с шаров, если с < 0;
при с = 0 он остается неизменным, т.е. в этом случае
мы имеем схему выбора с возвращением, рассмотренную в примере
3). Вновь обозначим
где x = (x1, … , xN) – произвольный вектор с целыми неотрицательными координатами, причем x1 + … + xN = n; множество всех таких векторов будем обозначать KNn. Это распределение называется многомерным (N-мерным) распределением Маркова-Пойа с параметрами n, a и с и обозначается символом МП(n; a, с), где a = (a1, … , aN) - вектор первоначального состава урны. Формула (17) является многомерным (N-мерным) случаем формулы (12) и сводится к ней при N = 2. Если с ≠ 0, то разделив числитель и знаменатель в (17) на c и используя, как и в п.5, биномиальные коэффициенты, этой формуле можно придать еще 2 формы – аналоги форм (13):
Отметим два важных частных случая этих соотношений. Если
в формуле (1.17) положить с = 0, то мы придем к
(1.15) с p =
которое является многомерным (N-мерным) аналогом
гипергеометрического распределения (10) и сводится к нему
при N = 2. Поэтому распределение, задаваемое
вероятностями (19), называется многомерным (N-мерным)
гипергеометрическим распределением с параметрами a и n.
Оно обозначается символически L( Наконец, если в первом представлении (18) все aj положить равными с, то биномиальные коэффициенты в числителе станут равными 1, и мы придем к формуле
задающей равномерное распределение на множестве
KNn = {x = (x1, … , xN):
xi = 0, 1, 2, … ,
i = 1, … , N;
x1 + … + xN = n}:
число элементов (векторов x) этого множества равно
Таким образом, многомерное распределение Маркова-Пойа включает в себя в качестве частных случаев полиномиальное распределение и многомерное гипергеометрическое распределение. Если L(
8. Распределение степенного ряда. Целый
класс дискретных распределений может быть построен по
следующей схеме. Рассмотрим произвольный степенной ряд
(это числа неотрицательные и в сумме дают 1). Такого типа
распределение и называется распределением степенного ряда.
Класс таких распределений весьма обширен и включает в себя
многие стандартные распределения. В частности, в него входят
распределение Пуассона П(
для него Примечание. Усеченным называется распределение, у которого некоторые значения запрещены. Например, усеченным в нуле распределением Пуассона является распределение, задаваемое вероятностями (сравни с (9))
где константа с определяется из условия нормировки
Если случайная величина
(убедитесь, что формулы для моментов в п.п. 2 и 3 являются частными случаями этих выражений). Важным свойством степенного ряда является следующее: если
случайные величины X1, … , Xn
независимы и имеют одно и то же распределение (21), то их
сумма Х = X1 + … + Xn
также имеет распределение степенного ряда, порождаемое функцией
где коэффициенты an(x) определяются разложением
|
СодержаниеРаспределения1. Схема Бернулли и биномиальное распределение 2. Отрицательное биномиальное распределение 4. Гипергеометричес-кое распределение 6. Полиномиальное распределение 7. Многомерное распределение Маркова-Пойа 8. Распределение степенного ряда Примеры |
||||||||||||||||||||||||