Схема повторных независимых испытаний.
Формула Бернулли
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Схема Бернулли
Теория вероятностей имеет дело с такими экспериментами, которые
можно повторять (по крайней мере теоретически)
неограниченное число раз. Пусть некоторый эксперимент повторяется
раз, причем результаты каждого повторения не
зависят от исходов предыдущих повторений. Такие серии повторений называют
независимыми испытаниями. Частным случаем таких испытаний являются независимые
испытания Бернулли, которые характеризуются двумя условиями:
1) результатом каждого испытания является один из двух возможных
исходов, называемых соответственно
«успехом» или «неудачей».
2) вероятность «успеха», в
каждом последующем испытании не зависит от результатов предыдущих испытаний и
остается постоянной.
Схему испытаний Бернулли
называют также
биномиальной схемой,
а соответствующие вероятности –
биномиальными, что связано с использованием биномиальных коэффициентов
.
Теорема Бернулли
Если производится серия из
независимых
испытаний Бернулли, в каждом из которых «успех» появляется с вероятностью
, то вероятность того, что «успех» в
испытаниях
появится ровно
раз,
выражается формулой:
где
– вероятность
«неудачи».
– число сочетаний
элементов по
(см.
основные формулы комбинаторики)
Эта формула называется
формулой Бернулли.
Формула Бернулли позволяет
избавиться от большого числа вычислений — сложения и умножения вероятностей —
при достаточно большом количестве испытаний.
Если число испытаний n велико, то пользуются:
- локальной формулой Муавра — Лапласа
- интегральной формулой Муавра — Лапласа
- формулой Пуассона
Примеры решения задач
Пример 1
Всхожесть
семян некоторого растения составляет 70%. Какова вероятность того, что из 10
посеянных семян взойдут: 8, по крайней мере 8; не менее 8?
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Решение
Воспользуемся
формулой Бернулли:
В нашем
случае
Пусть
событие
– из 10 семян взойдут 8:
Пусть
событие
– взойдет по крайней мере 8 (это значит 8, 9
или 10)
Пусть
событие
– взойдет не менее 8 (это значит 8,9 или 10)
Ответ: P(A)=0.2335;P(B)=0.3828; P(C)=0.3828
Пример 2
В
результате обследования были выделены семьи, имеющие по четыре ребенка. Считая
вероятности появления мальчика и девочки в семье равными, определить
вероятности появления в ней:
а) одного
мальчика;
б) двух мальчиков.
Решение
Вероятность
появления мальчика или девочки равна
. Вероятность появления
мальчика в семье, имеющей четырех детей, находится по формуле Бернулли:
В нашем
случае:
б)
Вероятность появления в семье двух мальчиков:
Ответ: а)
; б)
.
Пример 3
Два
равносильных противника играют в шахматы. Что вероятнее а) выиграть одну партию
из двух или две партии из четырех? б) выиграть не менее двух партий из четырех
или не менее трех партий из пяти? Ничьи во внимание не принимаются.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Играют
равносильные шахматисты, поэтому вероятность выигрыша
, следовательно вероятность проигрыша
тоже равна 1/2. Так как во всех партиях вероятность выигрыша постоянна и
безразлично, в какой последовательности будут выиграны партии, то применима
формула Бернулли:
а) Вероятность
выиграть 1 партию из двух:
Вероятность
выиграть 2 партии из четырех:
Вероятнее
выиграть одну партию из 2-х.
б) Вероятность
выиграть не менее 2-х партий из 4:
Вероятность
выиграть не менее 3-х партий из 5:
Вероятнее
выиграть не менее 2-х партий из 4.
Ответ: а) Вероятнее выиграть одну партию из
2-х; б) Вероятнее выиграть не менее 2-х партий из 4.
Задачи контрольных и самостоятельных работ
Задача 1
Всхожесть
семян данного сорта имеет вероятность 0.7. Оценить вероятность того, что из 9 семян
взойдет не менее 4 семян.
Задача 2
Найти
вероятность того, что в n независимых испытаниях
событие A появится ровно k раз, зная, что в каждом
испытании вероятность появления события равна p.
.
Задача 3
а) Найти
вероятность того, что событие А появится не менее трех раз в четырех
независимых испытаниях, если вероятность появления события А в одном испытании
равна 0,4. б) событие В появится в
случае, если событие А наступит не менее четырех раз. Найти вероятность
наступления события В, если будет произведено пять независимых испытаний, в
каждом из которых вероятность появления события А равна 0,8.
Задача 4
В ралли участвует
10 однотипных машин. Вероятность выхода из строя за период соревнований каждой
из них 1/20.
Найти
вероятность того, что к финишу придут не менее 8 машин.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 5
Баскетболист
бросает мяч 4 раза. Вероятность попадания при каждом броске равна 0,7. Найти
вероятность того, что он попадет в корзину: а) три раза; б) менее 3 раз; б)
более трех раз.
Задача 6
В семье
пятеро детей. Считая, что вероятность рождения мальчика равна 0.4, найти
вероятность того, что среди этих детей есть не менее двух девочек.
Задача 7
В
микрорайоне пять машин технической службы. Для бесперебойной работы необходимо,
чтобы не меньше трех машин были в исправном состоянии. Считая верояность
исправного состояния для всех машин одинаковой и равной 0,75, найти вероятность
бесперебойной работы технической службы в микрорайоне.
Задача 8
В среднем
каждый десятый договор страховой компании завершается выплатой по страховому
случаю. Компания заключила пять договоров. Найти вероятность того, что
страховой случай наступит: а) один раз; б) хотя бы один раз.
Задача 9
В
мастерской работают 6 моторов. Для каждого мотора вероятность перегрева к
обеленному перерыву равна 0,8. Найти вероятность того, что к обеденному
перерыву перегреются 4 мотора.
Задача 10
Пусть
вероятность того, что телевизор потребует ремонта в течение гарантийного срока,
равна 0,2. Найти вероятность того, что в течение гарантийного срока из 6
телевизоров: а) не более одного потребует ремонта; б) хотя бы один не потребует
ремонта.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 11
Контрольное
задание состоит из 5 вопросов, на каждый из которых дается 4 варианта ответа,
причем один из них правильный, а остальные неправильные. Найдите вероятность
того, что учащийся, не знающий ни одного вопроса, дает: а) 3 правильных ответа;
б) не менее 3-х правильных ответов (предполагается, что учащийся выбирает
ответы наудачу).
Задача 12
Стрелок
попадает в мишень с вероятностью 0,6. Производится серия из 4 выстрелов.
а) Какова
вероятность того, что число промахов будет равно числу попаданий?
б) Найти
вероятность хотя бы одного промаха.
Задание 13
Дана
вероятность p=0.5 появления события A в серии из
независимых испытаний. Найти вероятность того,
что в этих испытаниях событие
появится:
а) ровно
раза
б) не
менее
раз
в) не
менее
раза и не более
раза.
Задача 14
Применяемый
метод лечения в 80% случаев приводит к выздоровлению. Найти вероятность того,
что из четырех больных поправятся:
а) трое;
б) хотя
бы один;
в) найти
наивероятнейшее количество поправившихся больных и соответствующую этому
событию вероятность.
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Теория вероятностей — это математическая наука, которая изучает закономерности случайных явлений. Случайные явления определяются как явления с неопределенным исходом, возникающие при многократном воспроизведении определенного набора условий.
На данной странице находится курс лекций по теории вероятности по всем темам предмета «Теория вероятностей«.
Лекции по теории вероятностей содержат большое количество примеров решения задач и выполнения заданий.
Содержание:
Основные понятия о теории вероятностей
Теория вероятностей — это математическая наука, изучающая закономерности случайных явлений. Случайные явления определяются как явления с неопределенным исходом, возникающие при многократном воспроизведении (повторении) одного и того же опыта в одних и тех же условиях.
В природе и технике, экономике и спорте нет ни одного физического явления, не содержащего элементов случайности. Разработка и изучение методов теории вероятностей и вероятностных моделей позволяет понять различные свойства случайных явлений на абстрактном и обобщенном уровне, не прибегая к экспериментам.
Цель вероятностных методов — обойти чрезмерно сложное (и часто невозможное) изучение одного случая, исследовать закономерности массовых случайных явлений, предсказать их характеристики, повлиять на ход этих явлений, контролировать их, ограничить масштаб случайности.
Фундамент каждой науки — ее важные понятия, основа красивого здания, которое пригодится на всю жизнь.
Предмет теории вероятностей
Рассмотрим некоторый эксперимент, в результате которого может появиться или не появиться событие А. Примерами такого эксперимента могут быть:
- а) эксперимент — изготовление определенного изделия, событие А — стандартность этого изделия;
- б) эксперимент — подкидывание монеты, событие А — выпал герб;
- в) эксперимент — стрельба пятью выстрелами в мишень, событие А — выбито 30 очков;
- г) эксперимент — введение программы в компьютер, событие А — безошибочный ввод.
Общим для всех экспериментов является то, что каждый из них может реализовываться в определенных условиях сколько угодно раз. Такие эксперименты называют испытаниями.
События бывают достоверные, случайные и невозможные.
Достоверным называют такое событие, которое при рассмотренных условиях обязательно случится.
Невозможным называют такое событие, которое при рассмотренных условиях не может случится.
Случайным называют такое событие, которое при рассмотренных условиях может случится, а может и не случится.
например, если в урне есть только белые шары, то добывание белого шара из урны — достоверное событие, а добывание из этой урны шара другого цвета -невозможное событие.
Если бросить монету на плоскость, то появление герба будет случайным событием, потому что вместо герба может появиться надпись.
Случайные события обозначают большими буквами, например
Каждое случайное событие является следствием многих случайных или неизвестных нам причин, которые влияют на событие. Поэтому невозможно предсказать исход однофакторного испытания.
Но если рассматривать случайное событие много раз при одинаковых условиях, то можно выявить определенную закономерность его появления или не появления. Такую закономерность называют возможной закономерностью массовых случайных событий.
В теории вероятностей под массовыми однородными случайными событиями понимают такие события, которые осуществляются многократно при одинаковых условиях или много одинаковых событий.
Например, бросить одну монету 1000 раз или 1000 одинаковых монет бросить один раз в теории вероятностей считают одинаковыми событиями.
Предметом теории вероятностей является изучение вероятностных закономерностей массовых однородных случайных событий.
Основные понятия, методы, теоремы и формулы теории вероятностей эффективно применяются в науке, технике, экономике, в теориях надежности и массового обслуживания, в планировании и организации производства, в страховом и налоговом делах, в социологии и политологии, в демографии и охране здоровья.
Краткая история о теории вероятностей
Первые работы, в которых возникли основные понятия теории вероятностей, появились в
Следующий этап (конец — начало
) развития теории вероятностей связан с работами Б. Паскаля, П. Ферма, Х. Гюйгенса, К. Гаусса, Я. Бернулли, С. Пуассона, А. Муавра, П. Лапласа, Т. Байеса.
Я. Бернулли сделал первые теоретические обоснования накопленных ранее фактов.
В теорию вероятностей начали успешно использовать в стразовом деле, артиллерии, статистике.
Только в конце П.Л. Чебышев и его ученики А.А. Марков и А.М. Ляпунов превратили теорию вероятностей в математическую науку.
Дальнейшим развитием теории вероятностей и случайных процессов обязаны таким математикам, как С.Н. Бернштейн, А.М. Колмогоров, Б.В. Гниденко, А.В. Скороход, В.С. Королюк, Ю. Нейман, И.И. Гихман, И.М. Коваленко.
Алгебра случайных событий
сначала познакомимся с разновидностями случайных событий.
Определение 1. События называют несовместными, если появление одного из них исключает появление других событий в одном и том же испытании.
Пример №1
Среди однородных деталей есть стандартные и нестандартные. Наугад берут из ящика одну деталь.
События
А — взята стандартная деталь,
В — взята нестандартная деталь
несовместны потому, что взята только одна деталь, которая не может быть одновременно стандартной и нестандартной.
Определение 2. События называют совместными, если появление одного из них не исключает возможности появления других (не обязательно одновременно).
Пример №2
Два стрелка стреляют в мишень.
События
— первый стрелок попал в цель,
— второй стрелок попал в цель
будут совместными случайными событиями.
Определение 3. Случайные события образуют полную группу событий, сели вследствие испытания хотя бы одно из них появится обязательно.
Пример №3
Бросают шестигранный кубик. Обозначим события так
— выпала грань 1;
— выпала грань 2;
— выпала грань 3;
— выпала грань 4;
— выпала грань 5;
— выпала грань 6.
События образуют полную группу.
В примере 2 события и
не образуют полную группу. Но если обозначить
событие, при котором никто из стрелков не попал в цель, тогда события
и
образуют полную группу.
Определение 4. События называют равновозможными, если нет причин утверждать, что любое из них вероятнее другого.
Пример №4
События — появление 1, 2, 3, 4, 5 или 6 очков при бросании шестигранного кубика — равновозможные, при условии, что центр его тяжести не смещенный.
Определение 5. Два несовместных события , которые образуют полную группу , называют противоположными.
Событие, противоположное событию А, обозначается
Пример №5
Если обозначить через А событие, при котором при стрельбе по мишени выбито 8 очков, то событие — при котором при стрельбе по мишени выбито любое другое число очков.
Теперь рассмотрим важное понятие пространства элементарных исходов.
Путь выполняется некоторый эксперимент, который имеет элементы случайности. Каждое испытание может иметь разные исходов.
Так, при бросании монеты могут быть два возможных исхода: герб или надпись
При бросании игрального кубика могут быть шесть возможных исходов.
В испытании «выстрел в мишень» можно рассматривать такие исходы, как попадание в цель, или количество выбитых очков, или координаты точки попадания.
Следовательно, что принимать за исход испытания, зависит от условия задачи.
Определение 6. Элементарными исходами называют такие события, которые невозможно разделить на более простые.
Множество всех возможных элементарных исходов называют пространством элементарных исходов.
Пространство элементарных исходов может содержать конечное, счетное, или несчетное множество элементов.
В роли элементарных исходов можно рассматривать точки -мерного пространства, отрезок некоторой линии, точки поверхности
или объема
трехмерного пространства, функцию одной или многих переменных.
В большинстве случаев, которые рассматриваются, допускают, что элементарные исходы равновозможные.
Пример №6
а) При двукратном бросании монеты пространство элементарных исходов содержит 4 точки
где означает появление герба,
— появление надписи.
б) Пусть в мишень стреляют одиночными выстрелами до первого попадания. Возможные такие элементарные события:
{попадание при первом выстреле},
{попадание при втором выстреле},
{попадание при третьем выстреле}
и т.д.
В этом случае пространство элементарных исходов может иметь бесконечное количество точек, которые можно путем нумерации перечислить. Поэтому пространство элементарных исходов будет счетным.
в) При производстве кинескопов возникают неодинаковые условия технологического процесса, поэтому время работы кинескопа отличается от его номинального значения, то есть будет случайным событием.
Пространство элементарных исходов в этом случае будет бесконечным несчетным множеством, элементы которого невозможно пронумеровать.
Теперь ознакомимся с алгеброй случайных событий.
Пусть и
— случайные события.
Объединением (суммой) случайных событий (или
) называют такое случайное событие, которое заключается в появлении событий.
А или В
или
А и В.
Если А и В — несовместимы, то означает появление события А или события В.
Рис. 1а и 1б. Событие В и противоположное ему
Рис. 1г. Заштрихованная площадь — произведение событий АВ.
Рис. 1д. Заштрихованная площадь — сумма событий
Рис. 1е. Заштрихованная площадь — разность событий
Аналогично определяют объединение (сумму) большего количества случайных событий.
Определение 7. Объединением (суммой) случайных событий называют такое случайное событие, которое заключается в появлении хотя бы одного из ‘mnb[ событий.
Если события парно несовместимы, то их сумма заключается в том, что должно появиться событие или
или
Бесконечную сумму случайных событий обозначают
Пример №7
Стрелок совершает один выстрел в мишень, разделенную на три области. Обозначим
событие — попадание в первую область;
событие — попадание во вторую область;
событие — попадание в третью область;
событие — нет попадания в мишень;
событие — попадание в первую или вторую области;
событие = попадание хотя бы в одну область мишени.
Тогда получим
Отметим, что события и
— несовместимые.
Определение 8. Разностью (или
) двух случайных событий
называют все исходы, которые заключаются в том, что событие А не появляется.
Произведением (пересечением) (или
) случайных событий А, В называют такое случайное событие, которое заключается в появлении событий А и В одновременно.
Если А и В — несовместимые, то произведение является множество, которое не содержит ни одного элемента. Такое множество называется пустым и обозначается
Таким образом, в случае несовместимости событий получим
Определение 9. Произведением (пересечением) конечного количества случайных событий называют такое случайное событие, которое заключается в появлении всех этих событий одновременно.
Событие означает, что рассматриваются все события
одновременно.
Указанные соотношения между событиями являются обычными соотношениями между множествами, которые можно представить графически (см. рис.1).
Пример №8
Стрелок стреляет дважды в мишень. Описать пространство элементарных исходов. Записать, событие, которое заключается в том, что:
а) стрелок попал в мишень хотя бы один раз (событие С); б) стрелок попал ровно один раз (событие ); в) стрелок не попал в мишень (событие
).
Решение.
Обозначим
Событие — попадание с первого выстрела;
событие — попадание со второго выстрела.
Пространство элементарных исходов состоит из четырех событий
а) Если стрелок попал в мишень хотя бы один раз, то это означает, что он попал или с первого выстрела или со второго выстрела
или с обоих
То есть,
б) Ровно одно попадание может быть только тогда, когда стрелок с первого выстрела попал, а со второго — нет, или с первого выстрела не попал, а со второго — попал.
Поэтому,
в) Если стрелок не попал в мишень, то это означает, что он не попал с обоих выстрелов,
То есть,
Определение и свойства вероятности и частоты
Для сравнения случайных событий по степени их возможности необходимо каждое событие связать с определенным числом, которое должно быть тем больше, чем более возможно событие. Такое число называют вероятностью события. Существует несколько определений вероятности. Ознакомимся с ними.
Определение 1. Вероятностью события является мера степени объективной возможности этого события.
Это определение вероятности определяет философскую суть вероятности, но не показывает закон нахождения вероятности любого события.
Определение 2 (классическое). Вероятность события А равна отношению числа элементарных исходов, которые способствуют появлению события А, к общему числу всех единственно возможных и равновозможных элементарных исходов.
Вероятность события обозначают
По определению 2
где — число элементарных исходов, которые способствуют событию
,
— число всех единственно возможных и равновозможных исходов.
Пример №9
В урне 6 одинаковых по размеру шаров: 2 красных, 3 синих, 1 белый. Найти вероятность появления красного шара, если берут один шар из урны наугад.
Решение. Пусть событие — наугад взяты красный шар. Из урны можно взять любой шар из шести, поэтому всех возможных исходов 6
Появлению красного шара будут способствовать только два шара, поэтому
По формуле (1) получим
Замечание 1. При решении многих задач нахождение чисел и
имеет определенные трудности, предотвратить которые помогают принципы и формулы комбинаторики, с которыми ознакомимся ниже.
Замечание 2. Классическое определение вероятности имеет место только тогда, когда и
конечные, все элементарные исходы равновозможные (именно это положение в большинстве азартных игр, которые осуществляются без мошенничества) .
Если множество элементарных исходов бесконечно или элементарные исходы не равновозможные, то формулой (1) пользоваться нельзя.
Если множество всех элементарных исходов бесконечно и, как следствие, занимает некоторую область а событию
способствует только часть
то вычисление вероятности события
выполняют в соответствии с геометрическим определением вероятности.
Определение 3 (геометрическое). Вероятность случайного события А равна отношению меры к мере
Замечание 3. Если область — промежуток, поверхность или пространственное тело,
— часть
, тогда мерой
и
будет длина, площадь или объем соответствующей области. Если
и
промежутки времени, тогда их мерой будет время.
В общем случае меры области определяют аксиомами.
Пример №10
Два туристических парохода должны причалить к одному причалу. Время прибытия обоих пароходов равновозможное в течение суток.
Определить вероятность того, что одному из пароходов придется ждать освобождения причала, если время стоянки первого парохода равно одному часу, а второго — двум часам.
Решение. Пусть и
— время прибытия пароходов.
Возможные значения и
:
Благоприятные значения:
Построим эту область (см. рис. 2)
Отношение площади заштрихованной фигуры к площади квадрата, сторона которого равна 24, согласно формуле (2) равно искомой вероятности
Определение 4. Относительной частотой или частостью события А называют отношение числа испытаний, в которых событие А появилось, к числу фактически выполненных испытаний.
Относительную частоту события А обозначают или
Следовательно,
где — количество испытаний, в которых появилось событие А,
— количество всех испытаний.
Пример №11
Отдел технического контроля среди 100 изделий выявил 8 нестандартных. Чему равна относительная частота появления нестандартных изделий?
Решение. Обозначим через такое событие, как появление нестандартного изделия. Тогда по определению частоты события А, получим
Замечание 4. Подчеркнем, что вероятность события А вычисляется до испытания, а частота
вычисляется после испытания.
Частота имеет свойство стойкости: при большом количестве испытаний частота изменяется очень мало, колеблясь около некоторого постоянного числа — вероятности появления этого события, то есть
Определение 5. Статистическая вероятность — это относительная частота (частость) или число, близкое к ней.
Теперь рассмотрим основные свойства вероятности, используя формулу (1) классического определения вероятности события А.
- Если событие А достоверно, то его вероятность равна единице, то есть
- Если событие А невозможно, то его вероятность равна нулю, то есть
- Если событие А случайное, то его вероятность удовлетворяет соотношение
Действительно, при рассматриваемых условиях достоверное событие обязательно появится, как вследствие, все возможные элементарные исходы способствуют событию А, то есть и по формуле (1) получим
Если при условиях, которые рассматриваются, событие А невозможно, тогда среди всех возможных исходов нет тех, которые способствуют событию А, то есть и по формуле (1) получим
Если событие А случайное то среди всех возможных исходов существует
исходов, которые способствуют событию А,
Поэтому, согласно формуле (1) получим соотношение (3).
Замечание 5. Последнее свойство вероятности случайных событий используется для осуществления самоконтроля при решении многих задач теории вероятностей.
Основные понятия и принцип комбинаторики
Часто для нахождения чисел и
которые входят в классическое определение вероятности события, необходимо знать количество разнообразных соединений, которые можно получить из
элементарных исходов.
Классификация и свойства таких соединений, а также формулы для вычисления количества разных соединений разработаны математиками и содержатся в разделе «Комбинаторика» курса алгебры.
Ознакомимся с основными понятиями и формулами комбинаторики.
Определение 1. Разные группы, составленные из любых элементов, которые отличаются элементами или порядком этих элементов, называют соединениями или комбинациями этих элементов.
Пример №12
Из цифр можно составить много разных соединений по
цифр. Некоторые из них будут отличаться количеством цифр, а некоторые будут отличаться только порядком цифр. Например,
Все возможные соединения целесообразно классифицировать. Соединения бывают трех видов:
— перестановка;
— размещение;
— сочетание.
Определение 2. Соединения из элементов, которые отличаются только порядком элементов, называют перестановкой этих элементов.
Количество перестановок из элементов обозначают
и находят по формуле
Обозначение проговаривают «
факториал».
По определению
Пример №13
Сколько пятизначных чисел можно записать, используя пять разных цифр (кроме нуля)?
Решение. Соединения, которые образуют из пяти разных цифр пятизначные числа, могут отличаться только порядком цифр, поэтому такие соединения будут перестановкой из 5 элементов. Согласно формуле (1) их количество будет
Определение 3. Размещением из элементов по
называют такие комбинации, которые состоят из
элементов, взятых из данных
элементов
и отличаются как порядком, так и элементами.
Количество размещений из элементов по
обозначают
и находят по формуле
Пример №14
Студенты второго курса согласно учебного плана изучают 10 дисциплин. На один день можно планировать занятия по 4 дисциплинам. Сколькими способами можно составить расписание занятий на один день?
Решение. Все возможные расписания занятий на один день — это соединения из 10 по 4, которые могут отличаться дисциплинами или их порядком, то есть эти соединения — размещение. Количество таких размещений согласно формуле (2) будет
Определение 4. Сочетанием из элементов по
называют комбинации, которые состоят из
элементов, взятых из данных
элементов и отличаются хотя бы одним элементом.
Количество сочетаний из элементов по
обозначают
находят по формуле
Замечание 1. Перестановку можно рассматривать как частный случай размещения
Между количеством перестановок, размещений и сочетаний сцуществует простая связь
Часто целесообразно использовать такие свойства соединений:
Пример №15
В ящике 10 изделий, из которых 2 нестандартные. Наугад берут 6 изделий. Какая вероятность того, что все взятые изделия будут стандартными?
Решение. Обозначим событие — взято 6 стандартных изделий. Согласно условию задачи, нет значения, в каком порядке берт 6 изделий, то есть это будут сочетания.
Поэтому количество всех возможных элементарных исходов будет
Событию способствуют только соединения по 6 изделий из 8 стандартных в любом порядке то есть
Следовательно, согласно классическому определению вероятности события А, получим
Теперь ознакомимся с основными принципами комбинаторики.
Принцип суммы. Если множество содержит
элементов, а множество
содержит
элементов и
тогда множество
содержит
элементов.
Доказательство. Осуществляется простым подсчетом элементов множества
Сначала считаем все элементы множества А. Они получат номера от 1 до Среди них нет элементов множества
потому что
Теперь будем считать элементы множества Они получат номера от
поскольку множество В по условию имеет
элементов.
Таким подсчетом все элементы множества будут вычерпаны. Они поучат номера от 1 до
поэтому
содержит
элементов.
Замечание 2. Принцип суммы имеет место для суммы множеств, то есть для
Принцип произведения. Если множество содержит
элементов, а множество
содержит
элементов, то множество
всех возможных пар
содержит
элементов.
Доказательство. Множество С разобьем на подмножества
Поскольку состоит только из пар, которые содержат
а множество
состоит только их пар, которые содержат
то
Аналогично получаем, что когда
Теперь докажем, что
Действительно, пусть любая пара. Она входит в
согласно определению множества
Она также входит и в множество
так как
Каждое подмножество
множества
содержит
элементов, поэтому согласно определению принципа суммы, число элементов в их объединении равно
Пример №16
В корзине 4 яблока первого сорта и 5 яблок второго сорта. Наугад берут 2 яблока. Найти вероятность того, что будут взяты яблоки разных сортов.
Решение. Пусть событие А — наугад взятые 2 яблока разных сортов.
Всего яблок 9, из них сочетаний по 2 будет то есть количество всех возможных исходов
Событию А будут способствовать сочетания, созданные из пар, элементами которых будут яблоки разных сортов. Согласно принципу умножения, количество таких пар будет равно
Используя классическое определение вероятности, получим искомую вероятность события А
Основные теоремы теории вероятностей
Основными теоремами теории вероятностей являются две: теорема сложения вероятностей и теорема умножения вероятностей. Обе эти теоремы являются теоремами и могут быть доказаны только для событий, сводящихся к схеме случаев.
Сложение вероятностей несовместных событий
Теорема 1. Вероятность объединения двух случайных несовместных событий равна сумме их вероятностей
Доказательство. Пусть число всех возможных элементарных исходов появления событий А и В равно и
— число исходов, которые способствуют событиям А и В соответственно. Тогда событиям
будут способствовать
исходов. Следовательно, по классическому определению вероятности, получим
то есть утверждение теоремы доказано.
Совсем аналогично можно доказать следующее утверждение.
Теорема 2. Если случайные события попарно несовместны, то вероятность появления хотя бы одного из этих событий равна сумме их вероятностей
Пример №17
Вероятность попадания стрелком в первую область мишени равна 0,45, во вторую область — 0,35, в третью — 0,15. Найти вероятность того, что с одного выстрела стрелок попадет в первую или вторую область мишени.
Решение. Обозначим событием — попадание в первую область мишени; событием
— попадание во вторую область мишени.
С одного выстрела события и
несовместны. Поэтому вероятность попадания в первую или вторую область мишени будет
Теорема 3. Сумма вероятностей полной группы случайных событий равна единице
Доказательство. Если случайные события образуют полную группу, то они попарно несовместны, а их объединение будет достоверным событием. По Теореме 2 получим
Вероятность достоверного события равна единице, поэтому
Левые части равенств (2) и (3) одинаковые, поэтому правые части будут равными, то есть имеет место равенство (1). Теорема доказана.
Следствие. Два противоположных события и
образуют полную группу, поэтому имеет место равенство
из которого получаем формулу
нахождения вероятности противоположного события.
Пример №18
Вероятность получить сообщение от определенного лица в течение суток равна 0,25. Найти вероятность того, что сообщение в течение суток от этого лица не будет получено.
Решение. Обозначим событием А — сообщение от этого лица в течение суток поступит. По условию задачи имеет место соотношение Противоположное событие
означает, что в течение суток от этого лица сообщение не поступит. По формуле (4) получим
В страховом деле необходимо высчитывать, например, такую задачу.
Пример №19
По статистическим показателям государства можно сделать вывод, что 68% мужчин, которые достигли 60-тилетия, достигают также и 70-тилетия. Какая вероятность того, что 60-тилетний мужчина не достигнет своего 70-тилетия?
Решение. Если событие А — 60-тилетний мужчина достигает своего 70-тилетия, то противоположное событие — 60-тилетний мужчина не достигает своего 70-тилетия. По условию задачи
поэтому по формуле (4) получим
Следовательно, используя статистические данные государства, можно вычислить вероятность того, что 32% 60-тилетних мужчин умрет в течение 10 лет.
Зависимые и независимые события, условные вероятности
Определение 1. Случайные события А и В называют зависимыми, если вероятность появления одного из них зависит от появления или непоявления второго события.
Если вероятность появления одного события не зависит от появления или непоявления второго, то такие события называют независимыми.
Определение 2. Вероятность события В, вычисленная при условии появления События А, называют условной вероятностью события В и обозначают или
Пример №20
В урне 10 шаров: 3 белых и 7 черных. Наугад берут два шара. Пусть событие А — взят белый шар; событие В — взят черный шар.
Если шар, который взяли первым, возвращают в урну, то вероятность появления второго шара не зависит от того, какой взят первый шар.
Если первый шар не возвращается в урну, то вероятность второго события зависит от результата первого испытания.
Если первым взяли белый шар, то в урне осталось 2 белых шара и 7 черных, поэтому
Если первым взяли черный шар, то в урне осталось 3 белых шара и 6 черных шаров, поэтому
Следовательно, вероятность события В зависит от появления или непоявления события А.
Замечание. Если события А и В независимые, то условная вероятность равна безусловной вероятности, то есть
Умножение вероятностей
Теорема 4. Вероятность совместного появления двух случайных событий А и В равна произведению вероятностей одного из этих событий и условной вероятности второго события при условии, что первое событие появилось
Доказательство. Все элементарные исходы изобразим в виде точек (рис. 3).
Пусть появлению события А способствуют исходов, а появлению события В —
исходов. Всех возможных исходов
а событиям
будут способствовать
исходов.
Так как
то
что и требовалось доказать.
Соотношения (1) называют формулой умножения вероятностей зависимых случайных событий.
Следствие. В случае независимых случайных событий А и В формула (1) принимает вид
и называется формулой умножения вероятностей независимых случайных событий.
В случае конечного количества независимых случайных событий Формула (2) принимает вид
Пример №21
В некотором сообществе людей 70% курят, 40% болеют раком легких и 25% курят и имеют рак легких. Найти вероятность того, что наугад взятое человек из этого общества:
а) не курит, но имеет рак легких;
б) курит, но не имеет рак легких;
в) никогда не курит и не имеет рак легких;
г) или курит или имеет рак легких.
Решение. Обозначим события: А — человек курит; В — человек болеет раком легких. Тогда по условию задачи получим
Пример №22
Привести иллюстративную диаграмму свойства
Ответ. См. рис. 4.
Вероятность появления хотя бы одного случайного события
Пусть существует совместных случайных событий
Обозначим А — событие, которое заключается в том, что появится хотя бы одно из этих событий. Тогда событие
заключается в том, что события
События
и
образуют полную группу событий, поэтому
Отсюда получим
По этой формуле необходимо вычислять вероятность появления хотя бы одного случайного события из совместных событий.
Пример №23
Вероятность попадания в мишень первого стрелка равна 0,7, второго стрелка — 0,8, а третьего стрелка — 0,9. Найти вероятность попадания в мишень хотя бы одного стрелка.
Решение. Обозначим события
— в мишень попал первый стрелок;
— в мишень попал второй стрелок;
— в мишень попал третий стрелок;
— в мишень попал хотя бы один стрелок.
По условию задачи события и
независимые, поэтому события
и
также независимые.
Согласно формуле (1) и формуле умножения вероятностей независимых событий получим
Так как
то по формуле (2) получим
Теорема сложения вероятностей совместных событий
Теорема 5. Если случайные событие А и В совместные, то вероятность их объединения равна сумме их вероятностей без вероятности их совместного появления, то сеть
Доказательство. Согласно условию теоремы события А и В совместные, поэтому появится, если появится одно из трех несовместных событий
или
Согласно теореме сложения вероятностей несовместных событий получим
Событие А появится, если появится одно из двух несовместных событий или
Согласно теореме сложения вероятностей несовместных событий
Аналогично получим
Подставим (3) и (4) в формулу (2), тогда получим равенство (1), которое требовалось доказать.
Замечание. Если события А и В независимые, то формула (1) принимает вид
Для зависимых случайных событий получим
Пример №24
В зависимости от наличия сырья предприятие может производить и отправлять заказчикам ежедневно количество определенной продукции от 1 до 100. Какая вероятность того, что полученное количество продукции можно распределить без остатка
а) трем заказчикам;
б) четырем заказчикам;
в) двенадцати заказчикам;
г) трем или четырем заказчикам?
Решение. Обозначим события
А — полученное количество изделий делится на 3 без остатка;
В — полученное количество изделий делится на 4 без остатка.
Используя классическое определение вероятности, находим
События А и В — совместные, поэтому по формуле (1) получим
Надежность системы
Определение 1. Надежностью системы называют вероятность ее безотказной работы в определенное время (гарантийный срок).
Системы состоят из элементов, соединенных последовательно
или параллельно
При вычислении надежности систем необходимо выразить надежность системы через надежность элементов и блоков.
Надежность элементов считается известной, так как она связана с технологией их производства.
Обозначим надежность
того элемента,
— вероятность выхода из строя за время
того элемента,
— надежность блока.
Рассмотрим блок, все элементы которого независимые и соединенные последовательно (см. рис. 5).
Такой блок будет работать безотказно только в то время, когда все элементы работают безотказно. Согласно теореме умножения вероятностей независимых событий вероятность безотказной работы такого блока будет
Теперь рассмотрим блок, элементы которого соединенные параллельно (см. рис. 6).
Такой блок будет работать безотказно, если хотя бы один элемент не выйдет из строя. Поэтому вероятность безотказной работы будет
Любую сложную систему можно рассматривать как последовательное или параллельное соединение блоков, надежность которых вычисляют по формулам (1) и (2).
Пример №25
Прибор собран из двух блоков, соединенных последовательно и независимо работающих. Вероятность отказа блоков равна 0,05 и 0,08. Найти вероятность отказа прибора.
Решение. Отказом прибора является событие противоположное его безотказной работе. Вероятности безотказной работы блоков составят
Вероятность безотказной работы прибора составит согласно формуле (1)
Поэтому вероятность отказа прибора составит
Формулы полной вероятности и Байеса
Теорема 6. Если случайное событие А может появится только совместно с одним из несовместных между собой событий которые образуют полную группу, тогда вероятность события А вычисляется по формуле
Доказательство. По условию теоремы появление события А означает появление одного из событий то есть
События несовместные, поэтому и события
также несовместные. Согласно теореме сложения вероятностей несовместных событий получим
События А и — зависимые, поэтому для вычисления
можно использовать теорему умножения вероятностей зависимых событий, то есть
Подставим (3) в формулу (2) и получим равенство (1), которое требовалось доказать.
Формулу (1) называют формулой полной вероятности.
Пример №26
В первом ящике 20 деталей, из которых 15 стандартных. Во втором ящике 0 деталей, из которых 9 стандартных. Из второго ящика берут наугад одну деталь и перекладывают ее в первый ящик. Найти вероятность того, что взятая после этого наугад деталь из первого ящика стандартная.
Решение. Обозначим такие события: А — из первого ящика взята стандартная деталь; — из второго ящика переложили в первый стандартную деталь;
— из второго ящика переложили в первый нестандартную деталь.
Согласно условия задачи, из первого ящика модно взять деталь только после того, как произойдет событие или событие
События и
несовместны, а событие А может появится только совместно с одним из них. Поэтому для нахождения вероятности события А можно использовать формулу полной вероятности (1), которая в данном случае примет вид
Найдем нужные вероятности
Подставим эти значения в формулу (4) и получим
Теперь познакомимся с формулами Байеса.
По условиям Теоремы 1 неизвестно, с каким событием из несовместных событий появится событие А. Поэтому каждое из событий
можно считать гипотезой. Тогда
— вероятность
той гипотезы.
Если испытание проведено и в результате его событие А появилось, то условная вероятность может быть не равна
Сравнение вероятностей и
позволяет переоценить вероятность гипотезы при условии, что событие А появилось.
Для получения условной вероятности используем теорему умножения вероятностей зависимых событий
Подставим в формулу (5) вместо ее значение из формулы полной вероятности. Получим
Формулы (6) называют формулами Байеса. Они позволяют переоценить вероятности гипотез. Это важно при контроле или ревизиях.
Пример №27
Детали, изготовленные цехом завода, попадают для проверки их стандартности к одному из двух контролеров. Вероятность того, что деталь попадет к первому контролеру равна 0,6, а ко второму — 0,4. Вероятность того, что пригодная деталь будет признана стандартной первым контролером равна 0,94, а вторым — 0,98.
Пригодная деталь при проверке признана стандартной. Найти вероятность того, что деталь проверял первый контролер.
Решение. Обозначим такие события: А — пригодная деталь признана стандартной; — деталь проверял первый контролер;
— деталь проверял второй контролер. По условию примера
По формуле Байеса (6) при получим
Отметим, что до появления события А вероятность а после появления события А вероятность проверки детали первым контролером
уменьшилась.
Пример №28
Вероятность уничтожения самолета с одного выстрела для первой пушки равна 0,2, а для второй пушки — 0,1. Каждая пушка делает по одному выстрелу, причем было одно попадание в самолет. Какая вероятность того, что попала первая пушка?
Решение. Обозначим такие события: А — уничтожение самолета с первого выстрела первой пушкой; В — уничтожение самолета с первого выстрела второй пушкой; С — одно попадание в самолет. Имеем четыре гипотезы
которые образуют полную группу событий. Вероятностями этих гипотез будут
Так как сумма
является достоверным событием, то
Условные вероятности события С будут
Теперь по формуле Байеса находим искомую вероятность
Последовательности испытаний
Схемой Бернулли или последовательностью независимых одинаковых испытаний, или биномиальной схемой испытаний называют последовательность n испытаний, удовлетворяющих условиям.
Схема и формула Бернулли
Во многих задачах теории вероятностей, статистике и повседневной практике необходимо исследовать последовательность (серию) испытаний. Например, испытание «брошено 1000 одинаковых монет» можно рассматривать как последовательность 1000 более простых испытаний — «брошена одна монета». При бросании 1000 монет вероятность появления герба или надписи на одной монете не зависит от того, что появится на других монетах. Поэтому можно говорить, что в этом случае испытание повторяется 1000 раз независимым образом.
Определение 1. Если все испытаний проводить в одинаковых условиях и вероятность появления события А во всех испытаниях одинаковая и не зависит от появления или непоявления А в других испытаниях, то такую последовательность независимых испытаний называют схемой Бернулли.
Пусть случайное событие А может появится в каждом испытании с вероятностью или не появится с вероятностью
Поставим задачу: найти вероятность того, что при испытаниях событие А появится
раз и не появится
раз. Искомую вероятность обозначим
Сначала рассмотрим появление события А три раза в четырех испытаниях. Возможны такие события
то есть их
Если событие А появилось 2 раза в 4 испытаниях, то возможны такие события
их
В общем случае, когда событие А появляется раз в
испытаниях, таких сложных событий будет
Вычислим вероятность одного сложного события, например
Вероятность совместного появления независимых событий равна произведению вероятностей этих событий согласно теореме умножения вероятностей, то есть
Количество таких сложных событий и они несовместные. Поэтому, согласно теореме сложения вероятностей несовместных событий, получим
Формулу (1) называют формулой Бернулли .Она позволяет находить вероятность появления события А раз при
испытаниях, которые образуют схему Бернулли.
Замечание 1. Вероятность появления события А в испытаниях схемы Бернулли менее
раз находят по формуле
Вероятность появления события А не менее раз можно найти по формуле
или по формуле
Вероятность появления события А хотя бы один раз в испытаниях целесообразно находить по формуле
Замечание 2. Во многих случаях необходимо находить наиболее вероятное значение числа
появления новых событий А. Это значение
определяется соотношениями
Число должно быть целым. Если
— целое число, тогда наибольшее значение вероятность имеет при двух числах
Замечание 3. Если вероятность появления события А в каждом испытании равна то количество
испытаний, которые необходимо провести, чтобы с вероятностью
можно было утверждать, что событие А появится хотя бы один раз, находят по формуле
Пример №29
Прибор собран из 10 блоков, надежность каждого из них 0,8. Блоки могут выходить из строя независимо друг от друга. Найти вероятность того, что
а) откажут два блока;
б) откажет хотя бы один блок;
в) откажут не менее двух блоков.
Решение. Обозначим событием А отказ блока. Тогда вероятность события А по условию примера будет
поэтому
Согласно условию задачи Используя формулу Бернулли и Замечание 1, получим
Пример №30
За один час автомат производит 20 деталей. За сколько часов вероятность производства хотя бы одной бракованной детали будет не менее 0,952, если вероятность брака любой детали равна 0,01?
Решение. Используя формулу (2), найдем сначала такое количество произведенных деталей, чтобы с вероятностью можно было утверждать о наличии хотя бы одной бракованной детали, если вероятность брака по условию
Следовательно, за время (часов) автомат с вероятность. 0,952 произведет хотя бы одну бракованную деталь.
Пример №31
При новом технологическом процессе 80% всей произведенной продукции имеет наивысшее качество. Найти наиболее вероятное число произведенных изделий наивысшего качества среди 250 произведенных изделий.
Решение. Обозначим искомое число
Согласно Замечанию 2
По условию примера поэтому
Но должно быть целым числом, поэтому
Предельные теоремы в схеме Бернулли
Нахождение вероятностей и
по формуле Бернулли усложняется при достаточно больших значениях
и при малых
или
В таких случаях часто можно использовать вместо формулы Бернулли приближенные асимптотические формулы.
Укажем без доказательства три предельных теоремы, которые содержат приближенные формулы для вероятностей
Теорема 1 (Теорема Пуассона). Если так , что
для любого постоянного
Следствие. Вероятность появления события А раз в
испытаниях схемы Бернулли можно находить по приближенной формуле Пуассона
где
Формулу (1) целесообразно применять при больших и при малых
Пример №32
Учебник напечатан тиражом 100000 экземпляров. Вероятность неправильной брошюровки учебника равна 0,0001. Найти вероятность того, что тираж имеет 5 бракованных учебников.
Решение. Брошюровку каждого учебника можно рассматривать как испытание. Испытания независимые и имеют одинаковую вероятность неправильной брошюровки, поэтому задача укладывается в схему Бернулли. Согласно условию задачи
достаточно большое;
малое;
Используя формулу Пуассона (1), получим
Для приведения еще двух предельных теорем необходимо сначала определить локальную и интегральную функции Лапласа и ознакомится с их основными свойствами.
Определение 1. Локальной функцией Лапласа называют функцию вида
Эта функция часто используется, поэтому ее значение для разных приведены в учебниках и пособиях по теории вероятностей. Она табулирована для положительных
.
Основные свойства локальной функции Лапласа
- Функция Лапласа
четная, то есть
- Функция
определена для всех
-
когда
-
График локальной функции Лапласа имеет вид, показанный на рис. 7.
Определение 2. Интегральной функцией Лапласа называют функцию
Легко увидеть, что между локальной функцией и интегральной функцией
существует простоя связь
Основные свойства интегральной функции Лапласа
- Интегральная функция Лапласа является нечетной функцией
-
-
График интегральной функции Лапласа изображен на рис. 8.
Интегральная функция Лапласа табулирована для
Теорема 2 (Локальная теорема Муавра-Лапласа). Если в схеме Бернулли количество испытаний достаточно большое, а вероятность
появления события А во всех испытаниях одинаковая, то вероятность появления события А
раз может быть найдена по приближенной формуле
где
Замечание. Формулу (2) целесообразно использовать при и
Пример №33
Игральный кубик бросают 800 раз. Какая вероятность того, что количество очков, кратное трем, появится 267 раз.
Решение. В данном случае и
достаточно большие. Поэтому для нахождения
можно использовать формулу (2). Получим
Следовательно, по формуле (2) получим
Значение взято из таблицы. Так
Теорема 3 (Интегральная теорема Муавра-Лапласа). Если в схеме Бернулли в каждом из независимых испытаний событие А может появится с постоянной вероятностью
тогда вероятность появления события А не меньше
и не больше
раз может быть найдена по формуле
где — интегральная функция Лапласа,
Пример №34
Игральный кубик бросают 800 раз. Какая вероятность того, что количество очков, кратное трем, появится не меньше 260 и не больше 274 раз?
Решение. Для нахождения вероятности
используем формулы (4) и (3). Получим
Значение интегральной функции Лапласа взято из таблицы и применяется свойство нечетности функции
Последовательность испытаний с разными вероятностями
В схеме Бернулли вероятность появления события А во всех испытаниях одинаковая. Но на практике иногда встречаются и такие случаи, когда в независимых испытаниях вероятности появления события А разные, например, они равны
Тогда вероятности непоявления события А также будут разными
В этом случае нельзя вычислять по формуле Бернулли вероятность появления события А раз в
испытаниях, а необходимо использовать производную функцию
Правило. Искомая вероятность равна коэффициенту, который стоит при
Пример №35
Вероятности отказа каждого из 4 приборов в 4 независимых испытаниях разные и равны
Найти вероятность того, что вследствие испытаний
а) не откажет ни один прибор;
б) откажут один, два, три, четыре прибора;
в) откажет хотя бы один прибор;
г) откажут не менее двух приборов.
Решение. Вероятности отказа приборов в испытаниях разные, поэтому используем производную функцию (1), которая в данном случае имеет вид
Раскроем скобки и приведем подобные члены. Тогда получим
Согласно Правилу, отсюда получаем ответы на вопросы примера
Пример №36
Работник обслуживает три станка, которые работают независимо друг от друга. Вероятность того, что в течение часа первый станок не потребует внимания работника, равна 0,9, а для второго и третьего станков — 0,8 и 0,85 соответственно. Какой является вероятность того, что в течение часа
а) ни один станок не потребует внимания работника;
б) все три станка потребуют внимания работника;
в) хотя бы один станок потребует внимания работника?
Решение. Этот пример можно решить с использованием теорем умножения и сложения вероятностей (смотри упражнение 15 Раздела 2). Решим теперь этот пример с использованием производной функции, которая в данном случае принимает вид
Следовательно, коэффициент при равен вероятности того, что в течение час внимания работника не потребуют
станков. Поэтому получим ответы на вопросы этого примера:
а) вероятность того, что все три станка не потребуют внимания работника равна коэффициенту при то есть
Теорема Бернулли
Теорема Бернулли устанавливает связь теории вероятностей с ее практическим использованием. Она была доказана Я. Бернулли в конце а опубликована в 1713 году.
Теорема 4 (Я. Бернулли). Если в независимых испытаниях вероятность
появления события А одинакова и событие А появилась
раз, то для любого положительного числа
имеет место равенство
Согласно определению предела равенство (1) означает, что
— бесконечно малая величина.
Это означает, что событие
практически невозможно. Но тогда противоположное событие
практически достоверно для любого положительного числа
Следствие теоремы Бернулли
Равенство
может отличаться от практически достоверного события
на бесконечно малую величину.
Это значит, что то есть относительная частота (частость)
события А отличается от вероятности
события А на бесконечно малую величину, которую практически можно не учитывать.
Другую формулировку и доказательство теоремы Бернулли смотри в подразделе 4.4.3 Раздела 4.
Замечание. Формулу (1) можно записать, используя интегральную функцию Лапласа в виде
Отсюда получим важную формулу
которая позволяет решать много задач.
Пример №37
Вероятность появления события в каждом из 625 независимых испытаний равна 0,8. Найти вероятность того, что частота появления события отклоняется от вероятности по абсолютной величине не больше чем на 0,04.
Решение. По условию примера Нужно найти
По формуле (2) получим
Из таблицы значений функции Лапласа находим
Следовательно,
Таким образом, искомая вероятность приближенно равна
Пример №38
Вероятность появления события в каждом из независимых испытаний равна 0,5. Найти число испытания при котором с вероятностью 0,7698 модно ожидать, что частота появления события отклоняется от его вероятности по абсолютной величине не больше чем на 0,02.
Решение. По условию задачи
Используем формулу (2). Тогда согласно условию получим
По таблице значений интегральной функции Лапласа найдем
Следовательно, искомая вероятность испытаний
Пример №39
Отдел технического контроля проверяет стандартность 900 изделий. Вероятность того, что изделие стандартное, равна 0,9. Найти с вероятностью 0,9544 границы интервала, который содержит число стандартных изделий среди проверенных.
Решение. По условию
По таблице значений интегральной функции Лапласа находим
Следовательно, с вероятностью 0,9544 отклонение частоты количества стандартных изделий от вероятности 0,9 удовлетворяет неравенство
Из последних соотношений следует, что искомое число стандартных изделий среди 900 проверенных с вероятностью 0,9544 принадлежит интервалу
Простой поток событий
Определение 1. Потоком событий называют последовательность таких событий, которые появляются в случайные моменты времени.
Например, заявление в диспетчерский пункт по вызову такси.
Определение 2. Поток событий называется пуассоновским, если он:
- Стационарный, то есть зависит от количества
появлений событий и времени
и не зависит от момента своего начала.
- Имеет свойство отсутствия последействия, то есть вероятность появления события не зависит от появления или не появления события раньше и влияет на ближайшее будущее.
- Ординарный, то есть вероятностью появления больше одного события за малый промежуток времени является величина бесконечно малая по сравнению с вероятностью появления события один раз в этот промежуток времени.
Определение 3. Среднее число появлений события А в единицу времени называют интенсивностью потока.
Теорема 5. Если поток событий пуассоновский, то вероятность появления события А раз за время
можно найти по формуле
где — интенсивность потока.
Замечание 1. Формулу (1) иногда называют математической моделью простого потока событий.
Пример №40
Среднее количество заказов, которые поступают в комбинат бытового обслуживания каждый час, равно 3. Найти вероятность того, что за два часа поступят
а) 5 заказов;
б) меньше 5 заказов;
в) не меньше 5 заказов.
Решение. Имеем простой поток событий с интенсивностью По формуле (1) получим
Замечание 2. Примерами простого потока могут быть: появление вызовов на АТС, на пункты скорой медицинской помощи, прибытие самолетов в аэропорт или клиентов на предприятие бытового обслуживания, серия отказов элементов или блоков приборов и так далее.
Случайны величины
Случайные величины бывают:
- непрерывные – значения которых непрерывно заполняют какой-либо промежуток (например: давление крови человека, температура его тела или состав крови);
- дискретные – принимающие отдельные друг от друга значения (например: число звонков на станцию скорой помощи в течение часа или количество очков, выпадающих при бросании игрального кубика).
Виды случайных величин и способы их задания
При исследовании многих проблем возникают такие случайные события, исходом которых является появление некоторого числа, заранее неизвестного. Поэтому такие числовые значения — случайные.
Примером такого события является: количество очков, которое выпадает при бросании игрального кубика; количество студентов, которые придут на лекцию; количество сахарной свеклы, которое ожидают получить с одного гектара.
Случайной величиной называют такую величину, которая вследствие испытания может принять только одно числовое значение, заранее неизвестное и обусловленное случайными причинами.
Случайные величины целесообразно обозначать большими буквами
а их возможные значения — соответствующими малыми буквами с индексами. Например,
Случайные величины бывают дискретными и непрерывными.
Определение 1. Дискретной случайной величиной (ДСВ) называют такую величину, которая может принимать отдельные изолированные друг от друга числовые значения (их можно пронумеровать) с соответствующими вероятностями.
Пример:
Количество попаданий в мишень при трех выстрелах будет Следовательно,
может принимать четыре изолированных числовых значения с разными вероятностями. Поэтому
— дискретная случайная величина.
Количество вызовов такси на диспетчерском пункте также будет дискретной случайной величиной, но при
значения
также увеличиваются, то есть их количество стремится к бесконечности
Определение 2. Непрерывной случайной величиной (НСВ) называют величину, которая может принимать любое числовое значение из некоторого конечного или бесконечного интервала Количество возможных значений такой величины является бесконечным.
Пример:
Величина погрешности, которая может быть при измерении расстояния; время безотказной работы прибора; рост человека; размеры детали, которую производит станок-автомат.
Пример:
Рассмотрим случайные величины: количество очков, и
которые могут появится при бросании правильного игрального кубика и неправильного игрального кубика. Их возможные значения
одинаковые.
Вероятность появления любого значения равна
одинакова для всех возможных значений
а вероятности появления возможных значений
будут разными. Следовательно, случайные величины
и
не равны, поэтому при
получим
Таким образом, для полной характеристики случайной величины необходимо указать не только все ее возможные значения, а и закон, по которому находят вероятности каждого значения
или
Определение 3. Законом распределения случайной величины называют такое соотношение, которое устанавливает связь между возможными значениями случайной величины и соответствующими им вероятностями.
В случае дискретной случайной величины функциональную зависимость можно задавать в виде таблицы, аналитически или графически.
В экономических дисциплинах все эти способы задания ДСВ имеют другие названия, поэтому ознакомимся с ними более детально в следующем разделе.
Определение 4. Интегральной функцией распределения (функцией распределения) называют вероятность того, что случайная величина примет значение меньше
Функцию распределения обозначают Таким образом,
Если НСВ может принимать любое значение из
то
Формулу (1) часто называют основной формулой теории вероятностей.
Замечание. Непрерывная случайная величина которая принимает значение в промежутке
имеет бесконечное количество возможных значений, поэтому приобретение
определенных значений
или
будет практически невозможным событием. Это означает, что
и
будут бесконечно малыми величинами, которые в практических расчетах можно не учитывать. Поэтому имеют место равенства
Определение интегральной функции распределения и свойства вероятности позволяют получить такие свойства функции распределения:
График функции распределения может иметь вид, изображенный, например, на рис. 9.
Определение 5. Дифференциальной функцией распределения или плотностью вероятностей непрерывной случайной величины называют производную первого порядка от ее интегральной функции распределения и обозначают
Название «плотность вероятностей» следует из равенства
Из формулы (2) следует, что функция распределения является первоначальной для дифференциальной функции распределения
Теорема 1. Вероятность того, что непрерывная случайная величина примет значение из интервала
можно найти по формуле
Доказательство. Интегральная функция распределения — первоначальная для
поэтому согласно формуле Ньютона-Лейбница получим
Правые части равенств (1) и (4) равные, поэтому и левые их части равные, то есть имеет место равенство (3), которое и требовалось доказать.
Следствие. Если дифференциальная функция распределения (плотность вероятности) известна, то интегральную функцию распределения
можно найти по формуле
Дифференциальная функция распределения НСВ имеет следующие свойства:
График плотности вероятности называют кривой распределения. Он может иметь вид, изображенный, например, на рис. 10.
Пример №41
Случайная величина имеет плотности вероятностей Определить параметр
и функцию распределения.
Решение. Параметр находим, используя свойство 3 дифференциальной функции распределения
Следовательно, получим
Функцию распределения найдем по формуле (5)
Пример №42
Случайная величина задана функцией распределения
Определить область значений случайной величины и вероятность того, что
Решение. Согласно свойствам функции распределения получим
поэтому должны выполняться условия
Если область значений случайной величины и
Подставим в (6) вместо
и
тогда получим
Но в промежутке поэтому
Следовательно областью значений НСВ
будет
Теперь найдем вероятность Событие
будет противоположным, поэтому
Из равенства (6) получаем
Теперь по формуле (7) находим
Законы распределения и числовые характеристики дискретных случайных величин
Законом распределения дискретной случайной величины называют соответствие между полученными на опыте значениями этой величины и их вероятностями.
Способы задания и законы распределения
Пусть случайная дискретная величина принимает значения
с соответствующими вероятностями
Задать закон распределения такой случайной величины — это задать равенство которое можно рассматривать как функцию.
Поэтому закон распределения можно задавать аналитически, в виде таблицы, графически. Функция распределения для дискретной случайной величины имеет вид
Чаще всего используют табличный способ задания ДСВ, который называют рядом распределения и изображают в виде
В первом ряду записаны все возможные значения а во втором ряду — соответственные вероятности, которые имеют свойство
Пример №43
Условиями лотереи предусмотрены: один выигрыш — 100 рублей, два — 50 рублей, восемь — 10 рублей, девятнадцать — 1 рубль. Найти закон распределения суммы выигрыша владельцем одного лотерейного билета, если продано 1000 билетов.
Решение. Будем искать закон распределения суммы выигрыша в виде ряда распределения. Тогда
где
Замечание 1. Если случайная дискретная величина может принимать бесконечное количество значений, то ее ряд распределения (таблица) будет иметь бесконечное количество элементов в каждом ряду, причем ряд должен сходится, а его сумма должна быть равна единице.
Графический способ. Возьмем прямоугольную систему координат. На оси абсцисс будем откладывать возможные значения ДСВ, а на оси ординат — соответствующие значения вероятности. Получим точки с координатами
Соединив эти точки прямыми, получим график (см. рис. 11) в виде многоугольника распределения случайной дискретной величины.
Значение ДСВ, вероятность которой самая большая, называют модой. На рисунке 11 мода —
Аналитический способ задания дискретной случайной величины основан на задании определенной функции, по которой можно найти вероятность соответствующего значения
то есть
Укажем некоторые важнейшие законы распределения ДСВ и задачи, в которых они встречаются.
Биномиальный закон распределения
Этот закон имеет вид
и используется в схеме Бернулли, то есть в случае независимых повторяющихся испытаний, в каждом из которых некоторое событие появляется с вероятностью
Закон распределения Пуассона
ДСВ принимает счетное множество значений
с вероятностями
Это распределение используют в задачах статистического контроля качества, в теории надежности, теории массового обслуживания, для вычисления: количества требований на выплату стразовых сумм за год, количества дефектов одинаковых изделий.
Если в схеме независимых повторяющихся событий достаточно большое, а
или
стремится к нулю, то биномиальное распределение аппроксимирует распределение Пуассона, параметр которого
причем при
или
эта аппроксимация дает хорошие результаты независимо от величины
Замечание 2. Если в формулу Пуассона поставить где
— интенсивность течения случайных событий в единицу времени, то формула примет вид
Геометрическое распределение
Это распределение имеет вид
где — вероятность появления события А в каждом испытании,
— количество испытания до появления события А в серии независимых повторяющихся испытаний.
Ряд вероятностей этого распределения бесконечно убывающей геометрической прогрессией со знаменателем сумма которой равна единице.
Геометрическое распределение используют в разнообразных задачах статистического контроля качества приборов, в теории надежности и в страховых расчетах.
Гипергеометрическое распределение
Это распределение имеет вид
Оно показывает вероятность появления элементов с определенным свойством среди
элементов, взятых из совокупности
элементов, которая содержит
элементов именно с таким свойством.
Это распределение используют во многих задачах статистического контроля качества.
Замечание 3. Если объем выборки маленький по сравнению с объемом
совокупности, то есть
то вероятности в гипергеометрическом распределении будут близки к соответствующим вероятностям биномиального распределения с
В статистике это означает, что расчеты вероятностей для бесповторной выборки будут мало отличаться от расчетов вероятностей для повторной выборки.
Полиномиальное распределение
Это распределение имеет вид
Оно применяется тогда, когда вследствие каждого из проведенных повторяющихся независимых испытаний может появится разных событий
с вероятностью
причем
Числовые характеристики
Законы распределения ДСВ полностью характеризуют случайные величины и позволяют решать все связанные с ними задачи.
Но в практической деятельности не всегда удается получить закон распределения, или закон слишком сложный для практических расчетов. Поэтому появилась необходимость характеризовать ДСВ с помощью числовых характеристик, которые достаточно характеризуют особенности случайных величин.
Чаще всего используют три числовых характеристики: математическое ожидание, дисперсию и среднеквадратическое отклонение от математического ожидания.
Ознакомимся с этими числовыми характеристиками и их свойствами.
Математическое ожидание и его основные свойства
Определение 1. Математическим ожиданием дискретной случайной величины наpsdf.n число, которое равно сумме произведений всех возможных значений
на соответствующие им вероятности.
Математическое ожидание ДСВ обозначают
или
то есть
Если принимает бесконечное количество значений, то
Математическое ожидание ДСВ характеризует среднее значение случайной величины
с учетом вероятностей его возможных значений. В практической деятельности под математическим ожиданием понимают центр распределения случайной величины.
Основные свойства математического ожидания
1. Математическое ожидание постоянной величины равно самой постоянной
2. Постоянный множитель можно выносить за знак математического ожидания
Свойства 1 и 2 следуют непосредственно из Определения 1.
3. Математическое ожидание произведения нескольких взаимно независимых дискретных случайных величин равно произведению их математических ожиданий, то сеть
Доказательство. Если две величины и
распределены по законам
(для упрощения выкладок взято только по 2 возможных значения), тогда закон распределения произведения будет
По формуле (1) получим математическое ожидание
В случае трех случайных величин получим
Методом математической индукции теперь не сложно завершить доказательство.
Аналогично, но немного сложнее, можно доказать следующее свойство.
4. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий, то есть
Пример №44
Независимые случайные величины и
распределены так
Найти математическое ожидание случайной величины
Решение. Сначала найдем математические ожидания каждой их этих величин. По формуле (1) получим
Случайные величины и
независимые, поэтому согласно свойства 3 математического ожидания получим
Пример №45
Найти математическое ожидание суммы числа очков, которые могут появиться при бросании двух игральных кубиков.
Решение. Обозначим количество очков, которые могут появиться на первом кубике а на втором —
Возможные значения этих величин
одинаковые, вероятность каждого из этих значений равна
Поэтому
Согласно свойства 4 математического ожидания, получим
Следовательно, математическое ожидание суммы числа очков, которые могут появиться при бросании двух игральных кубиков равно 7.
Дисперсия и ее свойства
Математическое ожидание характеризует центр распределения дискретной случайной величины. Но этой характеристики недостаточно, так как возможно значительное отклонение возможных значений от центра распределения. Для характеристики рассеивания возможных значений относительно центра распределения введем новую числовую характеристику.
Определение 2. Дисперсией дискретной случайной величины называют число, которое равно математическому ожиданию квадрата отклонения ДСВ
от ее математического ожидания.
Дисперсию величины обозначают
или
Это определение математически выглядит так
Основные свойства
1. Дисперсия любой ДСВ не отрицательная
Действительно не отрицательная, поэтому согласно определению математического ожидания и свойств вероятностей
также не отрицательная.
2. Дисперсия постоянной величины равна нулю
Действительно, если поэтому
3. Постоянный множитель можно выносить за знак дисперсии, при этом постоянный множитель необходимо возвести в квадрат
Действительно,
поэтому
Постоянный множитель можно выносить за знак математического ожидания, поэтому из формулы (2) следует нужное равенство (3).
4. Дисперсия ДСВ равна разности между математическим ожиданием квадрата случайной величины
и квадрата ее математического ожидания
Действительно,
Замечание 4. Формула (2) определяет дисперсию случайной величины а по формуле (4) ее целесообразно находить.
5 Дисперсия алгебраической суммы ДСВ и
равна сумме их дисперсий
Доказательство. Сначала докажем это свойство для Согласно формуле (4) получим
Теперь рассмотрим дисперсию разности и
Замечание 5. Пятое свойство дисперсии имеет место для алгебраической суммы не только двух, а и конечного числа дискретных случайных величин.
Пример №46
Найти дисперсия случайной величины которая задана законом
Решение. Будем искать с использованием формулы (4). Математическим ожидание
согласно формуле (1) будет
Чтобы найти математическое ожидание то есть
запишем закон распределения
в виде таблицы
Отметим, что все значения получены путем возведения в квадрат соответствующих значений
Элементы второго ряда — вероятности этих значений — не изменяются.
По формуле (1) находим
Согласно формуле (4) теперь получаем
Среднеквадратическое отклонение дискретной случайной величины
В большинстве случаев случайная величина имеет размерность, например, метр, миллиметр, грамм, поэтому ее дисперсия
будет измеряться в квадратных единицах этой размерности.
В практической деятельности целесообразно знать величину рассеивания случайной величины в размерности этой величины. Для этого используют среднеквадратическое отклонение, которое равно квадратом у корню из дисперсии и обозначается
Понятия моментов распределения
Определение 3. Начальным моментом -того порядка случайной величины
называют математическое ожидание величины
и обозначают
Центральным моментом -того порядка случайной величины
называют математическое ожидание величины
и обозначают
Отметим, что
поэтому
Начальные и центральные моменты порядка позволяют лучше учитывать влияние на математическое ожидание (центр распределения случайной величины
) тех возможных значений
которые большие и имеют маленькую вероятность.
Пример №47
Дискретная случайная величина задана законом
Математическим ожиданием будет
Законом распределения будет
Поэтому
Следовательно, значительно больше
а это означает, что роль значения
выросла.
Замечание 6. Целесообразно знать числовые характеристики основных законов распределения дискретных случайных величин, которые можно представить в виде следующей таблицы.
Числовые характеристики законов распределения непрерывных случайных величин
Числовые характеристики непрерывных случайных величин:
В случае непрерывных случайных величин (НСВ) математическое ожидание, дисперсия и среднеквадратическое отклонение имеют такой же смысл и свойства, как и для дискретных случайных величин, но вычисляют их по другим формулам.
Пусть возможные значения непрерывной случайной величины заполняют отрезок
Разделим
на
частей длиной
В каждой части возьмем точку
Тогда плотность вероятности в точке
будет
— вероятность того, что
примет значения. Получим распределение НСВ
вида
Сумма
характеризует математическое ожидание тем точнее, чем меньше будет
Эта сумма будет равна математическому ожиданию
непрерывной величины
если перейти к пределу при
Согласно определению определенного интеграла получим
Таким образом доказана
Теорема 2. Если непрерывная случайная величина принимает значение на отрезке и имеет плотность вероятности
то ее математическое ожидание находится по формуле
Аналогично доказывается
Теорема 3. Если является плотностью вероятности
непрерывная случайная величина
является функцией случайной величины
то есть
тогда математическое ожидание
находится по формуле
Замечание 1. Если возможные значения принадлежат отрезку
то центр распределения
величины
находится на этом промежутке, потому что из неравенств
и условия нормирования следуют соотношения
Если плотность вероятности — четная функция, то есть
то центр распределения
совпадает с началом. Если график функции
симметричный относительно прямой
то
Как и в случае дискретных случайных величин, дисперсию непрерывных случайных величин определяют так
а вычисляют по формуле
Если возможные значения принадлежат только конечному промежутку
то равенства (2) и (3) принимают вид
Среднеквадратическое отклонение непрерывной случайной величины определяют и вычисляют так
Пример №48
Найти числовые характеристики случайной величины которая задана функцией распределения
Решение. Сначала найдем дифференциальную функцию распределения, то есть плотность вероятности
Теперь по формуле (1) найдем математическое ожидание
Дисперсию найдем по формуле (4)
Среднеквадратическое отклонение получим по формуле (5)
Законы распределения НСВ и их числовые характеристики
Основные законы распределения непрерывных случайных величин разделяют по виду их дифференциальных функций распределения (плотности вероятностей)
Чаще всего используют следующие законы распределения
Равномерное распределение
Определение 1. Величина распределена равномерно в промежутке
если все ее возможные значения принадлежат этому промежутку и плотность ее вероятностей на этом промежутке постоянная, то есть
Величина постоянной определяется условием нормирования
Если равномерно распределена в промежутке
то вероятность принадлежности
любому интервалу
пропорциональна длине этого интервала
Другими словами, вероятность попадания в интервал
равна отношению длины этого интервала к длине всего промежутка
Этому распределению отвечают, например, погрешности округления разнообразных расчетов.
График равномерного распределения НСВ изображен на рис. 12.
Числовыми характеристиками НСВ которая распределена по равномерному закону, будут
Показательное распределение
Определение 2. Случайную величину называют распределенной по показательному закону, если плотность ее вероятностей имеет вид
где — параметр.
Показательному распределению отвечают: время телефонного разговора, время ремонта техники, время безотказной работы компьютера.
Числовыми характеристиками показательного распределения будут
Следовательно, если НСВ распределена по показательному закону. то она имеет равные математическое ожидание и среднеквадратическое отклонение.
Пример №49
Найти числовые характеристики случайной величины, распределенной по закону
Решение. В данном случае случайная величина распределена по показательному закону с параметром
Согласно формулам (6) получим
Замечание 2. Если случайная величина распределена по показательному закону, то ее функция распределения (интегральная функция распределения) имеет вид
Поэтому основная формула теории вероятностей примет вид
Пример №50
Величина распределена по закону
Найти вероятность того, что попадет в интервал
Решение. Случайная величина распределена по показательному закону с параметром
Используя формулу (7) получим
Соответствующее значение можно взять из таблицы значений этой функции.
Нормальное распределение
Определение 3. Случайную величину называют распределенной нормально, если плотность ее вероятностей имеет вид
где и
— параметры распределения.
График этой функции называют нормальной кривой или кривой Гаусса.
Полное исследование этой функции методами дифференциального исчисления позволяет построить график нормальной кривой, который изображен на рис. 13.
При и
нормальную кривую называют нормированной, ее уравнение будет
То сеть это табулированная функция Лапласа.
Замена переменной использование интеграла Пуассона
и формул (1), (2) и (5) позволяют получить числовые характеристики нормально распределенной НСВ в виде
Следовательно, математическое ожидание нормального распределения равно параметру этого распределения, а среднеквадратическое отклонение равно параметру
Замечание 3. Если случайная величина распределена по нормальному закону с параметрами
и
то случайная величина
будет распределена по нормированному нормальному закону и
Интегральной функцией нормального закона распределения будет
а для нормированного нормального закона
Вероятность попадания в интервал нормально распределенной случайной величины
находят по формуле
где функция Лапласа имеет вид (8).
Пример №51
Случайная величина распределена по нормальному закону, ее математическое ожидание равно 30, а среднеквадратическое отклонение — 10. Найти вероятность того, что
будет иметь значения с интервала
Решение. Согласно условию поэтому по формуле (2) получим
Здесь использованы свойства нечетности интегральной функции Лапласа и значение
из таблицы значений этой функции.
Пример №52
Рост студентов распределен по нормальному закону. Математическое ожидание роста студентов равно 175 см., а среднеквадратическое отклонение — 6 см. Найти вероятность того, что хотя бы один из пяти вызванных студентов будет иметь рост от 170 до 180 см.
Решение. Рост студента — случайная величина, которая по условию задачи распределена нормально с математическим ожиданием
и среднеквадратическим отклонением —
Обозначим события: А— из 5 вызванных студентов рост хотя бы одного принадлежит промежутку ;
— рост всех 5 вызванных студентов не принадлежит промежутку
Величина распределена нормально, поэтому по формуле (9) найдем вероятность того, что рост одного вызванного студента принадлежит промежутку
Используя табличное значение интегральной функции Лапласа, получим
Вероятность того, что рост одного из вызванных студентов не принадлежит промежутку будет
Применяя теорему умножения вероятностей независимых событий, найдем вероятность события
Следовательно, вероятность искомого события А будет
Правило трех сигм
Если случайная величина распределена нормально, то
то есть вероятность того, что абсолютная величина отклонения от ее математического ожидания больше
стремится к 0, а это означает, что
— практически достоверное событие.
На практике это правило используют так:
Если закон распределения случайной величины неизвестен, но
тогда можно допустить, что
распределена нормально.
Распределение (хи-квадрат)
Пусть — нормальные нормированные, независимые величины, то есть их математическое ожидание равно нулю, среднеквадратическое отклонение равно единице и каждая из них распределена по нормальному закону. Тогда сумма квадратов этих величин
распределена по закону с
степенями свободы
Если величины связаны одним линейным соотношением, например,
то число степеней свободы будет
Дифференциальная функция распределения имеет вид
где — гамма-функция,
Отметим, что распределение определяется параметром — числом степеней свободы
Когда
увеличивается, распределение
стремится к нормальному распределению очень медленно.
Распределение Стьюдента
Пусть — нормальная нормированная случайная величина, а
— независимая от
величина, которая распределена по закону хи-квадрат с
степенями свободы. Тогда величина
имеет распределение, которое называют -распределением или распределением Стьюдента (это псевдоним английского статиста Уильяма Госсета) с
степенями свободы.
При увеличении распределение Стьюдента быстро приближается к нормальному распределению.
Закон больших чисел и центральная предельная теорема
Предельные теоремы теории вероятностей устанавливают соответствие между теоретическими и исследовательскими характеристиками случайных величин или случайных событий при большом количестве испытаний. Предельные теоремы описывают также предельные законы распределения. В подразделах 3.2 и 3.4 мы ознакомились с некоторыми предельными теоремами схемы Бернулли.
Предельные теоремы, которые устанавливают соответствие между теоретическими и исследовательскими характеристиками случайных событий, объединяют общим называнием — закон больших чисел.
Закон больших чисел играет важную роль в разных процессах, связанных с массовым производством.
Предельные теоремы, которые устанавливают предельные законы распределения случайных величин, объединяют общим называнием — центральная предельная теорема.
Необходимость предельных теорем обусловлена потребностью решения, например, таких задач:
- Когда сумма многих случайных величин мало отличается от постоянной величины, то сеть почти перестает быть случайной величиной и поэтому ее поведение может прогнозироваться со значительной вероятностью?
- При каких условиях можно со значительной вероятностью прогнозировать число появлений некоторого случайного события при большом количестве независимых испытаний?
- При каких ограничениях сумма многих случайных величин будет распределена по нормальному закону?
Неравенство Чебышева
При доказательстве разных предельных теорем, а также при решении разных задач важную роль играет неравенство Чебышева, которое имеет две формы.
Первая форма неравенства Чебышева
Для произвольной случайной величины которая принимает неотрицательные значения и имеет конечное математическое ожидание
Если — дискретная случайная величина, то
Если — непрерывная случайная величина,
— плотность ее вероятностей, то
Следствие. Если принимает только неотрицательные значения,
Действительно,
Неравенство (1) иногда называют неравенством Маркова.
Вторая форма неравенства Чебышева
Если случайная величина имеет конечное математическое ожидание и дисперсию, то для произвольного
имеет место неравенство
Доказательство. Сначала рассмотрим противоположное событие Легко увидеть, что это событие эквивалентно событию
поэтому к нему можно применить первую форму неравенства Чебышева
Теперь вероятность противоположного события удовлетворяет неравенство (2), что и требовалось доказать.
Пример №53
Дисперсия случайной величины равна 0,001. Какая вероятность того, что случайная величина
отличается от ее математического ожидания
больше, чем на 0,1?
Решение. По неравенству Чебышева (3) получим
Неравенства Чебышева позволяют доказать предельную теорему Бернулли (см. подраздел 3.4) и другие важные предельные теоремы про устойчивость средних.
Важные предельные теоремы
Теорема Бернулли. Пусть вероятность появления события А в каждом из независимых повторяющихся испытаний равна
— число появлений события А (частота события) в
испытаниях. Тогда
Доказательство. Частость можно рассматривать как неотрицательную случайную величину
Найдем ее математическое ожидание
Следовательно, необходимо оценить вероятность отклонения случайной величины от ее математического ожидания. Для этого найдем дисперсию этой случайной величины
По неравенству Чебышева (2) получим
Отсюда предельным переходом при получаем (4), что и требовалось доказать.
Теорема Чебышева. Пусть — последовательность попарно независимых случайных величин, которые удовлетворяют условиям
для всех
Тогда
Доказательство. Найдем математическое ожидание и дисперсию средней случайных величин, то есть
Применим для случайной величины неравенство Чебышева (2)
Предел этой вероятности при равен единице, то есть равенство (5) доказано.
Центральная предельная теорема. Пусть задана последовательность независимых одинаково распределенных случайных величин
Рассмотрим случайную величину Тогда
При функция распределения
то есть сумма будет распределена по нормальному закону с математическим ожиданием 0 и дисперсией
Для доказательства этой теорему нужно найти предел характеристической функции, построенной для нормированной случайной величины
Следствие. При распределение суммы одинаково распределенных случайных величин мало отличается от нормального распределения.
Теорема Ляпунова. Пусть задана последовательность независимых случайных величин таких, что
Построим сумму случайных величин Обозначим
Если выполняется условие равномерной малости величин, которые образуют сумму
то сумма будет распределена нормально с математическим ожидание
и дисперсией
Доказательство этой теоремы достаточно сложное, но отметим, что в случае, когда можно рассматривать случайные величины
Величины
будут удовлетворять условию теоремы Ляпунова.
Пример №54
Сколько приложений нужно взять в теореме Чебышева, чтобы с надежностью 96% и точностью до 0,01 выполнялось приближенное равенство
Решение. В этом примере Чтобы получить надежность 96% согласно формуле (6) достаточно подобрать такое
которое удовлетворяет неравенство
Замечание 1. Пример 2 показывает, что даже в случае не очень больших точности и надежности, нужно брать значительное количество приложений (— достаточно большое число). Это означает, что оценки, полученные с использованием неравенства (6), — завышенные. Более точные оценки можно получить с помощью теоремы Ляпунова.
Закон распределения и числовые характеристики двумерных случайных величин
Выше рассмотрены случайные величины которые при каждом испытании определялись одним возможным числовым значением. Поэтому такую случайную величину
называют одномерной.
Если возможные значения случайной величины определяются в каждом испытании числами, то такие величины называют соответственно, двух, трех,
-мерными соответственно.
Двумерную случайную величину будем обозначать и
при этом будут компонентами. Величины
и
которые рассматриваются одновременно, образуют систему двух случайных величин. Аналогично можно рассматривать систему
случайных величин.
Определение 1. Совокупность одновременно рассматриваемых случайных величин
называют системой случайных величин.
Систему случайных величин
можно рассматривать как случайную точку в
-мерном пространстве с координатами
или как случайный вектор, направленный из начала систему координат в точку
При получим систему двух случайных величин
которую можно изобразить как случайную точку
на плоскости
или как случайный вектор
(см. рис. 14).
Многомерные случайные величины бывают дискретными и непрерывными (компоненты этих величин соответственно будут дискретными и непрерывными).
Закон распределения вероятностей дискретной двумерной случайной величины
Определение 2. Законом распределения дискретной двумерной случайной величины называют перечень возможных значений этой величины и их вероятностей
Чаще всего закон распределения двумерной дискретной случайной величины задают в виде таблицы с двумя входами.
В первом ряду таблицы записывают все возможные значения компоненты В первом столбце таблицы записывают все возможные значения компоненты
На пересечении
-того ряда и
-того столбца записывают вероятность
того, что двумерная случайная величина
принимает значения
События образуют полную группу, поэтому сумма вероятностей таблицы равна единице, то есть
Закон распределения двумерной случайной величины позволяет получить законы распределения каждой компоненты.
Действительно, события несовместны, поэтому вероятность
того, что
примет значения
по теореме сложения вероятностей будет
то есть равен сумме вероятностей, которые расположены в -том столбце таблицы распределения.
Аналогично, сложением вероятностей -того ряда таблицы, получим вероятность
Пример №55
Найти законы распределения компонент двумерной случайной величины, закон распределения которой задан таблицей
Решение. Законы распределения и
будут иметь вид
Вероятности соответствующих значений и
находим так
Определение 3. Интегральной функцией функцией распределения (функцией распределения) двумерной случайной величины называют функцию двух переменных
которая определяет для каждой пары чисел
вероятность выполнения неравенств
то есть
Аналогично определяют функцию распределения системы случайных величин
Свойства вероятности и Определение 3 функции распределения позволяют доказать такие свойства функции распределения, которые в случае двумерной случайной величины выглядят
не убывающая функция по каждому аргументу, то есть
если
если
3) Имеют место предельные соотношения
4) Вероятность попадания случайной точки в прямоугольник
можно найти по формуле
Геометрический смысл функции распределения — это вероятность того, что случайная точка
попадет в бесконечный прямоугольник с вершиной в точке
и размещенный ниже и левее этой вершины (см. рис. 15).
Пример №56
Найти вероятность попадания случайной точки в прямоугольник, ограниченный линиями
если задана функция распределения вида
Решение. В заданном случае
Согласно формуле (1) получим
Непрерывная двумерная случайная величина
Двумерную случайную величину можно задавать функцией распределения или дифференциальной функцией распределения.
Определение 4. Дифференциальной функцией распределения (двумерной плотностью вероятностей) двумерной случайной величины
называют смешанную частную производную второго порядка от интегральной функции распределения
Аналогично определяют плотность вероятностей -мерной случайной величины, то есть
Таким образом, если функция распределения двумерной случайной величины известна, то по формуле (2) можно найти дифференциальную функцию распределения
этой случайной величины.
Если известна плотность вероятностей двумерной случайной величины, то ее функцию распределения находят по формуле
то сеть с использованием несобственного двукратного интеграла.
Вероятность попадания случайной точки в произвольную область
находят по формуле
Дифференциальная функция распределения удовлетворяет свойствам:
то есть она не отрицательная;
Зависимые и независимые случайные величины
Две случайные величины независимы, если закон распределения одной из них не зависит от того, какие значения приняла другая величина.
Случайные величины зависимы, если закон распределения одной величины зависит от того, какие значения приняла другая величина.
В теории вероятностей доказано такое утверждение.
Теорема. Чтобы случайные величины и
были независимыми, необходимо и достаточно, чтобы интегральная функция системы
была равна произведению интегральных функций каждой из них
Следствие. Чтобы непрерывные случайные величины и
были независимыми, необходимо и достаточно, чтобы дифференциальная функция системы
была равна произведению дифференциальных функций составляющих
Числовые характеристики двумерной случайной величины
Математическое ожидание двумерной случайной величины характеризует координаты центра распределения случайной величины. Эти координаты в случае непрерывных величин находят по формулам
Дисперсии и
характеризуют рассеивание случайной точки
вдоль координатных осей
и
соответственно, их находят по формулам
Для описания двумерной случайной величины кроме математического ожидания, дисперсии и среднеквадратичных отклонений используют также другие характеристики, а именно корреляционный момент (или ковариация)
Для непрерывных величин и
Коэффициент корреляции
Коэффициент корреляции является количественной характеристикой зависимости случайных величин и
и часто используется в статистике.
Если случайные величины и
дискретные, то в формулах (3)-(6) знаки интервалов заменяют знаками суммы по всем возможным значениям случайных величин.
Определение 5. Случайные величины и
называют некоррелированными, если их корреляционный момент или коэффициент корреляции равен нулю.
Свойства коэффициента корреляции
Замечание. Если момент корреляции или коэффициент корреляции не равен нулю, тогда случайные величины и
— коррелированные. Две коррелированные величины обязательно зависимы. Но две зависимые случайные величины могут быть коррелированными или некоррелированными, то есть их коэффициент корреляции может быть равен нулю, а может быть и не равен нулю.
Из независимости двух величин следует их некоррелированность, но из некоррелированности еще не следует независимость этих величин. В случае нормального распределения величин из некоррелированности случайных величин следует их независимость.
Функции случайной величины и их характеристики
Понятие функции:
Во многих случаях нужно рассматривать две случайные величины и
Так, например, при анализе деятельности предприятия нужно учитывать количество всех работников
и количество всех произведенных изделий
По разным причинам количество работников и произведенных изделий каждый день может быть разным, то есть
и
будут случайными величинами.
Определение 2. Если указан закон, по которому каждому возможному значению случайной величины отвечает определенное значение случайной величины
то
называют функцией
и обозначают
Отметим, что иногда разным возможным значениям случайной величины отвечают одинаковые значения
Например, если
то значениям -3 и 3 случайной величины
отвечает одно значение случайной величины
Одной из возможных задач теории вероятностей является определение законов распределения и числовых характеристик функций случайного аргумента, закон распределения которого известен. Укажем основные формулы для решения этой задачи.
Закон распределения и числовые характеристики функции дискретного случайного аргумента
Пусть — дискретная случайная величина с возможными значениями
вероятности которых равны
соответственно, то есть
задана законом
В этом случае также дискретная случайная величина с возможными значениями
Из события «величина приняла значение
» следует событие «величина
приняла значение
«, поэтому вероятности возможных значений
также будут иметь вид
Математическое ожидание, дисперсию и среднеквадратическое отклонение функции вычисляют по формулам
Начальные и центральные моменты распределения находят по формулам
Пример №57
Дискретная случайная величина задана законом распределения
Найти математическое ожидание функции
Решение. Возможными значениями будут
По формуле (1) находим математическое ожидание
Закон распределения и числовые характеристики функции непрерывного случайного аргумента
Пусть — непрерывная случайная величина, закон распределения которой задан дифференциальной функцией распределения (плотность вероятностей)
случайная величина
Если — дифференцированная функция, монотонная на всем промежутке возможных значений
то плотность распределения функции
определяют так
где — функция, обратная по отношению к функции
— производная первого порядка.
Если — не монотонная функция в области определения аргумента
то обратная функция неоднозначна и плотность распределения
определяется как сумма приложений, количество которых равно количеству значений обратной функции, то есть
где — обратные функции при заданном
Пример №58
Случайная величина распределена по нормальному закону с математическим ожиданием, равным нулю. Найти закон распределения функции
Решение. Согласно определению нормального распределения непрерывной случайной величины и условия примера дифференциальная функция распределения
имеет вид
Функция — дифференцирована,
поэтому она возрастает для всех
Следовательно, можно применить формулу (2) для нахождения дифференциальной функции распределения
случайной величины
В данном случае из равенства
то есть
Поэтому формула (2) принимает вид
Для нахождения математического ожидания от можно сначала найти
— дифференциальную функцию распределения величины
по формуле (2) или (3), а потом использовать формулу
Но более целесообразно находить математическое ожидание функции непрерывного случайного аргумента непосредственно по формуле
где — плотность вероятностей величины
Если величина может принимать значения только в промежутке
то формула (4) упрощается
Пример №59
Непрерывная случайная величина задана дифференциальной функцией распределения
Найти математическое ожидание функции
Решение. В данном случае поэтому по формуле (5) получим
Интегрируя частями два раза, получим необходимое математическое ожидание
Следовательно, получили
Дисперсия функции непрерывного случайного аргумента
определяют обычным образом
а вычисляют по формуле
В случае, когда меняется только в промежутке
дисперсию функции
находят по формуле
В формулах (6) и (7) — это плотность вероятностей непрерывной случайной величины
(дифференциальная функция распределения
)
Основные понятия о статистическом распределение
Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительныхчастот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (суммы частот, попавших в этот интервал значений).
Желание и внимательность всегда помогают начать изучение любой науки.
Предмет математической статистики и короткая историческая справка:
Цель каждого научного исследования — выявление закономерности явлений, которые наблюдают, и использование этих закономерностей в повседневной практической деятельности. Для установления этих закономерностей проводят специальные опыты и наблюдают единичные случаи. Далее делают обобщенный вывод в виде закона.
В тех случаях, когда явление находится под воздействием многих факторов и невозможно выявить влияние всех этик факторов, используют другой метод изучения — статистический, то есть систематизация и обработка статистических данных однородных опытов.
Обычно систематический метод изучения используют в экономике, социологии и политологии.
Пусть, например, темп роста промышленного производства за первый период времени равен 5%. Это означает, что в среднем для всей совокупности предприятий показатель 5% является статистической закономерностью роста промышленного производства. Этот средний показатель не исключает, а, наоборот, допускает, что на отдельных предприятиях темп прироста может быть больше или меньше 5%.
Предмет математической статистики заключается в разработке методов сбора и обработки статистических данных для получения научных и практичных выводов.
Укажем основные задачи, которые решает математическая статистика:
- указать способы сбора и группировки (если данных слишком много) статистических сведений;
- определим закон распределения случайной величины или системы случайных величин по симметрическим данным;
- определить неизвестные параметры распределения;
- проверить правдоподобность предположений про закон распределения случайной величины, про форму связи между случайными величинами или про определения параметра, который оценивают.
Можно сказать, что основная задача математической статистики — разработка методов анализа статистических данных в зависимости от цели исследования.
Методы математической статистики эффективно использовать для решения многих задач науки, организации технологического процесса, планирования, управления и ценообразования.
Математическая статистика возникла ( в.) и начала развиваться параллельно с теорией вероятностей. Дальнейшим развитием (конец
— начало
в.) математическая статистика обязана П.Л. Чебишову, А.А. Маркову, О.М. Ляпунову, а так же К. Гауссу, Ф. Гальтону, К. Пирсону и другим.
В в. наибольший вклад в математическую статистику внесли В.И. Романовский, Е.Е. Слуцкий, А.Н. Ляпунов, Стьюдент (псевдоним У. Госсета), Е. Пирсон, Ю. Нейман, А. Вальд, А.В. Скороход, В.С. Королюк и другие ученые.
Генеральная и выборочная совокупности
Пусть нужно изучить совокупность объектов относительно некоторого качественного или количественного значения, которые характеризуют эти объекты. Любой объект, который наблюдают, имеет несколько признаков. Рассматривая только один признак каждого объекта, мы допускаем, что другие признаки равноправные, или что множество объектов однородно.
Такие множества однородных объектов называют статистической совокупностью.
Например, если исследуют партию деталей, то качественным признаком может быть стандартность или нестандартность каждой детали, а количественным признаком — размер детали. Количественные признаки бывают прерывными и дискретными.
Проверку совокупности деталей можно совершить двумя способами:
- выполнить проверку (контроль) всех деталей;
- проверить только первую часть деталей.
Если деталей слишком много или проверка связана с разрушением детали (например, испытание детали на прочность), тогда первый способ проверки нецелесообразен. Если исследовать все детали невозможно,тогда выбирают из всей совокупности ограниченное количество деталей и проверяют только их.
Выборочной совокупностью (выборкой) называют совокупность случайно выбранных объектов.
Генеральной называют совокупность объектов, из которых сделана выборка.
Объемом совокупности ( выборки или генеральной) называют количество объектов этой совокупности.
Например, если из 5000 изделий для исследования взяты 50, тогда объем генеральной совокупности а объем выборки
Приведем примеры выборок.
Первичным результатом статистического наблюдения является перечень членов совокупности и соответственных им значений.
Пример №60
Наблюдают величину урожая пшеницы на 10 исследовательских участках. Результаты наблюдения представлены в таблице 1 (признак — номер участка, признак
— урожай в центнерах в га)
Таблица 1.
Такие сведения называют рядом вариант или простым статистическим рядом.
Выборки бывают повторные или бесповторные. Повторной называют выборку, при которой выбранный объект возвращается к генеральной совокупности перед выбором другого объекта. Выборку называют бесповторной, если выбранный объект к генеральной совокупности не возвращаются. Чаще используют бесповторные выборки.
Альтернативой выборки является перепись. Переписью называют обследования, у которых цель исследования — изучение каждого элемента совокупности (генеральной совокупности).
Образцами переписи являются перепись населения в стране, отчет о всех производственных показателей всех предприятий в одной отрасли (например, шахт угольной промышленности).
Преимущества изучения выборки по сравнению с переписью: малые затраты, оборудования и времени.
Выборку можно эффективно использовать для изучения общего признака генеральной совокупности только тогда, когда данные выборки верно отображают этот признак. Вкратце это условие формируется таким образом — выборка должна быть репрезентативной, то есть представительской.
Согласно с законом больших чисел теории вероятностей можно утверждать, что выборка будет репрезентативной только тогда, когда ее осуществляют случайно.
В большинстве случаев для математической статистики наиболее подходящим способом использования случайного выбора является простой случайный.
Определение 1. Простым случайным является такой отбор из генеральной совокупности, при котором каждый объект, что выбирается, имеет одинаковую вероятность попасть в выборку.
Выборка, которая сделана с помощью простого случайного отбора, называется простой случайной. Способы выполнения простого случайного отбора рассмотрены в параграфе 5.5.
Важно отметить, что альтернативой для простой случайной выборки в статистике является расслоенная случайная выборка.
Способы выполнения рассмотрены в параграфе 5.4.
Источники данных в статистике
Исследователи и менеджеры получают данные, необходимые для принятия решения в основном из трех источников:
Выборочные обследования, специально поставленные эксперименты и действия, являющиеся результатом повседневной работы в бизнесе.
Рассмотрим примеры использования вышеупомянутых источников.
При случайном обследовании способа выбора данных выборка могут быть индивидуальные опросы (интервью), опросы по почте, телефонные интервью и так далее. Способы организации выборки описаны в параграфе 5.4. Приведем пример выборки.
Пример: Издательство газеты выбирает 1000 потенциальных избирателей для опроса с целью изучения рейтинга первого кандидата на выборах.
На специально спланированном эксперименте у исследователя есть возможность, в определенных рамках, управления процессом. Приведем пример планирования эксперимента и использования его как источника в статистике.
Пример: В одной из японских фирм разработали следующий бланк для оценки по бальной системе способностей руководителя (см. таблицу 2).
Собрав данные про каждом руководящем сотруднику в виде таблицы 2 согласно тестированию, руководитель фирмы может использовать эти данные для объективной оценки работы руководящего состава, для оценки влияния реформы системы управления внедряемое фирмой, на прибыль и так далее.
Часто источником являются данные, что собираются в повседневной, рутинной работы и бизнесе. Приведем примеры.
Пример: Руководитель магазина, анализируя данные уровня продажи «Вид товара — сезон года», можно более оптимально планировать свою работу для получения большей прибыли за счет увеличения объема продаж ходовых видов товаров, уменьшения расходов, которые тратятся на излишки запаса товаров на складе магазина и так далее.
Вторым примеров источников такого рода данных являются разнообразные официальные источники статистических данных.
Пример:
Книга: Народное государство Украины в 1994 году. Статистический ежегодник Украины: ответственный за выпуск В.В. Самченко — Изд.: Техника 1994, 494 ст.
Оценка способностей руководителя.
1. Потенциал (возможность совершенствовать способности и результаты работы) | Гибкость мышления, активность, наличие потенциала внутреннего роста. Постоянное стремление к совершенствованию, не останавливается при достигнутом, Желание принять на себя более высокую ответственность | 3-15 |
2. Лидерство, мотивация подчиненных | Хороший контакт с подчиненными | 5-25 |
3. Результативность работы, прогноз на следующий год | Отношение к планам на продажу, прибыли | 4-20 |
4. Умение вести переговоры и взаимодействовать с партнерами | Умение хорошо говорить и слушать. Стремление понять других. Спокойная манера речи, выдержка. Способность к взаимодействию с партнерами | 3-15 |
5. Креативность (способность к творчеству в будущем). | Постоянное стремление к решению сложных проблем. Творческий подход к решению проблем | 2-10 |
Знания и осведомленность | Обеспечение необходимой информацией. Умение работать по плану, вовремя реагируя на изменения. Умение оценивать и прогнозировать ситуацию | 3-15 |
Всего | 20 -100 |
Источники данных бывают первичными и вторичными.
Первичные данные собираются специально для статистического исследования. Для этих данных есть сведения про методы сборки, точность данных и так далее.
Вторичными данными являются данные, что используются в статистике, но изначально собирались для других целей.
Очевидно, что рутинные записи про деятельность фирм, официальные статистические отчеты являются вторичными данными.
Безусловно, более ценными данными в статистике являются первичные данные, но их не всегда возможно получить, потому часто используются вторичные данные.
Способы отбора
У практичной деятельности используют разнообразные способы отбора объектов из генеральной совокупности. Все способы отбора можно поделить на два вида:
1. Выбор, который не требует разделения генеральной совокупности на части. Для этого вида отбора относят:
- — простой случайный бесповторный отбор;
- — простой случайный повторный отбор.
2. Отбор, при котором генеральная совокупность разделяется на части ( расслоенный случайный отбор). Для этого вида отбора относят:
- — типовой отбор;
- — механический отбор;
- — серийный отбор.
Типовым называют отбор, при котором объекты выбирают не из всей генеральной совокупности, а только из ее типовых частей. Например, если изделия изготовлены на разных станках, то отбор проводят только из изделий каждого станка по-отдельности.
Типовой отбор целесообразно использовать тогда, когда одинаковые изделия изготавливают на станках, среди которых есть большие или меньшие изделия, или в случае изготовления одинаковых, сделанных разными предприятиями.
Механическим называют отбор, при котором генеральная совокупность механично разделяется на столько частей, сколько может быть объектов в выборке. В каждой части случайным образом выбирают один объект. Например, если нужно проверить 25% всех изготовленных станком — автоматом изделий, то выбирают каждое четвертое изделие. Чтобы механический отбор был репрезентативным, нужно учитывать специфику технологического процесса.
Серийным называют отбор, при котором объекты из генеральной совокупности отбирают не по одному, а сериями, которые и исследуются. Серийный отбор используют тогда, когда признак, который исследуют, мало изменяется в разных сериях.
В экономических исследованиях иногда используют комбинированный отбор. Например, сначала используют генеральную совокупность на серии с одинаковым объемом, случайным образом отбирают несколько серий и, в конце, из каждой серии случайным образом отбирают отдельные объекты.
Простая случайная выборка
В этом разделе детально рассматривается попытка построения простой случайной выборки с помощью таблицы случайных чисел. Решение этой задачи с помощью электронной таблицы Excel 97 рассмотрено в параграфе 8.2 раздела 8.
Условия осуществления простой случайной выборки
Для осуществления простой случайной выборки необходима наличие основы выборки, то есть такого представления генеральной совокупности, при котором ее элементы были хотя бы перечислены. Приведем примеры основ выборки.
Пример:
а) Генеральная совокупность — все покупатели магазина. Основой выборки могут быть рабочие списки покупателей, что вел магазин.
б) Генеральная совокупность — все жители города, которые имеют телефон. Основой выборки может быть справочная телефонная книга.
Как правило, данные для образования случайной выборки представляются в виде некоторой таблицы и потому основой выборки является нумерация элементов этой таблицы.
Основа выборки должна полностью отражать признаки генеральной совокупности, что изучается. Нарушение этого условия может сделать выборку не репрезентативной. Объясним это на примере.
Пример:
Нужно проверить все молодые семьи небольшого города на предмет наличия и количества детей дошкольного возраста.
С этой целью, специальный работник отдела. что занимается данным вопросом, случайным образом с помощью телефонного справочника обзванивает семьи с 18:00 до 21:00 каждый день.
Будет ли выборка данных, полученная таким образом, репрезентативной?
Основой выборки в этом случае является телефонный справочник. Простая случайная выборка, что сложенная из этой основы, не будет репрезентативной по целому ряду причин: не все семьи города, что исследуются, имеют телефон, некоторые семьи в этот период не будут находиться дома, или члены этих семей не смогут подойти к телефону, некоторые семьи пользуются телефонами, номера которых не записаны в телефонный справочник и так далее.
Приведем примеры, где может быть использована простая случайная выборка.
Пример:
а) Телефонная компания проверяет счета 10% всех международных телефонных переговоров с целью выявления средней их величины.
б) Аудиторская проверка накладных 20% фирм региона с целью контроля правильности уплаты налогов.
Случайные выборочные числа
Общеизвестно, что кратчайшим способом осуществления простой выборки является использование выборочных чисел.
Эти числа складываются из цифр от 0 до 9, генерируются случайным образом (как правило, с помощью компьютера) и записываются в специальной таблице.
Выражение «генерируется случайным образом» отбивает тот факт, что шанс появления любой цифры в любом месте таблицы не больше и не меньше шанса появления любой другой цифры из десяти названных цифр.
В приложении 4 приведена типовая таблица случайных чисел (таблица что сгруппированы; для удобства при чтении, в блоке по пять цифр.
Использование таблиц случайных чисел гарантирует, что не будет сделана систематическая ошибка (то есть ошибка, что делает данные не репрезентативными).
В следующем подразделе подробно рассмотрена попытка использования таблицы случайных чисел для осуществления, простые случайные выборки.
Осуществление простой случайной выборки и использованием случайных чисел
Опишем процедуру получения простой случайной выборки на следующем примере.
Пример:
В таблице А приведен результат тестирования 180 специальных работников фирмы по первому методу с целью принятия решения про очередное повышение зарплаты. В ней перечислены 180 двузначных цифр — число баллов, что собрал каждый, кто исследовался. Необходимо выполнить простую случайную выборку по таблице А.
Построение простой случайной выборки выполняется в такой последовательности.
- Генеральная совокупность — данные таблицы А. Основы выборки — нумерация элементов таблицы. Объем генеральной совокупности
- Зададим числом
элементов простой случайной выборки, например,
- Для обеспечения случайного выбора используем таблицей 8 приложения 4. Выберем в ней любой ряд или столбец, например, начнем с шестого ряда. Представим тут его часть
Числа баллов, набранных при тестировании 180 сотрудников фирмы мы будем выбирать из этого ряда числа, что образованы тремя цифрами, поскольку нумерация элементов таблицы А не превышает число 180.
Таблица А
По этому принципу удобнее в ряд (1) переписать по три цифры в группе
4. Выбираем из ряда (2) только те числа, что входят в основу выборки, то есть все числа больше 180 игнорируются. (В ряду (2) существует четыре таких числа — они подчеркнуты).
Отобрав таким способом 10 случайных чисел, мы составим простую случайную выборку, приведенную в таблице 3.
Простая случайная выборка объема что получена из таблицы А результатов тестирования
таблица 3
В этой таблице каждому случайному числу (первый столбец) ставиться в соответствие число баллов (третий столбец) соответственно таблицы А. Для удобства использования все элементы простой случайной выборки пронумерованы (второй столбец).
Организация данных: статистическое распределение выборки
Упорядочивание данных:
Данные в статистике, полученные с помощью специальных исследований или из обычных (рутинных) записей в бизнесе, приходят к исследователю или менеджеру в виде неорганизованной массы, независимо от того, являются ли они выборочными данными, или данными генеральной совокупности.
В математической статистике вместо слова «данные» вводится термин «варианты«. Числовую характеристику вариантов при этом называют признаками.
Пусть из генеральной совокупности взята выборка объектов объема
для вычисления признака
То есть значения
являются вариантами признака
Первым шагом обработки является упорядочение вариант. Рассмотрим этот процесс на примере.
Пример №61
В таблице В приведена выборка среднемесячной оплаты 100 сотрудников фирмы Нужно упорядочить выборку.
Таблица В.
В нашем примере признаков является число, что выражает среднемесячную зарплату сотрудников фирмы Следовательно, в таблице В приведено 100 значений вариант.
Разместим данные Таблицы Б в порядке возрастания (см. таблицу В.1).
Упорядоченная выборка среднемесячной оплаты 100 сотрудников фирмы ( в порядке возрастание)
Таблица В.1
Варианты, что записаны в таблице по возрастанию (убыванию), называют вариационным рядом. То есть, таблица В.1 с вариационным рядом, что насчитывает 100 вариант.
После упорядочения можно получить больше информации, например, что границы изменения среднемесячной оплаты.
Распределение частот
Пусть в нашей выборке из вариант
признака
принял значение
раз, значение
раз,
значение
раз.
Положительное число, что показывает, сколько раз та или иная варианта встречается в таблице данных, называется частотой.
Рядназывается рядом частот. Отметим, что сумма всех частот должно равняться объему выборки
Статистическое разделение выборки устанавливает связь между рядом вариант, что возрастает или убывает и соответственными частотами. Он может быть представлен таблицей
где — объем выборки,
Статистическое разделение выборки, заданный этой таблицей, также называют простым или не группированным статистическим распределением или распределением частоты варианты ( рядом распределения частоты варианты
).
Пример №62
Для изучения потребностей в определенных размерах обуви, проданного на протяжении дня:
Статистическое разделение этой выборки (разделение частоты размера обуви) будет иметь такой вид
Контроль:
Замечание. Свойство элементов ряда частот (смотреть формулу (1)) используют для контроля полученного статистического раздела выборки.
Приведем дальше доскональную выборку, что фигурирует в примере 1 (таблица В.1), преобразив ее в раздел частот среднемесячной оплаты сотрудников фирмы (таблица В.2)
Разделение частоты среднемесячной оплаты сотрудников фирмы
Всего: 100.
Таблица В.2
Следующий шаг в обработки данных, что приводит к существенному упрощению исследования, является их группировка.
Как видно в таблице В.2 максимальным и минимальным значениями варианты будут
Разницей этих чисел
называется размахом вариант. В нашем случае Введем для варианты интервалы изменения оплаты
Каждый интервал называется классом интервалов или классом. всего получим классов оплаты.
Используя данные таблицы В.2, просчитаем частоты для каждого класса интервалов (1), причем значение что находится на границе классов, заносим к тому классу, что является следующим к классу, где это число встречается впервые встречались впервые. Результат выпишем в виде таблицы В.3.
Сгруппированное разделение частоты среднемесячной оплаты сотрудников фирмы
Таблица вида В.3, которая устанавливает связь между сгруппированным рядом вариант, что возрастает или убывает, и суммами их частот по классам, называется сгруппированным разделом частоты варианты
Для каждого класса получаем верхнюю и нижнюю границы
шириной класса — число единиц измерения,то есть разница
Введены величины — размах вариант,
— число классов,
— ширина класса, из этого следует
Приведем другой пример сгруппированного разделения частоты выборки.
Использовали данные таблицы 1.
Сгруппированное распределение накопленной частоты
Часто, наряду с распределением частоты варианты необходимо иметь разделение накопленной (кумулятивной) частоты. Распределение накопленной частоты получают последовательным добавлением частот очередного интервала, начиная с первого и заканчивая последним (см. таблицу В.4).
Распределение накопленной частоты (обозначается F) позволяет ответить на вопрос: “сколько существует вариантов, которые меньше чем, например, 350?” Из таблицы В.4 находим: таких вариантов 87, что можно записать так:
Сгруппированное разделение накопленной частоты среднемесячной оплаты сотрудников фирмы
Таблица В.4
Распределение относительной частоты выборки
Нередко вместо значений частот используют относительные частоты. Пусть существует частот
Отношение частоты варианты
к объему выборки
называется относительной частотой или частотностью, причем сумма всех относительных частот
Зависимость между упорядоченным рядом вариант и соответствующим им относительными частотами также называют статистическим распределением выборки, то есть получим табличное представление распределения.
где — объем выборки и
Пример №63
Задано разделение частоты выборки
Найти распределение частот.
Решение. Объем выборки Частотами будут
Поэтому распределение частот этой выборки будет
Замечание. Свойство элементов ряда частот (смотреть формулу (2)) используют для контроля полученного статистического распределения выборки.
Проведем дальше организацию выборки, что задана таблицей В.
Рассмотрим таблицу В.4. Если поделить частоты (второй столбик) и накопленной частоты (четвертый столбик) на объем выборки то получим соответственно распределение относительной частоты
и накопительной относительной частотой
выборки (смотреть таблицу В.5).
Сгруппированное разделение накопленной частоты среднемесячной оплаты сотрудников фирмы
Таблица В.5
Распределение накопленной относительной частоты получается последовательным складыванием относительных частот дежурного интервала, начиная с первого и заканчивая последним.
Распределение накопленной относительной частоты позволяет ответить на вопрос: «Какая пропорция вариант, что меньше чем, например, 350?».
Из таблицы В.5 находим: пропорция этих вариант будет 0,88 то есть это доля среднемесячной оплаты, что меньше 350.
Ряды распределения частоты с переменной шириной классов интервалов
Иногда невозможно, или неудобно выбирать ширину классов интервалов одинаковой. Неровная ширина классов желательна, например, если значения частоты одного или нескольких классов намного больше (меньше) значений частоты других интервалов. Как правило, ширина интервалов возрастает (или убывает) и может содержать интервалы открытого типа «более чем…», «менее чем…».
Например распределение частоты из возрастающей шириной интервалов приведенный в таблице 4.
распределение частоты возраста 30 сотрудников фирмы
Таблица 4.
Сгруппированное разделение плотности частоты и плотности относительной частоты
Если поделить все частоты (второй столбик) таблицы В.3 на ширину интервала то получим распределение плотности частоты выборки
Если поделить все относительные частоты (второй столбик) таблицы В.5 на ширину интервала то получим распределение относительной плотности частоты выборки
Чтобы вычислить результаты, которые получены в примере 1, приведем сразу в одной таблице В.6 рассмотренные выше таблицы В.4 и В.5 и основу введенного распределения.
Сгруппированное распределение частоты относительной частоты
плотности частоты
плотности относительной частоты
накопительной частоты
и накопительной относительной частоты
выборки среднемесячной оплаты 100 сотрудников фирмы
Таблица В.6
Эта таблица знакомит со всеми важными статистическими распределениями выборки.
Распределение частоты и относительной частоты будут использовать в построении полигонов частот и гистограмм (смотреть параграф 5.8).
Распределение накопительной частоты и накопительной относительной частоты будут использованы в построении полигонов накопительных частот и эмпиричной функции распределения (смотреть параграф 5.8).
Приведенные понятия распределения плотности частоты и распределения плоскости относительной частоты выборки имеют глубокое вероятное содержание и будут также использованы в графическом представлении распределений (смотреть пункт 5.8.3 параграфа 5.8).
Общая схема построения сгруппированного распределения частоты
Изложенный алгоритм группировки данных выборки можно предоставить в виде следующей общей схемы последовательности действий:
- Обозначить наибольшее
и наименьшее
значения варианты
и обозначить размах вариант
- Зададим первым числом классов
Число классов
следует принимать непарным, и при общем числе замеров
целесообразно брать
а при
можно брать
- Обозначить ширина класса
Для упрощения расчетов, полученное значение
округлили в любую сторону.
- Вставить границы классов и рассчитать количество вариант
каждого класса. При расчете числа вариант значения
что находится на границе классов, следует относить к одному и тому же классу, например, к тому классу, что является к следующему классу, где это число встречалось ранее. Оно, таким образом, станет нижней границей класса.
- Обозначить частоту для каждого класса и записать ряд распределения.
Эмпирическая функция распределения и ее свойств
Пусть есть статистическое распределение частоты некоторого признака Обозначим через
общее количество наблюдений, при которых объем выборки;
— количество наблюдений; при которых наблюдались признаки
меньше
Тогда относительная частота (или частность) события равна
Если изменяется, то может изменятся относительная частота, то есть
является функция от
Эта функция находиться эмпирическим путем, потому ее называют эмпиричной.
Определение 1. Эмпиричной функцией распределения (или функцией распределения выборки) называют функцию которая обозначает для каждого значения
частотность действия
Математически это определение имеет вид
где — количество вариант, которые меньше от
— объем выборки.
Таким образом, чтобы найти, например, нужно количество вариант, что меньше
поделить на объем выборки, то есть
Замечание. Интегральную функцию распределения генеральной совокупности в математической статистике называют теоретической функцией распределения. Она отличается от эмпиричной функции распределения
тем, что означает вероятность события
а не частность этого события.
Из теоремы Бернулли выходит, что частность
события
направляется к вероятности этого события. Потому
и
мало отличаются одна от другой.
Целесообразно использовать для ближайшего представления функции распределения
генеральной совокупности.
Эмпирическая функция распределения имеет такие свойства:
Пример №64
Найти эмпиричную функцию распределения с статистическом распределением выборки
Таблица 5
и построить ее график.
Решение. Объем этой выборки будет Наименьшая варианта равна 2, потому
для
Наибольшая варианта равна 10, потому
для
Значение
то есть
наблюдались 12 разов, потому
при
Значение то есть
и
наблюдались
раз, потому
при
То есть, простой статистическое распределение частоты, что заданны таблицей 5, заменяется сгруппированным распределением частоты (смотреть таблицу 6).
Таблица 6
Тут же построить распределение накопительной частоты. Таким образом, получим эмпиричную функцию распределения вида
График этой функции изображено на рис. 18.
Рисунок 18.
Этот график можно рассмотреть как и приближенный график теоретической функции распределения
Установим связь между эмпиричной функцией распределения и функцией накопительных частот
как следует из определения 1, примера 1 и таблицы 6 эмпиричная функция распределения
обозначается как кусочно — заданная функция, равна значению накопительной относительной частоты
на каждом классе интервалов
Графическое изображение статистических распределений
Все статистические распределения, что изучались в параграфе 5.6, могут быть представлены графически. Благодаря этому мы можем посмотреть характерные переменные ряда распределения, не пользуясь анализом цифровых данных.
Графическое изображение статистических распределений нужно рассмотреть отдельно для не сгруппированных и сгруппированных данных.
Не сгруппированные данные: полигоны частот и частностей, гистограмма
Если в результате выборки мы получили статистическое распределение признака которые нужно исследовать, то будем иметь перечень вариант признака
и соответственных им частот
или частностей
Значение вариант и частот или частностей можно рассмотреть как координаты точек или
Определение 1. Полигоном частот называют ломанную, отрезки которой объединяют точки
Полигоном относительной частоты (частностей) называют ломанную, отрезки которой проходят через точки
Полигоны частот и частностей являются аналогами плотности вероятностей.
Для построения полигона частот на оси абсцисс ставят варианты признака
а на оси ординат — соответственные им частоты. Точки
объединяют отрезками прямых и получают полигон частот.
Для построения полигона относительных частот (частностей) на оси ординат ставят частоты а потом точки
объединяют отрезками прямых.
Пример №65
В результате выборки получили такие значения признака
Построить полигон частот этой выборки.
Решение. В этом случае вариантами будут
Соответственные им частоты
Поставив в системе координат точки
и соединяем их отрезками прямых, получим полигон частот этой выборки (смотреть рис. 19).
рисунок 19
Определение 2. Гистограммой частот называют ступенчатую фигуру, которая складывается из прямоугольников, основами которых является долевые интервалы вариант длиной а высоты равняются
(плотность частоты).
Гистограммой относительных частот (частностей) называют ступенчатую фигуру, которая складывается из прямоугольников, основами которых является долевые интервалы вариант, а высоты равны отношению (плотности частности).
Плоскость гистограмм частот равны объему выборки, а плоскость гистограммами частностей — единицы.
Для построения гистограмм частот (частностей) промежуток вариант то есть от наименьшего значения
что наблюдается, до наибольшего значения
разбивают на несколько отрезков равной длины
Потом рассчитывают сумму частот (частностей) этих значений вариант признака
которые принадлежат каждому из полученных отрезков. Если на
-ом отрезке
количества вариант, что рассматривали, с учетом их частот, равны
то строят прямоугольник
основой которого будет
— тый отрезок длиной
а высотой будет
( для частностей высота —
).
Плоскость такого прямоугольника равна (в случае частностей
). Потому плоскость всех прямоугольников будет равна сумме
то есть
— объем выборки.
В случае гистограмм частностей плоскость прямоугольников будет равны сумме всех частностей
Пример №66
В результате наблюдения получили распределение признака выборки в виде таблицы
Построить гистограмму частот этого распределения.
Решение. В данном случае наименьшее значение варианты а наибольшее значение
потому длина промежутка
равно 9. Разобьем этот отрезок на 4 равные части длиной
Для построении гистограмм целесообразно сложить таблицу 7: в первой ряд таблицы записывают полученные отрезки, во второй ряд таблицы записывают сумму частот вариант, что принадлежат соответственному отрезку, в третий ряд записывают высоты соответственных прямоугольников. В этом случае эта таблица будет выглядеть так:
таблица 7.
Отсюда видим, что
По данным таблицы 7 строим соответственную гистограмму частот (см. рисунок 20).
рисунок 20.
Замечание 1. Иногда для построения гистограмм первые два ряда распределения виды таблицы 7 уже заданы. В этом случае нужно учитывать элементы третьего ряда таблицы и построить соответственную гистограмму.
Пример №67
Построить гистограмму частностей заданного распределения
Решение. В этом случае объем выборки
длина долевого интервала варианты
По формуле находим частности каждого интервала
Для построения гистограммы частностей по определению 2, найдем плотность частности
Следует, нужна гистограмма частностей будет иметь вид, который изображен на рисунке 21.
рисунок 21.
Замечание 2. При наблюдении практичных проблем часто выборка имеет значительное количество вариант. Рассмотрим в следующем примере способ их обработки.
Пример №68
Контрольные измерения радиуса 200 цилиндров дали следующие результаты
Построить гистограмму распределения частот выборки.
Решение. В заданном виде варианты не пригодны для контроля. Эти варианты нужно как-либо упорядочить. Простейший способ упорядочения — представить варианты графически: на оси абсцисс поставить результаты измерений, а над каждым значением варианты поставить столько точек, сколько раз встречается эта варианта.
В результате мы получим точечную диаграмму, которая позволяет сложить некоторые представления про выборку и может быть поставлена в основу дальнейшей обработки результатов контроля (см. рисунок 22).
рисунок 22.
Чтобы упростить построение гистограмм, в таблице распределения используют не отрезки, в которых сгруппированы результаты измерений, а их середины. Эти середины обозначают отрезки и отдалены одна от другой на расстоянии которая равна длине отрезков.
Действительно, если длина отрезка равно а его серединой будет число
то отрезок будет
Для построения гистограммы частот выборки из рисунка 22 при получим таблицу вида
По данным таблицы строим гистограмму частот выборки.
рисунок 23.
Сгруппированные данные: гистограмма и полигон частот
Для сгруппированного распределения частоты, относительной частоты, плотности частоты и плотности относительной частоты могут быть построены специальные диаграммы, сложенные из прямоугольником ступенчатые фигуры, что называются гистограммами.
Для построения гистограмм на горизонтальную ось наносятся классы интервалов. На каждом классе строиться прямоугольник, высота которого равна значению частоты (или относительной частоты, или плотности частоты или плотности относительной частоты) на этом интервале.
рисунок 24. Гистограмма частот среднемесячной зарплаты 100 сотрудников фирмы
Сгруппированное распределение частоты, относительной частоты, плотности частоты и плотности относительной частоты
На рисунке 24 изображена гистограмма частот согласно данным таблицы 8, что построена по таблице В.6 параграфу 5.6.
Далее изобразим заштрихованные контуры гистограмм для плоскости частоты и относительной плотности частоты согласно данных таблицы 8 (смотреть рисунок 25 и 26).
рисунок 25. Контур гистограмм для плотности частоты Плоскость гистограммы 5 равна объему выборки
рисунок 26. Контур гистограмм для плотности относительной частоты Плоскость гистограммы равна 1.
Рассматривая рисунки 24, 25, 26 легко увидеть, что все три гистограммы геометрически подобны и отличаются лишь масштабом вертикальной оси.
Вид способа избрания ширины класса интервалов зависит внятность гистограммы. Если
довольно маленькое, то гистограмма содержит много случайного. Если
довольно большое, то в гистограмме возникают индивидуальные особенности выборки.
На рисунке 27 и 28 изображены гистограммы для примера 1 при значениях ширины классов интервалов и
согласно распределения частот, что приведены в таблице 9.
рисунок 27. Гистограмма частот среднемесячной зарплаты 100 сотрудников фирмы (ширина классов интервалов
)
рисунок 28. Гистограмма частот среднемесячной зарплаты 100 сотрудников фирмы (ширина классов интервалов
)
Сгруппированное распределение частоты среднемесячной оплаты сотрудников фирмы для двух значений ширины классов интервалов
и
таблица 9.
Альтернативой гистограммы для распределения частот является полигон частот. Для построения этого графика над серединой каждого интервала вариант ставится точка на высоте, соответственной частоты этого интервала. После этого эти точки получаются отрезками прямых (смотреть рисунки 29).
рисунок 29. Полигон частот среднемесячной оплаты 100 сотрудников фирмы
На графике, где размещена гистограмма частот (рис. 29), полигон частот изображенный так, что конечные точки графика касаются горизонтальной оси в точках 275 и 395.
Совмещение двух типов графиков на одном рисунке сделано с целью подчеркнуть разное геометрическое содержание этих двух графических изображений распределения частот. Обычно же полигон частот изображается на отдельном чертеже, как это показано на рисунке 30.
рисунок 30. Полигон частот среднемесячной оплаты сотрудников фирмы
рисунок 31. медиана сгруппированного распределения частот, заданного таблицей 8.
С помощью гистограмм удобно обозначить следующее важное понятие.
Определение 3. Медианой сгруппированного распределения частот при постоянной ширине классов интервалов) называется значение или точка на горизонтальной оси гистограммы распределения частот такая, в которой перпендикулярная линия, что проходит через нее, делит эту плоскость гистограммы на две равные части.
Алгоритм нахождения медианы будет рассмотрено в конце этого раздела.
Вероятностное содержание гистограмм и полигона частот
Чтоб выяснить, какое вероятное содержание гистограмм и полигона частот, изобразим на одном рисунке (см. рисунок 32) контур гистограмм для плотности относительной частоты и полигон плотности относительных частот.
Плоскость фигуры, ограниченна полигоном плотности относительных частот приблизительно равна плоскости контура диаграммы, что в свою очередь равна 1. Следует, полигон плоскости относительных частот является приблизительным изображением функции плотности вероятности генеральной совокупности.
Если увеличить объем выборки то полигон плотности относительных частот будет более точно изображен функцией плотности вероятности генеральной совокупности.
рисунок 32. Контур гистограмм для плотности относительной частоты и полигон плотности относительных частот. Плоскость гистограммы равна 1.0
Полигоны накопительных частот и частности. Нахождение их медианы
Для накопительной частоты и накопительной относительной частоты могут быть построены графики похожие на полигон частот. Эти графики называют полигоном накопительной частоты или полигоном накопительной относительной частности. В статистике их так же называют огивой и кумулятивной кривой. Полигон накопительной частоты удобно использовать в целом ряде задач статистики.
Рассмотрим построение полигона накопительной относительной частоты на примере распределения накопительной относительной частоты выборки среднемесячной оплаты 100 сотрудников фирмы (смотреть таблицу 10, которая была построена по данным таблицам В.6).
Сгруппированное распределение накопительной частоты и накопительной относительной выборки среднемесячной оплаты 100 сотрудников фирмы
Для построения полигона мы ставим точку над нижней границей каждого класса интервалов на горизонтальной оси на высоте, что соответствует величины накопительной относительной частоты на предыдущих интервалов.
Так на верхней границе интервала
поставлена точка на высоте 0, накопительная относительная частота на предыдущих интервалах равна 0 (смотреть 3-ий столбик таблицы 10).
На верхней границе интервала
поставлена точка на высоте 0,01, накопительная относительная частота на предыдущих интервалах равна 0,01 (смотреть 3-ий столбик таблицы 10) и так далее. Окончательный вид построенного полигона накопительной относительной частности приведен на рисунке 33.
рисунок 33. Полигон накопительной относительной частоты
В заключение параграфа рассмотрим, как строится медиана сплоченного распределения частоты выборки. Существуют два способа: по формуле и графически.
Рассмотрим графический способ построения медианы сгруппированного распределения частоты выборки.
Вернемся к рисунку 32. В верхней части рисунка изображен полигон накопленной относительной частоты, а в нижней части — гистограмма частот.
Из точки с ординатой 0,5 на оси проводим горизонтальную линию до пересечения с ломанной полигона накопленной относительности частот в точке
рис. 34 Графическое построение медианы группированного распределения частот с помощью полигона накопительных относительных частот.
Далее из точки проводим вертикальную линию до пересечения оси
графика гистограммы частот в точке
что и является медианой. По графику на рисунке 34 можно только приблизительно обозначить значение координаты точки
Рассмотрим построение медианы сгруппированного распределения частоты выборки по формуле.
Точное значение можно зайти по следующей интерполяционной формуле. Пусть медиана принадлежит интервалу
тогда
где — нижняя граница интервала
— значение функции накопительных относительных частот на предыдущем интервале
— относительная частота варианты в интервале
— ширина интервала.
Интервал это тот класс интервалов, что содержит число
где
— объем выборки. В нашем случае
Вернемся в таблице В.4 и воспользуемся функцией накопительной частоты. Из таблицы видно, что числу 50 соответствует интервал
Следовательно, получим
После подстановки этих значений в формулу (1) получаем
Сравнивая два способа построения медианы объединенного распределения частоты выборки по формуле или графический, приходим к следующего вывода.
Графическое нахождение медианы группированного распределения частот более наглядное, но дает только приблизительное значение медианы и показывает тот класс интервалов, где находится медиана. Этим обстоятельством можно воспользоваться для нахождения ее точного значения по интерполяционной формуле, что приведена выше.
График эмпиричной функции распределения
Пользуясь данными таблицы 9, запишем эмпиричную функцию распределения для нашего примера (теорию смотреть параграф 5.7).
Очевидно, что функция обозначает относительную частоту действия «значение варианты меньше
«, то есть
График эмпиричной функции распределения (смотреть рисунок 35) является близким изображением графика теоретичной функции распределения
случайной величины
из элементов которой составлена выборка.
рисунок 35. Эмпиричная функция распределения
рисунок 36. Полигон накопительной относительной частоты (кусковая линия) и эмпиричная функция распределения (ступенчатая линия).
На рисунке 36 совмещены графики полигона накопительной относительной частности (рис. 33) и эмпиричной функции распределения (рис. 35).
Из этого графика видно, что распределение накопительной относительной частности может быть изображен двумя разными графиками: ступенчатым графиком или ломанной прямой.
Первому изображению соответствует эмпиричная функция распределения, а во втором — полигон накопительной относительной частоты.
В то же время, ясно, что оба эти графика являются разными, но близкими изображениями теоретичной функции распределения показано выше.
Раздел 6. Статистические оценки параметров распределения
Использование математики для обработки выборки позволяет найти числовые характеристики.
Основные требования к статистическим оценкам
В большинстве случаях нужно отследить количественный признак генеральной совокупности, используют результаты выборки. Часто для этого достаточно найти приближенные значения математического ожидания
, дисперсии
среднеквадратичное отклонение
, начальные или центральные моменты случайной величины
Иногда из некоторых рассуждений получается закон распределения Тогда нужно уметь оценивать параметры этого закона распределения.
Например, известно, что случайная величина распределена равномерно; нужно по данным выборки приблизительно найти отрезок, в котором находятся значения случайной величины
Если распределена в генеральной совокупности по нормальному закону, то ее плотность вероятностей имеет вид
Необходимо оценить (найти приближенные значения) параметра который равен
и
который равен
Эти параметры полностью обозначают нормальное распределение
Если распределена по закону Пуассона, то необходимо оценивать только один параметр
которым это распределение обозначается.
Исследователь имеет в своем распоряжении только данные выборки полученные в результате наблюдений. Именно через эти данные и нужно выразить нужный параметр случайной величины генеральной совокупности.
Определение 1. Статистической оценкой неизвестного параметра случайной величины генеральной совокупности (теоретичного распределения
) называют функцию от случайных величин (результатов выборки), что наблюдаются.
Чтобы статистические оценки давали лучшее приближение параметров, они должны соответствовать определенным требованиям. Рассмотрим эти требования.
Пусть является статистической оценкой неизвестного параметра
теоремой распределения.
Предположим, что по выборке с объемом найдена оценка
При других случаях того же объема получим некоторые другие оценки
Саму оценку
можно рассмотреть как случайную величину, а числа
как и ее возможные значения.
Если числа будут больше значения
, тогда оценка
дает приближенные значения
с излишком. В этом случае математическое исследование случайной величины
будет больше
Если дают оценку
с недостачей, тогда
Таким образом, использование статистической оценки, математическое исследование которой не равняется параметру , приводят к систематическим погрешностям.
Условие предостерегает от систематических погрешностей.
Определение 2. Статистическую оценку параметра
называют не сдвигаемым параметром, если
Оценку называют параметром сдвига, если это равенство не выполняется.
Условие про не сдвигаемую оценку является недостаточной, потому что возможные значения
могут быть сильно рассеяны от своего среднего значения, дисперсия
может быть слишком большой. Тогда найденная по данным одной выборки оценка, например,
может намного отличаться от среднего значения
, следовательно и от параметра
Если будет маленькой, тогда возможность допустить большую погрешность будет исключена. Потому для статической оценки получается условие про ее эффективность.
Определение 3. Эффективной называют такую статистическую оценку , которая при заданном объеме
имеет наименьшую возможную дисперсию.
При рассматривании выборки большого объема к статистических оценках предъявляют условие их обоснованности.
Определение 4. Обоснованностью называют статистическую оценку, которая при направляется из вероятности к оценке параметра.
Например, если дисперсия не сдвигаемой оценки при направляется к нулю, то оценка будет и обоснованной.
Числовые характеристики выборочной совокупности
Выборочные характеристики:
В дополнение к табличным и графическим методам представления данных следующим важнейшим способом обработки данных являются вычисление их числовых характеристик. Важнейшие из них: среднее значение, дисперсия, среднеквадратичное отклонение (стандартное отклонение).
Эти характеристики могут быть вычислены по данным, что находятся в выборке или по данным, что входят в конечную генеральную совокупность.
Числовые характеристики, вычисленные по выборке или те, что используются для описания данных выборки, называют статистиками.
Числовые характеристики, вычисленные по генеральной совокупности или те, что используются для описания данных генеральной совокупности, называют параметрами.
По аналогии с математическими наблюдениями, дисперсию и среднеквадратичным отклонение дискретной случайной величины обозначают выборочные характеристики, изменяя при этом вероятности частотами выборки
Но в статистике используют и другие числовые характеристики.
Определение 1. Простой среднеарифметической выборкой называют сумму вариант выборки, поделенную на объем выборки. Ее обозначают
где — вариант выборки,
— объем выборки.
Определение 2. Выборочной средней или взвешенной среднеарифметическая называют среднеарифметическую варианту выборки с отклонением их частот и обозначают
где — объем выборки,
— число разных вариант,
— частоты вариант
— значение
-нной варианты.
Выборочная средняя является аналогом математического наблюдения и выполняется очень часто. Она может принимать разные числовые значения при разных выборках одинакового объема.
Потому можно рассмотреть распределения (теоретический и эмпиричный) выборочной средней и числовые характеристики этого распределения (это распределение называют выборочным).
Основные свойства выборочной средней
1. при умножении всех вариант выборки на одинаковый множитель выборочное среднее также умножается на этот множитель
2. Если прибавить (отнять) к всем вариантам выборки одинаковое число, то выборочная средняя возрастает (уменьшается) на это число
Эти свойства можно объединить в одну формулу, которую называют формулой момента
и используют в статистике.
Замечание 1. Если ввести условную варианту то формула момента (2) принимает простой вид
Определение 3. Степенной средней выборки называют такую среднюю, которую находят по формуле
При получим формулу (1), то есть выборочной средней.
При получим среднеквадратичную выборку
При получим среднюю гармоническую
Среднюю гармоническую применяют в том случае, когда искомый показатель является величиной, что обратный среднему значению признака.
При уравнение (3) будет неопределенным. Используя логарифмы и правило Лопиталя раскрытия неопределенности, получаем среднюю геометрическую
Эта средняя вычисляется только при условии, что все варианты являются положительными
Средняя геометрическая используется в статистике для обозначения темпа возрастания при наблюдении изменения признаков с течением времени
Замечание 2. Обратная той или иной средней для характеристики распределения связанно с качественным анализом этого распределения.
Замечание 3. Кроме указанных степенных средних, в статистике используются еще структурные средние, которые не зависят от значений варианты, что расположены на краях распределения, и связанны с рядом частот.
К структурным средним относят моду и медиану. Напомним, что модой называют значения варианты, которая имеет наибольшую частоту. Определение медианы и способы ее построение смотреть параграф 5.8.
Определение 4. Выборочной дисперсией называют среднюю квадратов отклонения вариант от выборочной средней с отклонениями соответственных частот
Замечание 4. Вычисления выборочной дисперсии упрощается, если находить по формуле
Определение 5. Выборочным среднеквадратичным отклонением (стандартом) называют квадратичный корень из выборочной дисперсии
Замечание 5. Выборочная дисперсия дает заниженные значения для дисперсии генеральной совокупности, она будет сдвигаемой оценкой
. Или математические ожидание
будет
Потому выборочную дисперсию целесообразно исправить таким образом, чтобы она стала не сдвигаемой оценкой. Для этого достаточно умножить на дробь
исправленную выборочную дисперсию обозначают
Тогда исправленным среднеквадратичным отклонением выборки будет
Из формул (4) и (7) получается, что при больших (объем выборки) выборочная дисперсия
и исправленная выборочная дисперсия
мало отличаются. Потому в практичных задачах исправленную дисперсию
и исправленное среднеквадратичное отклонение выборки
используют только при объеме выборки
Пример №69
Выборочная совокупность задана таблицей
Найти выборочные характеристики.
Решение. В данном случае объем выборки равен
По формуле (1) находим выборочную среднюю
По формуле (4) находим выборочную дисперсию
По формуле (6) находим выборочные среднеквадратичные отклонения (стандарт)
Вычисления выборочных характеристик методом произведений
Как правило, вычисления и
по формулам (1) и (4) или (5) проводится с использованием компьютерной техники. Часто расчеты можно упростить, используя метод произведений, в основе которого лежат равноудаленные варианты и следующая расчетная таблица.
Дадим необходимые пояснения для этого метода
Алгоритм метода произведений
1) В первый столбец таблицы записывают равноудаленные варианты выборки, размещая их в возрастающем порядке.
2) Во второй столбец таблицы записывают соответственные частоты вариант. Сумму всех вариантов этого столбца (объем выборки
) записывают в последнюю клетку этого столбца.
3) Третий столбец содержит условия варианты выборки. Для нахождения условных вариант выборки нужно:
а) значения варианты выборки с наибольшей частотой избранный за условный ноль. Эти значения варианты называют модой.
б) найти разницу между любыми двумя соседними вариантами;
в) вычислить условные варианты выборки по формуле
Отметим, что условные варианты всегда будут целыми числами.
4) В четвертый столбец записывают произведения частот и соответственных условных вариант Сумму элементов столбца записывают в последнюю клетку этого столбца.
5) Находят произведения частот и квадратов условных вариант и записывают их в пятый столбик. Сумму элементов столбца
записывают в последнюю клетку этого столбца.
6) Находят произведение частот и квадратов условных вариант, увеличенных на единицу, и записывают из в шестой столбец. Сумму элементов столбца
записывают в последнюю клетку этого столбца.
7) Проверяют вычисления так: сумма элементов шестого столбца должна удовлетворять тождество
Вычисляют условные моменты по формуле
9) Вычисляют выборочную среднюю и дисперсию по формуле
Пример №70
Найти методом произведения выборочной средней и дисперсию
заданной выборки
Решение. Будем использовать расчет таблицы методом произведения. В этом случае: варианты выборки равноудалены наибольшая частота 40 в варианте 19,8. Потому условным нулем будет
В первые для столбца расчетной таблицы записываем варианты и частоты заданной выборки, а элементы третьего столбца вычисляем по формуле (8) при указанных и
Для контроля проверяем условие (9)
Найдем условия момента по формуле (10)
По формуле (11) находим искомую выборочную середину и выборочную дисперсию
Статистические моменты распределения
Обозначим аналогично начальному и центральному распределению из теории вероятностей некоторые числовые характеристики выборки.
Определение 6. Моментом порядка называют среднее значение
— ой степени разницы
При получим начальный момент порядка
выборки
При получим центральный момент порядка
выборки
Моменты порядка и условные моменты
и
которые вычисляют по формуле (10), часто используют в статистике.
Примеры нахождения статистики выборки
В случае сгруппированной выборки допускается, что всякое значение варианты, что попали в данный класс интервалов, равно среднему значению варианты в этом классе.
1. Выборочное среднее вычисляется по формуле
где — объем выборки,
— среднее значение варианты класса,
— частота
-ного класса интервалов,
— количество классов.
2. Для дисперсии получаем формулу
и формулу для вычислений
Для исправленной дисперсии получаем формулу
и формулу для вычислений
или
Пример №71
Вычислить числовые характеристики выборки сгруппированного распределения частот среднемесячной оплаты сотрудников фирмы (смотреть таблицу 11).
таблица 11 таблица 12
Перейдем из таблицы 11 к таблице 12, заменяя классы интервалов на средние значения вариант в классе. Пользуясь данными из таблицы 12, по формуле (12) получаем
Сравнивая полученное значение выборочной средней и точным значением
видим, что они отличаются незначительно.
Погрешность возникла на счет округления всех вариант в классе к среднему значению. Как показывает практика, погрешность, что получилась ранее, незначительная.
Далее по формулам (13), (14) получим
Для среднеквадратичного отклонения получим
Согласно приведенным выше терминам является статистиками.
Как видно из формул (13) и (14) дисперсия является мерой рассеивания варианты в выборке вокруг их среднего значения. Объясним это на следующем примере.
Пример №72
Обследованы по 65 случаев выплаты страховых сумм двумя страховыми компаниями и
за некоторый период времени. За единицу отплаты принята некоторая стандартная сумма. Выплата может принимать любые значения от 0 до 4. Знак «минус» перед числом обозначает, что выплату вносит страховая компания, а знак «плюс» — что компания получит страховой взнос. Нужно рассчитать числовые характеристики этих выборок.
Распределение частот выплат страховых сумм обоих компаний приведено в таблицах 13 и 14.
Рассчитаем выборочное среднее и
для обоих компаний
Рассчитаем выборочные дисперсии и
таблица 13 таблица 14
Полигон частот обоих распределений изображений на рисунке 37. Из рисунка 37 видно, что чем меньше дисперсия, тем в большем узком интервале данные выборки группируются около среднего значения ( в нашем случае ).
рисунок 37
Точечные и интервальные оценки
Определение 1. Точечными оценками параметров распределение генеральной совокупности называют такие оценки, которые обозначаются одним числом.
Например, выборочная средняя выборочная дисперсия и выборочное среднеквадратичное
— точечные оценки соответственных числовых характеристик генеральной совокупности.
Точечные оценки параметров распределения являются случайными величинами, их можно считать первичными результатами обработки выборки потому, что неизвестно, с какой точностью каждая из них оценивает соответственную числовую характеристику генеральной совокупности.
Если объем выборки достаточно большой, то точечные оценки удовлетворяют практичной потребности точности.
Если объем выборки маленький, то точечные оценки могут давать значительные погрешности, потому вопрос точности оценок в этом случае очень важное и используют интервальные оценки.
Определение 2. Интервальной называют оценку, которая обозначается двумя числами — концами интервала.
Интервальные оценки позволяют установить точность и надежность оценок. Познакомьтесь с этими понятиями.
Пусть найдена по данным выборки статистическая оценка будет оценкой неизвестного параметра
.
Ясно, что а точнее обозначает
, тем меньше абсолютная величина разницы
.
Другими словами, если и
тогда меньшему
соответствует более точная оценка. Потому число
характеризует точность оценки.
Но статистические методы не позволяют категорично утверждать, что оценка удовлетворяют неравенство
Такое утверждения можно сделать только с вероятностью .
Определение 3. Надежностью (доверительной вероятностью) оценки параметра в
называют вероятностью
с которой выполняется неравенство
Частое число задается изначально и в зависимости от обстоятельств, равно 0.95 или 0.99 или 0.999.
Формулу (1) можно записать в виде
Из этого равенства получается, что интервал содержит неизвестный параметр
генеральной совокупности.
Определение 4. Интервал называют доверительным, если он покрывает неизвестный параметр
с заданной надежностью
.
Замечание 1. Концы доверительного интервала являются случайными величинами.
Доверительный интервал для оценки математического ожидания нормального распределения
Пусть количественный признак генеральной совокупности распределена по нормальному закону, среднеквадратичное отклонение
известно. Нужно найти доверительный интервал, что покрывает математическое ожидание
генеральной совокупности с заданной надежностью
.
Согласно свойству нормально распределенной случайной величины получаем
Поскольку интегральная функция Лапласа Ф. является непарной, то получим
Только случайная величина
потому при замене
на
в
получим
где
Используя формулы (3) и (2), получим
то есть надежностью доверительный интервал
покрывает неизвестный параметр Точность оценки будет
с использованием таблицы значений интегральной функции Лапласа.
Замечание 2. Из формулы (5) получается, что при возрастании объема выборки число
уменьшается, а это означает, что точность оценки увеличивается. Если надежность
увеличивается, функция
возрастает и согласно с ее свойствами, возрастает
, как следствие, возрастает
. Следовательно, увеличение надежности оценки уменьшает ее точность.
Пример №73
Случайная величина распределена по нормальному закону с параметром Сделана выборка объема
С надежностью
найти доверительный интервал неизвестного параметра
этого распределения.
Решение. Из равенства
Из таблицы интегральной функции Лапласа Ф найдем число Тогда по формуле (5) точность оценки будет
Следовательно, доверительный интервал будет Если
, то с надежностью 95% интервал
покрывает параметр
с точностью до
Замечание 3. Нахождение объема выборки. Пусть признак генеральной совокупности распределена по нормальному закону с параметром
и нужно найти объем выборки
который с заданной точностью
и надежностью
позволит найти оценку параметра
Из формулы (5) получим равенство
из которой получается
Для надежности воспользовавшись (6) и таблицей значений интегральной функции Лапласа, найдем соответственное число
Теперь, и
известны, тогда по формуле (7) можно найти нужный объем выборки.
Пример №74
Случайная величина распределена по нормальному закону с параметром . Найти минимальный объем
выборки, чтобы с надежностью
и точностью
использовалось равенство
если
Решение. Для согласно с формулой (6) получим
Используя формулу (7), найдено и заданы
получаем
Следовательно, минимальный объем выборки
Замечание 4. Если неизвестное среднеквадратичное отклонение признака
генеральной совокупности, то используют распределение Стьюдента (смотреть параграф 16 работы (4)), можно также в формулах (3) — (4), (7) вместо
используя
Обработка выборки методом наименьших квадратов
Предположим, что нам известна функциональная зависимость между случайными величинами и
вида
с неизвестными параметрами
Например, можно рассмотреть зависимость между себестоимостью продукции (признак ) и объем продукции (признак
) некоторого количества однотипных предприятий.
Обычно, при возрастании объема продукции себестоимость
должна спадать. Только эта зависимость не является однозначной. Вследствие, разные причины при выпуске одинакового объема продукции себестоимость ее на разных предприятий будет неодинаковой.
Пусть вследствие независимых испытаний получены варианты признака
и
, которые оформлены в статистической таблице вида
Для нахождения оценок, параметров функциональной зависимости по данным выборки используем метод наименьших квадратов. Этот метод основывается на том, что верные значения параметров
должны давать минимум функции
Если функция имеет непрерывные частные производные относительно параметров
то необходимым условием существования минимум функции
будет система
уравнений с
неизвестными
Нахождение функциональной зависимости между случайными величинами и
из использованием данных испытаний (или выборки) называют выравниванием эмпиричных данных вдоль кривой
Ниже рассмотрим детальнее оценки параметров линейной и параболической функциональной зависимостей, которые используются чаще всего.
Оценка параметров линейной функции
Пусть между случайными величинами и
существует линейная функциональная зависимость
параметры и
которой неизвестны.
Согласно формуле (1) получим
Эта функция непрерывно дифференцирована, потому согласно с необходимыми условиями существования минимума
обязаны выполняться равенства
и
В нашем случае эти равенства имеют вид
Выписанная система является неоднородной линейной системой двух уравнений относительно двух неизвестных и
По правилу Крамера можно найти единственное решение этой системы в виде
Если количество значений и
велика, то вычисления параметров
и
по формулам (3), (4) выполняется . Для упрощения вычислений начало расчета величин
переносят в среднее значение всех, то есть в точку
Тогда после некоторых промежуточных выкладок получаем
Формулы (5) позволяют обозначить параметры и
линейной функциональной зависимости (2) путем вычисления более простым, чем по формулам (3), (4).
Оценка параметров параболической функциональной зависимости
Пусть между случайными величинами и
существует функциональная зависимость вида
Методом наименьших квадратов на основе данных исследований найдем значения неведомых параметров Теперь формула (1) будет иметь вид
Необходимые условия существования минимума функции является равенства нулю частичных производных первого порядка
Эту систему можно записать в виде
Система (7) является неоднородной линейной системы трех уравнений с неизвестными Решением этой системы можно найти разными методами ( матричным по правилу Крамера, методом Гаусса — Жордана) а его вид будет громоздким при слишком большом количестве исследований
Система (7) и ее решение намного упрощается, если значения равноудалены
и выполняется условие
которое можно получить с помощью нового аргумента
Предположим, что указанные условия выполняется, тогда вместо системы (7) получим систему
Решение этой системы можно найти по формуле
Пример №75
Используя метод наименьших квадратов, сложить уравнение параболы (6), которая проходит близко к точкам
Решение. В этом случае значения равноудалены
и выполняются условия, которые позволяют найти параметры с упрощенными формулами. Потому, подставив значения
и
из таблицы в эти формулы, получим
потому что
Таким образом, уравнением искомой параболы будет
Статистическая проверка гипотез
Гипотезы полезны в многих случаях. Они бывают разные. Как их проверить?
Статистические гипотез и из разновидности
Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестный, только есть рассуждения для предположение его определенного вида например, распределение равномерный, показательный или нормальный, тогда выдвигают гипотезу:
- генеральная совокупность распределена по закону
В этой гипотезе идет речь про вид неизвестного распределения.
Иногда закон распределения генеральной совокупности известный , но его параметры (числовые характеристики) неизвестны. Если есть рассуждение, допустим, что неведомый параметр равны определенному значению
то используют гипотезу
. Эта гипотеза показывает предположенную величину параметра известного распределения.
Возможны так же другие гипотезы: про равенство параметром двух разных распределений, про независимость выборок, про то, что в ноябре 2000 года будет конец света, и много других.
Определение 1. Статистическими называют гипотезы про вид распределения генеральной совокупности или про параметры известных распределений.
Например, статистическими будут гипотезы:
- генеральная совокупность распределена по нормальному закону;
- дисперсии двух совокупностей, распределенных по закона Пуассона, равны между собой.
Известно, что на творческие возможности людей влияют не только гены и условия жизни, но и космос. Рассмотрим гипотезы:
- значительная часть рожденных в первом полугодии имеет более развитую левую часть мозга, которая отвечает за логичное мышление.
- значительная часть людей, рожденных в другом полугодии, имеет более развитую часть мозга, которая отвечает за образное мышление.
Эти гипотезы не статистические, ибо в них идет речь не об вид и не об параметры распределения. Но для указанной ситуации можно сформулировать несколько статистических гипотез.
Вместе с предположенной гипотезой всегда можно рассмотреть противоположной ее гипотезу. Если предположенная гипотеза будет отклонена, то имеет место быть противоположная гипотеза. Следовательно, эти гипотезы значительно отличаются.
Определение 2. Основой (нулевой) называют предположительную гипотезу и обозначают
Определение 3. Альтернативной (конкурентной) называют гипотезу, что противоречит основной, ее обозначают .
Например, если то
Гипотезы могут содержать только одну или больше одного предположения.
Определение 4. Гипотезу зовут простой, если она содержит только одно предположение.
Например, если — параметр показательного распределения, то гипотеза
будет простой.
Определение 5. Гипотезу называют сложной, если она складывается из ограниченного или не ограниченного количества простых гипотез.
Например, гипотеза : математическое исследование нормального распределения равна 2 — сложная гипотеза тому, что среднеквадратичное отклонение
неизвестное и может принимать любые значения.
Гипотеза показательное распределение имеет параметр
складывается из неограниченного множества гипотез
где
Погрешности проверки гипотез
Статистическая гипотеза, которая смещена, может быть правильной или неправильной, потому возникает необходимость ее проверки.
Проверка гипотеза выполняется по данным выборки, то есть статистическими методами. Потому проверку гипотезы по данным выборки называют статистической.
При проверке статистической гипотезы по данным случайной выборки можно сделать ложный вывод. При этом могут быть погрешности первого и второго рода.
Определение 1. Если в выводе была отклонена правильная гипотеза, то говорят, что это погрешность первого рода.
Определение 2. Если в выводе была принята не правильная гипотеза, то говорят, что это погрешность второго рода.
Отметим, что последствия этих погрешностей могут быть разными. Например, если откинуть правильную гипотезу «продолжить постройку мясокомбината», то эта погрешность первого рода будут способствовать материальным тратам.
Если принять неправильную гипотезу «продолжить постройку, не учитывая возможность обвала объекта», то в последствии погрешности второго рода могут погибнуть люди.
Определение 3. Вероятность сделать погрешность первого рода обозначают и называют уровнем значимости.
Чаще всего уровень значимости принимают равным 0,05 или 0,01. Если принят уровень значимости равный 0,05, то это означает, что в пяти случаях из 100 мы рискуем получить погрешность первого рода (отклонили правильную гипотезу).
Замечание. При контроле качества продукции вероятность признать нестандартные стандартные изделия называют риском производителя, а вероятность признать пригодным бракованные изделия называют риском потребителя.
Критерии координирования проверки гипотез
Статистический критерий проверки основной гипотезы:
Проверку статистической гипотезы можно проверить с использованием данных выборки. Для этого следует выбрать, некоторую случайную статистическую характеристику (выборочная функция), точное или приближенное распределение. который известен, и с помощью этой характеристики проверить основную гипотезу.
Определение 1. Статистическим критерием координирования проверки гипотезы (или просто критерием) называют случайную величину распределение которой (точное или приближенное) известен и которая используется для проверки основной гипотезы.
Замечание 1. В определении 1 не учитывается вид распределения статистической характеристики.
Если статистическая характеристика распределена нормально, то критерий обозначают не буквой а буквами
или
Если статистическая характеристика распределена по законом Фишера — Снедекора, то ее обозначают
В случае распределения статистической характеристики по закону Стьюдента и обозначают а в случае закона
Например, для проверки гипотез про равенство дисперсии двух нормальных генеральных совокупностей в статистической характеристике выбирают отношения исправленных выборочных дисперсий
В разных опытах дисперсия будет принимать разные, изначально известные значения, потому эта величина случайная. Она распределена по закону Фишера-Снедекора.
Определение 2. Наблюдаемым значением критерия согласования называют значение соответственное критерию, вычисленное по данным выборки.
Например, если по данным выборок их двух нормальных генеральных совокупностей найдем исправленные выборочные дисперсии и
, тогда наблюдаемым значением критерия согласования будет
Существует много критериев согласования. Например, наиболее точный (асимптотически) критерий Неймана — Пирсона используются неравенства или отношения функции правдоподобности.
Критическая область
После избрания первого критерия согласования, множество всех его возможных значений делят на две подмножества, что не пересекаются: одна из них содержит значения критерия, при которых основная гипотеза отклоняется, а вторая — при которых она принимается.
Определение 3. Критической областью называют совокупность значений критерия, при которых основная гипотеза отклоняется.
Определение 4. Областью принятия гипотезы (областью допустимых значений) называют множество значений критерия, при которых гипотезу принимают.
Критерий согласования — одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Потому критическая область и область принятия гипотезы также будут интервалами, а это означает, что существуют точки, которые эти интервалы отделяют.
Определение 5. Критическими точками критерия называют точки
которые отделяют критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.
Определение 6. Правосторонней называют критическую область, что обозначается неравенством — где
положительное число.
Определение 7. Левосторонней называют критическую область, что обозначается неравенством — где
отрицательное число.
Нахождение критических областей
Чтобы найти одностороннюю критическую область нужно найти критическую точку Для этого задают достаточно маленькую вероятность — уровень значимости
а потом ищут критическую точку с учетом условия
в случае правосторонней критической области, или
в случае левосторонней критической области
В случае двусторонней критической области должно получится тождество
Для каждого критерия согласования являются соответственные таблицы, которые позволяют находить такую точку которая удовлетворяет нудное условие.
При нахождении критической области целесообразно учитывать мощность критерия.
Определение 8. Мощность критерия называют вероятность принадлежности критерия критической области при условии, что является правильная альтернативная гипотеза.
Другими словами, мощность критерия является вероятность того, что основная гипотеза будет отклонена, если альтернативная гипотеза правильная.
Если уровень значимости уже избрано то критичную область целесообразно строить так, чтобы мощность критерия была максимальной. Выполнение этого условия обеспечивает минимальную вероятность погрешности второго рода.
Замечание 2. Единственный способ одновременного уменьшения погрешностей первого и второго рода — увеличение объема выборки.
Порядок действий при проверке статистических гипотез
Для проверки правильности основной статистической гипотезы необходимо:
- обозначить гипотезу
альтернативную к гипотезе
;
- выбрать статистическую характеристику проверки;
- обозначить допустимую вероятность погрешности первого рода, то есть уровень значимости
- найти по соответственной таблице критическую область (критическую точку) для выбранной статистической характеристики.
К критической области принадлежат такие значения статистической характеристики, при которых гипотеза отклоняется в пользу альтернативной гипотезы
Подчеркнем, что между уровнем значимости и критической областью существует такая связь: если гипотеза
правильная, то вероятности значения выборочной функции будут принадлежать критической области.
Так, при проверке гипотезы про равенство дисперсий двух нормальных совокупностей при альтернативной нужно найти соответственное значение критерия Фишера-Снедекора, то есть
а потом из таблицы критических точек этого распределения по заданному уровню значимости и степенях вольности
и
найти
если то гипотеза
принимается, если
то
отклоняется.
Некоторые критерии проверки статистических гипотез
Проверка гипотезы про равенство математических ожиданий нормальных генеральных совокупностей:
Пусть две нормально распределенные генеральные совокупности имеют равные дисперсии, а математические ожидания могут быть разными.
Из совокупностей сделали выборку объема и
нашли выборочные средние
и
а также исправленные дисперсии
и
соответственно.
Нужно проверит гипотезу : разница математических ожиданий этих совокупностей равна числу
Альтернативная гипотеза будет
Для проверки гипотезы в качества статистической характеристики (выборочной функции) возьмем функцию
которая распределена по закону Стьюдента со степенями вольности, что равны
Для заданного уровня значимости можно найти критическую область для статистической характеристики
с учетом альтернативной гипотезы
Пример №76
Предприятие изготовляет одинаковые детали двумя способами. Первым способом изготовлено 10 деталей, траты сырья были такими
Вторым способом изготовлено 6 деталей, траты сырья были такими
Предположим, что дисперсия трат сырья одинаковая, при уровне значимости проверить гипотезу
при альтернативной гипотезе
Решение. Нужно проверить гипотезу про равенство математических ожиданий двух нормальных генеральных совокупностей. Согласно с гипотезой критическая область будет двусторонней и обозначается условием
где статистическая характеристика
обозначена формулой (1). Степень вольности равна
Из таблицы критических значений для 14 степеней вольности получим
По данным выборки можно найти
Теперь по формуле (1) получим
Следовательно не принадлежит критической области, потому гипотеза
может быть принята.
Критерий дисперсионного анализа
Пусть есть нормального распределения генеральных совокупностей с равными дисперсиями и , возможно, с разными математическими ожиданиями.
Из каждой совокупности делаем выборку объема
тогда
— объем всей выборки.
Обозначим варианты случайной величины
из
-нной совокупности
Тогда средняя арифметическая выборка из
-нной совокупности будет
а средняя всей выборки будет
При уровне значимости нужно проверить основную гипотезу про равенство математических ожиданий рассматриваемых совокупностей
При равенстве дисперсий статистическая характеристика будет иметь распределение Фишера с и
степенями вольности. Потому качество статистической характеристики для проверки этой гипотезы возьмем функцию
Критическую область в этом случае находят с учетом условия
где критическое значение распределения Фишера.
Пример №77
Есть данные про стоимость (пример приведен в тысячах гривен) проданных трех видов изделий первым магазином в некоторые дни недели
Предполагая нормальный закон распределения полученной суммы каждого дня и равенство дисперсий, проверить гипотезу :
при уровне значимости
Решение. Условие примера позволяют использовать для решения задачи критерий дисперсионного анализа.
В этом случае получаем:
По формулам (2) и (3) находим:
Сделаем вычисление сумм, что исходят из формулы (4)
Теперь по формуле (4) найдем значения статистической характеристики
Из таблицы критических значений распределения значений Фишера со степенями вольности и
и уровнем значимости
находим
Получили, что потому, гипотеза
может быть принята.
Критерий согласования Пирсона x2
Критерий согласования Пирсона
Критерий согласования Пирсона эффектно используют для проверки гипотезы про распределение генеральной совокупности, то есть распределение случайной величины имеет функциональное выражение.
Ограничимся применением этого критерия для проверки гипотезы про нормальное распределение генеральной совокупности.
Пусть выборка имеет такое распределение объема
или
нужно с уровнем значимости проверить основную гипотезу
: генеральная совокупность распределена нормально.
Критерием проверки этой гипотезы берут случайную величину , которая в разных исследованиях принимает разные, изначально неизвестные значения.
Критическое значение этой случайной величины зависят от уровня значимости и степени вольности ее распределения
Эти критические значения представлены в виде таблицы (таблица 5 в приложении) для разных и
для распределения генеральной совокупности по нормальному закона степень вольности будет
где — количество вариант выборки или частотных интервалов вариант.
Правило Пирсона. Чтобы при заданном уровне значимости проверить основную гипотезу
: генеральная совокупность распределена нормально, нужно
1)вычислить теоретическую частоту для вариант выборки;
2) вычислить наблюдаемое значение критерия по формуле
3) найти степень вольности по формуле (5);
4) найти из таблицы критическую точку которая соответствует заданному уровню значимости
и степени вольности
5) уравнять и
сделать вывод:
Пример №78
При равной значимости проверить
гипотезу про нормальное распределение генеральной совокупности, если известны эмпиричные и теоретические частоты
Решение. В данном случае теоретические частоты заданы, количество вариант выборки
Потому по формуле (5) находим степень вольности
Из таблицы критических точек распределения для
и
находим
Для вычисления по формуле (6) используем расчетную таблицу
Таким образом, потому по правилу Пирсона гипотезу
следует принять. Следовательно, данные выборки согласуются с гипотезой
, потому разногласие эмпиричных и теоретических частот незначительное.
Нахождение теоретических частот нормального распределения
Согласно с классическим определением вероятности
Следовательно для нахождения теоретических частот
нужно найти вероятность
соответственно.
Вероятность можно найти, пользуясь локальной функцией Лапласа
и данные выборки по формуле
где
варианты равноудалены.
Вероятность можно найти, используя интегральную функцию Лапласа
по формуле
б) если число сходится с одним корнем характеристического уравнения (93), то есть является простым корнем этого уравнения, то частичное решение (91) нужно искать в виде
в) если число является двукратным корнем уравнения (93), то частичное решение уравнения (91) ищут в виде
Объединим случаи а) — в): если правая часть уравнения (91) имеет вид (92), то частичное решение этого уравнения нужно искать в виде
где — многочлен с неопределенными коэффициентами той же степени, что и многочлен
а
— число корней характеристического уравнения, которые равны
. Если
не является корнем характеристического уравнения, то принимаем
Пусть правая часть в уравнении (91) имеет вид
где — многочлен степени
— многочлен степени
и
— действительные числа. Частичное решение уравнения (91) нужно искать виде
где и
— многочлен степени
с неопределенными коэффициентами;
— высшая степень многочленов
и
то есть
— число корней характеристического уравнения, которые равны
Кроме того, если правая часть уравнения (91) имеет вид
где — известные действительные числа, то частичное решение этого уравнения нужно искать в виде
где — неизвестные коэффициенты;
— число корней характеристического уравнения (93), которые равны
Замечание. 1. Искомые многочлены в формулах (94), (96) и (97) могут быть полными, то есть содержат все степени
от нуля до
независимо от того, является ли полным заданный многочлен
То же используется и к многочленам
и
в формуле (99), причем неопределенные коэффициенты при одних и тех же степенях
в этих многочленах должны быть, как говорят, разными.
Замечание 2. Если правая часть уравнения (91) является суммой нескольких разных по структуре функций вида (92) или (98), то для поиска частичного решения нужно искать теорему про наложение решений (п. 3.4).
Замечание 3. Использованный метод подбора отдельного частичного решения уравнения (91) можно использовать только в определенных дифференциальных уравнений, а именно для линейных уравнений с постоянными коэффициентами и со специальной правой частью вида (92) или (98). В других случаях частичное решение нужно искать методом вариации произвольных постоянных.
Пример №79
Решить уравнение
Характеристическое уравнение
имеет корни
потому общее решение однородного уравнения имеет вид
Поскольку правой частью данного уравнения является функция вида
причем
то по формуле (94) частичное решение ищем в виде
то есть
где
и
— неизвестные коэффициенты. Найдя производные
и подставив их в уравнения, получим
Приравнивая коэффициенты при одинаковых степенях, получим систему уравнений
откуда Следует, частичное решение данного уравнения имеет вид
потому
искомое общее решение.
Лекции по предметам:
- Математика
- Алгебра
- Линейная алгебра
- Векторная алгебра
- Геометрия
- Аналитическая геометрия
- Высшая математика
- Дискретная математика
- Математический анализ
- Математическая статистика
- Математическая логика
Учебник онлайн:
- Комбинаторика — правила, формулы и примеры
- Классическое определение вероятности
- Геометрические вероятности
- Теоремы сложения и умножения вероятностей
- Формула полной вероятности
- Повторные независимые испытания
- Простейший (пуассоновский) поток событий
- Случайные величины
- Числовые характеристики случайных величин
- Нормальный закон распределения
- Основные законы распределения вероятностей
- Асимптотика схемы независимых испытаний
- Функции случайных величин
- Центральная предельная теорема
- Ковариация в теории вероятности
- Функциональные преобразования двухмерных случайных величин
- Правило «трех сигм» в теории вероятности
- Производящие функции
- Теоремы теории вероятностей
- Основные законы распределения дискретных случайных величин
- Непрерывные случайные величины
- Закон больших чисел
- Генеральная и выборочная совокупности
- Интервальные оценки параметров распределения
- Алгебра событий — определение и вычисление
- Свойства вероятности
- Многомерные случайные величины
- Случайные события — определение и вычисление
- Системы случайных величин
- Вероятность и риск
- Определения вероятности событий
- Предельные теоремы теории вероятностей
Здравствуйте, на этой странице я собрала краткий курс лекций по предмету «Теория вероятностей и математическая статистика» — ТВИМС.
Лекции подготовлены для студентов любых специальностей и охватывает курс предмета «Теория вероятностей и математическая статистика».
В лекциях вы найдёте основные законы, теоремы, формулы и примеры с решением.
Если что-то непонятно — вы всегда можете написать мне в WhatsApp и я вам помогу!
Тео́рия вероя́тностей — раздел математики, изучающий случайные события, случайные величины, их свойства и операции над ними. wikipedia.org/wiki/Теория_вероятностей
Математи́ческая стати́стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов. wikipedia.org/wiki/Математическая_статистика
Предмет теория вероятностей
Задачи любой науки состоят в выявлении и исследовании закономерностей, которым подчиняются реальные процессы.
Теория вероятностей — математическая наука, изучающая закономерности случайных явлений. Знание закономерностей, которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.
Методы теории вероятностей широко применяются в различных отраслях науки и техники: в теории надёжности, теории массового обслуживания, теоретической физике, геодезии, астрономии, теории ошибок, теории управления, теории связи и во многих других теоретических и прикладных науках. Теория вероятностей служит для обоснования математической статистики.
Математическая статистика — раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей. Методы математической статистики используются при планировании организации производства, анализе технологических процессов, для контроля качества продукции и многих других целей.
Первые работы, в которых зарождались основные понятия теории вероятностей, появились в XVI-XVII веках. Они принадлежали Д.Кардано, Б.Паскалю, П.Ферма, Х.Гюйгенс и др. и представляли попытки создания теории азартных игр с целью дать рекомендации игрокам. Следующий этап развития теории вероятностей связан с именем Я.Бернулли, который доказал теорему, теоретически обосновавшую накопленные ранее факты и названную в дальнейшем «законом больших чисел».
Дальнейшее развитие теории вероятностей приходится на XVII-XIX века благодаря работам А.Муавра, П.Лапласа, К.Гаусса, С.Пуассона и др. Весьма плодотворный период развития «математики случайного» связан с именами русских математиков П.Л.Чебышсва, А.М.Ляпунова и А.А.Маркова.
Большой вклад в последующее развитие теории вероятностей и математической статистики внесли российские математики С.Н.Бсрнштейн, В.И.Романовский, А.Н.Колмогоров, А.Я.Хинчин, Б.В.Гнеденко и др., а также учёные англо-американской школы Стьюдент (псевдоним В.Госсета), Р.Фишер, Э.Пирсон, Е.Нейман и др. Особо следует отметить неоценимый вклад академика А.Н.Колмогорова в становление теории вероятностей как математической науки.
Широкому внедрению статистических методов исследования способствовало появление во второй половине XX века электронных вычислительных машин и, в частности, персональных компьютеров. Статистические программные пакеты сделали эти методы более доступными и наглядными, так как трудоёмкую работу по расчёту статистик, параметров, характеристик, построению таблиц и графиков в основном стал выполнять компьютер, а исследователю осталась главным образом творческая работа: постановка задачи, выбор методов решения и интерпретация результатов.
Основные понятия теории вероятностей
Наблюдаемые события можно разделить на три вида: достоверные, невозможные и случайные.
Событие называется достоверным, если оно обязательно произойдет при выполнении данного ряда условий.
Событие называется невозможным, если оно заведомо не произойдет при выполнении данного ряда условий.
Событие называется случайным, если при осуществлении ряда условий оно может либо произойти, либо не произойти. Испытанием называется осуществление ряда условий. События называются несовместными, если появление одного из них исключает появление других событий в одном и том же испытании. События называются единственно возможными, если появление в результате испытания одного и только одного из них является достоверным событием.
Очевидно, единственно возможные события являются попарно несовместимыми.
События называются равновозможными. если можно считать, что ни одно из них не является более возможным, чем другие.
Элементарным исходом называется каждый из возможных результатов испытания.
Полной группой называется совокупность единственно возможных событий испытания.
Противоположными называются два единственно возможных события, образующих полную группу. Если одно из двух противоположных событий обозначено через , то другое обозначают
.
Суммой двух событий
и
называется событие, состоящее в появлении события
или события
, или обоих этих событий. Суммой нескольких событий называется событие, которое состоит в появлении хотя бы одного из этих событий.
Произведением двух событий и
называется событие
, состоящее в совместном появлении этих событий.
Произведением нескольких событий называется событие, состоящее в совместном появлении всех этих событий.
Вероятностью события называется отношение числа благоприятных исходов к общему числу всех элементарных исходов испытания, если все исходы равновозможны (классическое определение вероятности). Формулой это определяется так:
где — число элементарных исходов, благоприятных событию
— число всех возможных элементарных исходов.
Из определения вероятности вытекают следующие свойства:
а) вероятность достоверного события равна единице;
б) вероятность невозможного события равна нулю;
в) вероятность случайного события есть положительное число, заключенное между нулем и единицей;
г) вероятность суммы двух несовместных событий равна сумме вероятностей этих событий:
Пример № 1
В ящике 10 пронумерованных шаров с номерами от 1 до 10. Вынули один шар. Какова вероятность того, что номер вынутого шара не превышает 10?
Решение:
Так как номер любого шара, находящегося в ящике, не превышает 10, то число случаев, благоприятствующих событию , равно числу всех возможных случаев, т.е.
В этом случае событие достоверно.
Пример № 2
В урне 15 шаров: 5 белых и 10 чёрных. Какова вероятность вынуть из урны синий шар?
Решение:
Синих шаров в урне нет, т.е.
Следовательно,
В данном случае событие — невозможное.
Пример № 3
В урне 12 шаров: 3 белых, 4 чёрных и 5 красных. Какова вероятность вынуть из урны чёрный шар?
Решение:
Здесь
Пример № 4
В урне 10 шаров: 6 белых и 4 чёрных. Вынули 2 шара. Какова вероятность того, что оба шара — белые?
Решение:
Здесь число всех случаев
Число же случаев, благоприятствующих событию , определяется равенством
Итак,
Пример № 5
В корзине 100 фруктов: 10 груш и 90 яблок. Наугад взяты четыре фрукта. Найти вероятность того, что
а) взято четыре яблока;
б) взято четыре груши.
Решение:
Общее число элементарных исходов испытания равно числу сочетаний из 100 элементов по четыре, т.е. .
а) Число исходов, благоприятствующих рассматриваемому событию (все взятые наугад четыре фрукта являются яблоками), равно числу сочетаний из 90 элементов по четыре, т.е. .
Искомая вероятность равна отношению числа исходов, благоприятствующих рассматриваемому событию, к общему числу возможных элементарных исходов:
б) Число исходов, благоприятствующих рассматриваемому событию (все взятые наугад четыре фрукта — груши), равно числу способов, которыми можно извлечь четыре груши из десяти имеющихся, т.е. . Искомая вероятность
Пример № 6
Из 10 ответов к задачам, помещённым на данной странице, 2 имеют опечатки. Студент решает 5 задач. Какова вероятность того, что в одной из них ответ дан с опечаткой.
Решение:
Примечание. Такие задачи описываются общей схемой. Имеется совокупность из элементов первого вида и
элементов второго вида. Какова вероятность того, что при выборе совокупности из
элементов она состоит из
элементов первого вида и
элементов второго вида, где
Относительная частота события
Относительной частотой события называется отношение числа испытаний, в которых событие появилось, к общему числу фактически произведенных испытаний. Таким образом,
где — число появлений события;
— общее число испытаний,
— относительная частота события.
В тех случаях, когда классическое определение вероятности неприменимо (например, когда число исходов бесконечно), используется статистическое определение. В этом случае за вероятность события принимается относительная частота события.
Геометрическое определение вероятности
При классическом определении вероятности не всегда можно определить числа и
для вычисления вероятностей событий, и поэтому непосредственно пользоваться формулой
не удаётся. В таких случаях вводят понятие геометрической вероятности, т. е. вероятности попадания точки в область (отрезок, часть плоскости, часть тела и т. д.).
Пусть, например, на плоскости имеется некоторая область и в ней содержится другая область
. Требуется найти вероятность того, что точка, взятая наудачу в области
, попадет в область
. При этом выражению «точка, взятая наудачу в области
» придается следующий смысл: эта точка может попасть в любую точку области
. Вероятность попадания точки в какую-либо часть области
пропорциональна мере
этой части (длине, площади, объему и т.д.) и не зависит от ее расположения и формы:
(геометрическое определение вероятности).
Пример № 7
На отрезке длины
числовой оси
наудачу нанесена точка
. Найти вероятность того, что отрезки
и
имеют длину больше, чем
.
Решение:
Разобьём отрезок на четыре равные части точками
(рис. 1). Требование задачи будет выполнено, если точка
попадёт на отрезок
, длина которого равна
.
Следовательно,
Пример № 8
Внутри эллипса расположен круг
. Найти вероятность попадания точки в кольцо, ограниченное эллипсом и кругом.
Решение:
Пусть событие — попадание точки в кольцо. Тогда
где
Так как
то
Примечание. В случае классического определения вероятность невозможного события равна нулю. Справедливо и обратное утверждение, т.е. если вероятность события равна нулю, то событие невозможно. При геометрическом же определении вероятности обратное утверждение не имеет места. Вероятность попадания брошенной точки в одну определённую точку области равна нулю, однако это событие может произойти и, следовательно, не является невозможным.
Пример № 9 (Задача о встрече)
Два студента и
условились встретиться в определённом месте во время перерыва между 13 ч и 13 ч 50 мин. Пришедший первым ждёт другого в течение 10 мин, после чего уходит. Чему равна вероятность их встречи, если приход каждого из них в течение указанных 50 мин может произойти наудачу, и моменты прихода независимы?
Решение:
Обозначим момент прихода студента через
, а студента
— через
. Для того чтобы встреча произошла, необходимо и достаточно, чтобы
. Изобразим
и
как декартовы координаты на плоскости, а в качестве единицы масштаба выберем одну минуту (рис. 2). Всевозможные исходы изобразятся точками квадрата со стороной 50, а исходы, благоприятствующие встрече, — точками заштрихованной области. Искомая вероятность равна отношению площади заштрихованной фигуры к площади всего квадрата:
Аксиоматическое построение теории вероятностей
Пусть — множество всех возможных исходов некоторого испытания (опыта, эксперимента). Каждый элемент
множества
, т.е.
, называют элементарным событием или элементарным исходом, а само множество
— пространством элементарных событий. Любое событие
рассматривается как некоторое подмножество (часть) множества
, т.е.
.
Само пространство элементарных событий представляет собой событие, происходящее всегда (при любом элементарном исходе со), и называется достоверным событием. Таким образом,
выступает в двух качествах: множества всех элементарных исходов и достоверного события. Ко всему пространству
элементарных событий добавляется ещё пустое множество
, рассматриваемое как событие и называемое невозможным событием.
Суммой нескольких событий называется объединение множеств
.
Произведением нескольких событий называется пересечение множеств
Событием , противоположным событию
, называется дополнение множества
до
, т.е.
.
Несколько событий образуют полную группу (полную систему), если их сумма представляет всё пространство элементарных событий, а сами события несовместные, т.е.
Таким образом, под операциями над событиями понимаются операции над соответствующими множествами.
В начале 30-х годов XX века академик А.Н.Колмогоров разработал подход, связывающий теорию вероятностей с современной метрической теорией функций и теорией множеств, который в настоящее время является общепринятым.
Сформулируем аксиомы теории вероятностей. Каждому событию поставим в соответствие некоторое число, называемое вероятностью события
, т.е.
. Так как любое событие есть множество, то вероятность события есть функция множества.
Вероятность события должна удовлетворять следующим аксиомам: Р.1. Вероятность любого события неотрицательна: .
Р.2. Вероятность достоверного события равна 1: .
Р.З. Вероятность суммы несовместных событий равна сумме вероятностей этих событий, т.е. если то
Из аксиом P.1, Р.2, Р.З можно вывести основные свойства вероятностей:
Произведение событий
Условной вероятностью называется вероятность события
, вычисленная в предположении, что событие
уже произошло. Теорема. Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную в предположении, что первое событие уже наступило:
Следствие. Вероятность совместного появления нескольких событий равна произведению вероятности одного из них на условные вероятности всех остальных, причем вероятность каждого последующего события вычисляется в предположении, что все предыдущие события уже появились:
Два события и
называются независимыми, если
Пример № 10
В первом ящике 2 белых и 10 чёрных шаров; во втором ящике 8 белых и 4 чёрных шара. Из каждого ящика вынули по шару. Какова вероятность, что оба шара белые?
Решение:
В данном случае речь идёт о совмещении событий и
, где событие
— появление белого шара из первого ящика, событие
— появление белого шара из второго ящика. При этом
и
— независимые события. Имеем
Применив теорему умножения вероятностей, находим
Пример № 11
В ящике 6 белых и 8 чёрных шаров. Из ящика вынули два шара (не возвращая вынутый шар в ящик). Найти вероятность того, что оба шара белые.
Решение:
Пусть событие — появление белого шара при первом вынимании; событие
— появление белого шара при втором вынимании. По теореме умножения вероятностей для случая зависимых событий имеем
Но
(вероятность появления первого белого шара);
(вероятность появления второго белого шара в предположении, что первый белый шар уже вынут). Поэтому
Пример № 12
Три стрелка независимо друг от друга стреляют по цели. Вероятность попадания в цель для первого стрелка равна 0,75, для второго — 0,8, для третьего — 0,9. Определить вероятность того, что все три стрелка одновременно попадут в цель.
Решение:
Пример № 13
Из колоды в 52 листа наугад вытягиваются три карты. Какова вероятность, что все три карты — тузы?
Решение:
Интересующее нас событие (все три карты — тузы) является произведением трех событий: — первая карта туз,
— вторая карта туз,
— третья карта туз. По теореме умножения
(число благоприятствующих исходов — число тузов в колоде, общее число элементарных исходов равно числу карт).
(число благоприятствующих исходов — число тузов, оставшихся после совершения события , т.е. после того, как один туз был вынут из колоды; общее число исходов равно числу карт, оставшихся в колоде после того, как одну карту уже вынули). Аналогично,
Следовательно,
Пример № 14
Вероятность выхода станка из строя в течении одного рабочего дня равна (
— малое положительное число, второй степенью которого можно пренебречь). Какова вероятность того, что за 5 дней станок ни разу не выйдет из строя? Решить задачу при
= 0,01.
Решение:
Так как (1 — ) — вероятность того, что станок не выйдет из строя в течение дня, то по теореме умножения вероятностей
— вероятность того, что станок не выйдет из строя в течение 5 дней.
Воспользовавшись биномиальным разложением и пренебрегая членами, содержащими получим приближённое равенство
. Приняв
, получаем
.
Сумма событий
Теорема. Вероятность суммы нескольких попарно несовместных событий равна сумме вероятностей этих событий:
Теорема. Сумма вероятностей событий образующих полную группу, равна единице:
Теорема. Сумма вероятностей противоположных событий равна единице:
Теорема. Вероятность суммы совместных событий равна сумме вероятностей этих событий без вероятности их совместного появления:
Пример № 15
В урне 10 белых, 15 чёрных, 20 синих и 25 красных шаров. Вынули один шар. Найти вероятность того, что вынутый шар: белый; чёрный; синий; красный; белый или чёрный; синий или красный; белый, чёрный или синий.
Решение:
Имеем
Применив теорему сложения вероятностей, получим
Пример № 16
Два стрелка стреляют по мишени. Вероятность попадания в цель первым стрелком равна 0,6, вторым — 0,8. Найти вероятность того, что при одном залпе:
а) попадут в цель оба стрелка;
б) попадет хотя бы один.
Решение:
Обозначим события: — попадет в цель первый стрелок,
— попадет в цель второй стрелок.
а) Интересующее нас событие (попадут в цель оба стрелка) является произведением событий и
. Так как
и
— независимые события (стрелок попадает или не попадает в цель независимо от меткости другого), то
Следовательно,
б) 1-й способ. Интересующее нас событие является суммой событий и
, поэтому по теореме сложения
2-й способ. Событие (попадет хотя бы один стрелок) и
(ни один из стрелков не попадет) — противоположные, поэтому
. Следовательно,
.
Событие является произведением событий
и
. Таким образом
Пример № 17
В первом ящике 2 белых и 10 чёрных шаров; во втором ящике 8 белых и 4 чёрных шара. Из каждого ящика вынули по шару. Какова вероятность того, что один из вынутых шаров белый, а другой — чёрный.
Решение:
Пусть: событие — появление белого шара из первого ящика; событие
— появление белого шара из второго ящика; событие
— появление чёрного шара из первого ящика
, событие
— появление белого шара из второго ящика
.
Определим вероятность того, что шар, вынутый из первого ящика, белый, а из второго ящика — чёрный:
Определим вероятность того, что шар, вынутый из первого ящика, чёрный, а из второго ящика — белый:
Определим теперь вероятность того, что шар, вынутый из одного ящика (безразлично — из первого или второго), окажется белым, а шар, вынутый из другого ящика, — чёрным. Применяем теорему сложения вероятностей:
Пример № 18
Три стрелка независимо друг от друга стреляют по цели. Вероятность попадания в цель для первого стрелка равна 0,75, для второго — 0,8, для третьего — 0,9. Определить вероятность того, что в цель попадёт хотя бы один стрелок.
Решение:
Здесь (вероятность промаха первого стрелка);
(вероятность промаха второго стрелка);
(вероятность промаха третьего стрелка); тогда
— вероятность одновременного промаха всех трёх стрелков — определится следующим образом:
Но событие, противоположное событию , заключается в поражении цели хотя бы одним стрелком. Следовательно, искомая вероятность
Формула полной вероятности
Теорема. Вероятность события , которое может наступить при условии появления одного из несовместных событий
образующих полную группу и называемых гипотезами, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события
:
Пример № 19
Студент знает только 10 из 25 экзаменационных билетов. В каком случае вероятность сдать экзамен больше: когда студент подходит тянуть билет первым или вторым по счету?
Решение:
Обозначим события: — вытягивает выученный билет, подходя первым;
— вытягивает выученный билет, подходя вторым.
(число благоприятствующих исходов равно числу выученных билетов; число всех элементарных исходов равно числу билетов). Событие может наступить при появлении одного из двух несовместных событий
(первый взятый билет был известен нашему студенту) и
(первый взятый билет был невыученный билет). По формуле полной вероятности
Так как
то вероятность одинакова.
Пример № 20
Имеются 4 урны. В первой урне 1 белый и 1 чёрный шар, во второй -2 белых и 3 чёрных шара, в третьей — 3 белых и 5 чёрных шаров, в четвёртой -4 белых и 7 чёрных шаров. Событие — выбор
-той урны
. Известно, что вероятность выбора
-той урны равна
, т.е.
,
Выбирают наугад одну из урн и вынимают из неё шар. Найти вероятность того, что этот шар белый.
Решение:
Из условия следует, что (условная вероятность извлечения белого шара из первой урны); аналогично
. Вероятность извлечения белого шара находим по формуле полной вероятности:
Пример № 21
В первой урне 5 белых и 10 чёрных шаров, во второй — 3 белых и 7 чёрных шаров. Из второй урны в первую переложили один шар, а затем из первой урны вынули наугад один шар. Определить вероятность того, что вынутый шар — белый.
Решение:
Обозначим события: — вынули белый шар из первой урны после того, как в неё переложили шар из второй урны;
— из второй урны в первую переложили белый шар;
— из второй урны в первую переложили чёрный шар.
Если из второй урны в первую переложили белый шар, то в первой урне стало 16 шаров, из них 6 белых, поэтому
Если переложили чёрный шар, то в первой урне стало 16 шаров, из них 5 белых, поэтому
По формуле полной вероятности
Формула Байеса
Пусть событие может наступить при условии появления одного из несовместных событий
образующих полную группу. Тогда условная вероятность любого события
при условии, что событие
уже произошло, вычисляется по формуле Байеса:
Пример № 22
В первой урне 4 белых и 6 чёрных шаров, во второй — 5 белых и 4 чёрных. Из первой урны во вторую перекладывают, не глядя, один шар, после чего из второй урны извлекают один шар. Найти вероятность, что этот шар белый. Какова вероятность, что из первой во вторую урну был переложен чёрный шар, если извлечённый из второй урны шар оказался белым?
Решение:
Пусть — событие, состоящее в том, что извлечённый шар из второй урны оказался белым,
— из первой урны во вторую переложили белый шар,
— чёрный.
и
— гипотезы.
Найдем
Если переложили белый шар, то во второй урне стало 10 шаров, из них 6 белых 6
если чёрный, то шаров так же 10, но белых 5, тогда
По формуле полной вероятности
По формуле Байеса:
Схема Бернулли
Испытания называются независимыми относительно события , если при нескольких испытаниях вероятность события
не зависит от исходов других испытаний.
Говорят, что испытания проводятся по схеме Бернулли, если для них выполняются следующие условия:
1) испытания независимы;
2) количество испытаний известно заранее;
3) в результате испытания может произойти только два исхода: «успех» или «неуспех»;
4) вероятность «успеха» в каждом испытании одна и та же. Вероятность того, что при испытаниях «успех» осуществится ровно
раз и, следовательно, «неуспех»
раз, вычисляется по следующей формуле:
где — число сочетаний из
элементов по
;
— вероятность «успеха»;
— вероятность «неуспеха»
Данная формула называется формулой Бернулли.
Пример № 23
В урне 20 белых и 10 чёрных шаров. Вынули подряд 4 шара, причём каждый вынутый шар возвращают в урну перед извлечением следующего, и шары в урне перемешивают. Какова вероятность того, что из четырёх вынутых шаров окажется два белых?
Решение:
Вероятность извлечения белого шара можно считать одной и той же во всех четырёх испытаниях;
. Используя формулу Бернулли, получаем
Пример № 24
Вероятность появления события равна 0,4. Какова вероятность того, что при 10 испытаниях событие А появится не более трёх раз?
Решение:
Здесь
Имеем:
Вероятность того, что событие появится не больше трёх раз, составляет
Полагая
получим
Пример № 25
В семье пять детей. Найти вероятность того, что среди этих детей два мальчика. Вероятность рождения мальчика принять равной 0,51.
Решение:
Вероятность рождения мальчика равна . Следовательно, вероятность рождения девочки равна
. Искомая вероятность по формуле Бернулли равна
Локальная и интегральная теоремы Лапласа
В тех случаях, когда использование формулы Бернулли затруднено из-за большого значения п, можно использовать асимптотическую формулу из следующей теоремы.
Локальная теорема Лапласа. Вероятность того, что в независимых испытаниях, в каждом из которых вероятность появления события равна
, событие наступит ровно
раз (безразлично, в какой последовательности), приближенно равна (тем точнее, чем больше
)
Здесь
Имеются таблицы, в которых помещены значения функции
соответствующие положительным значениям аргумента (приложение, табл. 1). Для отрицательных значений аргумента пользуются теми же таблицами, т.к. функция
четна, т.е.
. При
.
Интегральная теорема Лапласа. Вероятность того, что в п независимых испытаниях, в каждом из которых вероятность появления события равна , событие наступит не менее
раз и не более
раз, приближенно равна
Здесь
функция Лапласа,
Имеются таблицы функции Лапласа (приложение, табл. 2) для положительных значений ; для значений
полагают
. Для отрицательных значений используют эту же таблицу, учитывая, что функция Лапласа нечетна, т.е.
Пример № 26
Вероятность рождения мальчика равна 0,51. Найти вероятность того, что среди 100 новорожденных окажется 50 мальчиков.
Решение:
По условию задачи
Так как — достаточно большое число, воспользуемся локальной теоремой Лапласа:
Найдем значение :
По справочным таблицам (см. приложение, табл.1) найдем
(т.к. функция — четная).
Искомая вероятность
Пример № 27
Вероятность поражения мишени стрелком при одном выстреле равна 0,8. Найти вероятность того, что при 100 выстрелах мишень будет поражена не менее 75 раз и не более 90 раз.
Решение:
По условию задачи
Воспользуемся интегральной теоремой Лапласа:
где — функция Лапласа,
Вычислим и
:
Так как функция Лапласа нечетна, т.е.
получим
По справочным таблицам (см. приложение, табл.2) найдём:
Искомая вероятность
Наивероятнейшее число появлений события в независимых испытаниях
Число (наступление события в независимых испытаниях, в каждом из которых вероятность появления события равна
) называют наивероятнейшим, если вероятность того, что событие наступит в этих испытаниях
раз, превышает (или, по крайней мере, не меньше) вероятности остальных возможных исходов испытаний .
Наивероятнейшее число определяют из двойного неравенства
причем:
а) если число — дробное, то существует одно наивероятнейшее число
;
б) если число — целое, то существует два наивероятнейших числа, а именно
и
;
в) если число — целое, то наивероятнейшее число
.
Пример № 28
В урне 10 белых и 40 чёрных шаров. Вынимают подряд 14 шаров, причём цвет вынутого шара регистрируют, а затем шар возвращают в урну. Определить наивероятнейшее число появлений белого шара.
Решение:
Используя двойное неравенство
при указанных значениях и
получим
Таким образом, задача имеет два решения:
Пример № 29
Вероятность попадания стрелком в цель равна 0,7. Сделано 25 выстрелов. Определить наивероятнейшее число попаданий в цель.
Решение:
Здесь
Следовательно,
Так как — целое число, то
= 18.
Пример № 30
В результате многолетних наблюдений установлено, что вероятность выпадения дождя 1 октября в данном городе равна 1/7. Определить наивероятнейшее число дождливых дней 1 октября в данном городе за 40 лет.
Решение:
Имеем
Таким образом,
Пример № 31
В урне 100 белых и 80 чёрных шаров. Из урны извлекают шаров (с возвратом каждого вынутого шара). Наивероятнейшее число появлений белого шара равно 11. Найти
.
Решение:
Из двойного неравенства
следует, что
Здесь
следовательно,
Итак, задача имеет два решения:
Пример № 32
Найти наиболее вероятное число правильно набранных секретарём страниц среди 19 страниц текста, если вероятность того, что страница набрана с ошибками, равна 0,1.
Решение:
По условию задачи
Найдем наиболее вероятное число правильно набранных страниц из двойного неравенства
Подставляя данные задачи, получим
или
Так как — целое число, то наиболее вероятных чисел два:
и
Формула Пуассона
При достаточно больших , если вероятность события мала
, формула Лапласа непригодна.
В этих случаях ( велико, р <0,1) пользуются формулой Пуассона: вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно
раз, приближенно равна
Здесь Имеются таблицы для вычисления
, для различных
и
(приложение, табл. 3).
Пример № 33
Прядильщица обслуживает 1000 веретен. Вероятность обрыва нити на одном веретене в течение 1 минуты равна 0,004. Найти вероятность того, что в течение 1 минуты обрыв произойдет на пяти веретенах.
Решение:
Так как вероятность очень мала, применение локальной теоремы Лапласа приведет к значительному отклонению от точного значения
. Поэтому при
применяют формулу Пуассона:
где
По условию задачи
Тогда
Подставляя данные задачи, получим
Замечание. Формулы Бернулли, Пуассона и формула, следующая из локальной теоремы Лапласа, служат для нахождения вероятности, что в испытаниях, проводимых по схеме Бернулли, «успех» наступит ровно
раз. Для удобства сведём их в одну таблицу.
Случайная величина
Случайной величиной называется переменная величина, значения которой зависят от случая. Примеры случайных величин: число попаданий в мишень при данном числе выстрелов; число очков, выпадающее при бросании игральной кости.
Случайная величина, возможные значения которой можно перенумеровать, называется дискретной. При этом число значений может быть конечным или бесконечным.
Непрерывной называется случайная величина, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Очевидно, число возможных значений непрерывной случайной величины — бесконечно.
Закон распределения дискретной случайной величины
Для характеристики случайной величины нужно знать совокупность возможных значений этой величины, а также вероятности, с которыми эти значения могут появиться. Эти данные образуют закон распределения случайной величины. Закон распределения дискретной случайной величины может быть задан в виде таблицы, первая строка которой содержит возможные значения
а вторая — вероятности
:
где
Если множество возможных значений бесконечно, то ряд
сходится и его сумма равна единице.
Закон распределения дискретной случайной величины может быть задан аналитически (в виде формулы)
или с помощью функции распределения (см. §20).
Закон распределения дискретной случайной величины можно изобразить графически, для чего в прямоугольной системе координат строят точки — возможные значения
— соответствующие вероятности) и соединяют их отрезками прямых. Полученную фигуру называют многоугольником или полигоном распределения вероятностей.
Числовые характеристики дискретных случайных величин
Математическим ожиданием дискретной случайной величины называется сумма произведений всех ее возможных значений на их вероятности:
Если дискретная случайная величина принимает бесконечное множество возможных значений, то
причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно.
Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
Дисперсию удобно вычислять по формуле
Средним квадратическим отклонением случайной величины называется квадратный корень из дисперсии:
Свойства математического ожидания
Свойство 1. Математическое ожидание постоянной величины равно самой постоянной:
Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:
Свойство 3. Математическое ожидание произведения взаимно независимых случайных величин равно произведению математических ожиданий сомножителей:
Свойство 4. Математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых:
Свойства дисперсии
Свойство 1. Дисперсия постоянной равна нулю:
Свойство 2. Постоянный множитель можно выносить за знак дисперсии, предварительно возведя в квадрат:
Свойство 3. Дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых:
Примеры дискретных распределений
Биномиальным называют закон распределения дискретной случайной величины — числа появлений «успеха» в
независимых испытаниях (возможные значения случайной величины
), в каждом из которых вероятность появления «успеха» равна
, вероятность возможного значения
(числа
появлений «успеха») вычисляют по формуле Бернулли:
Математическое ожидание биномиального распределения равно произведению числа испытаний на вероятность появления события в одном испытании:
Дисперсия биномиального распределения равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании:
Если число испытаний велико, а вероятность появления события в каждом испытании очень мала, то используют приближенную формулу
где — число появлений события в
независимых испытаниях,
, и говорят, что случайная величина распределена по закону Пуассона.
Пример № 34
Производится независимых испытаний, в каждом из которых некоторое событие
наступает с вероятностью
— число наступлений события
в
испытаниях. Для случая 1) малого
построить ряд распределения, функцию распределения случайной величины
, найти
и
; 2) большого
и малого
найти
приближённо с помощью распределения Пуассона; 3) большого
найти вероятность
.
Решение:
1)
Возможные значения случайной величины : 0,1,2,3,4. Пусть им соответствуют вероятности
Найдём их, используя формулу Бернулли:
Таким образом, ряд распределения имеет следующий вид:
По определению функция распределения находится по формуле
Найдем
2)
По формуле Пуассона
Таким образом, имеем:
(значения найдены по табл. 3 приложения).
3)
По условию задачи
Воспользуемся интегральной теоремой Лапласа:
где — функция Лапласа,
Вычислим и
:
Так как функция Лапласа нечетна, т.е. , получим
По табл.2 приложения найдем:
Искомая вероятность
Функция распределения вероятностей случайной величины
Функцией распределения называется функция , определяющая для каждого значения
вероятность того, что случайная величина
примет значение, меньшее
, т.е.
Свойства функции распределения:
Свойство 1. Значения функции распределения принадлежат отрезку .
Свойство 2. Функция распределения есть неубывающая функция:
Следствие 1. Вероятность того, что случайная величина примет значение, заключенное в промежутке
, равна приращению функции распределения на этом интервале:
Следствие 2. Вероятность того, что непрерывная случайная величина примет одно определенное значение
, равна нулю:
Свойство 3. Если все возможные значения случайной величины принадлежат интервалу
, то
при
при
. Следствие. Справедливы следующие предельные соотношения:
Свойство 4. Функция распределения непрерывна слева:
Пример № 35
В тёмной комнате 7 красных кубиков и 8 синих, не отличаемых друг от друга на ощупь. Мальчик вынес три кубика. — случайная величина числа красных кубиков среди вынесенных. Найти закон распределения, математическое ожидание и дисперсию случайной величины
. Построить график функции распределения
и найти вероятность
.
Решение:
Возможные значения случайной величины : 0,1,2,3. Пусть им соответствуют вероятности
. Найдём их, используя непосредственный подсчёт:
Проверка
Таким образом, закон распределения имеет вид:
Найдем
Дисперсию будем искать по формуле
Составим закон распределения для .
По определению функция распределения находится по формуле
Построим график функции распределения:
IIo функции распределения
Плотность распределения вероятностей непрерывной случайной величины
Плотностью распределения вероятностей непрерывной случайной величины называется первая производная от функции распределения:
Вероятность того, что непрерывная случайная величина примет значение, принадлежащее интервалу
, определяется равенством
Зная плотность распределения, можно найти функцию распределения
Свойства плотности распределения:
Свойство 1. Плотность распределения неотрицательна, т.е. .
Свойство 2. Несобственный интеграл от плотности распределения по всей числовой оси равен единице:
Числовые характеристики непрерывных случайных величин
Математическое ожидание непрерывной случайной величины , возможные значения которой принадлежат всей оси
, определяется равенством
, где
— плотность распределения случайной величины
.
Предполагается, что интеграл сходится абсолютно.
Дисперсия непрерывной случайной величины , возможные значения которой принадлежат всей оси
, определяется равенством
или равносильным равенством
Среднее квадратическое отклонение непрерывной случайной величины определяется так же, как и для дискретной величины:
Все свойства числовых характеристик, указанные для дискретных случайных величин, сохраняются и для непрерывных величин.
Пример № 36
Дана функция плотности распределения
Найти: 1) параметр ; 2) построить графики плотности и функции распределения; 3)
; 4)
5) вероятность
, что отклонение случайной величины от
не более 1.
Решение:
Так как
получаем
так как
тогда
Итак,
Найдём , функцию распределения по формуле
Итак,
Построим оба графика
Найдем
Так как
Найдём по формуле
Дисперсия вычисляется по формуле
Среднее квадратическое отклонение
Найдем
Так как
следует
в нашей задаче
или
то необходимо найти
Примеры непрерывных распределений
Равномерным называется распределение вероятностей непрерывной случайной величины , если на интервале
, которому принадлежат все возможные значения
, плотность сохраняет постоянное значение, а именно
; вне этого интервала
Математическое ожидание случайной величины, равномерно распределенной в интервале , равно полусумме концов этого интервала:
Дисперсия случайной величины, равномерно распределенной в интервале , определяется равенством
Нормальным называется распределение вероятностей непрерывной случайной величины , плотность которого имеет вид
где — математическое ожидание,
— среднее квадратическое отклонение
. Для случайной величины
, распределенной по нормальному закону, вероятность того, что
примет значение, принадлежащее интервалу
, вычисляется по формуле
— функция Лапласа.
Функция распределения случайной величины находится по формуле
а вероятность отклонения нормально распределённой случайной величины от её математического ожидания менее чем на 8 равна:
Правило трёх сигм. Если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения с вероятностью 0,9973.
Пример № 37
Масса вагона — случайная величина, распределённая по нормальному закону с математическим ожиданием 65 т и средним квадратичным отклонением 0,9 т. Найти вероятность того, что вагон имеет массу не более 67 т и не менее 64 т. По правилу трёх сигм найти наибольшую и наименьшую границы предполагаемой массы.
Решение:
Для нормального распределённой случайной величины
По правилу трёх сигм наименьшая граница , наибольшая граница
. Таким образом,
.
Наименьшая граница 62,3 т, наибольшая 67,7 т.
Закон больших чисел
Неравенство Чебышева. Вероятность того, что отклонение случайной величины от ее математического ожидания по абсолютной величине меньше положительного числа
, не меньше чем
:
Теорема Чебышева. Если последовательность попарно независимых случайных величин имеет конечные математические ожидания и дисперсии этих величин равномерно ограничены (не превышают постоянного числа
), то среднее арифметическое случайных величин сходится по вероятности к среднему арифметическому их математических ожиданий, т.е. если
— любое положительное число, то
Теорема Бернулли (Закон больших чисел). Если в каждом из независимых испытаний вероятность
появления события
постоянна, то как угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности
по абсолютной величине будет сколь угодно малым, если число испытаний достаточно велико, т.е.
где — любое сколь угодно малое положительное число.
Центральная предельная теорема
Теорема Ляпунова. Если случайные величины в последовательности … независимы, одинаково распределены и имеют конечное математическое ожидание
, и дисперсию
, то для любого действительного
где
функция распределения случайной величины
Системы случайных величин
Часто результат опыта описывается не одной случайной величиной , а несколькими случайными величинами:
. В этом случае принято говорить, что указанные случайные величины образуют систему
Систему двух случайных величин можно изобразить случайной точкой на плоскости.
Событие, состоящее в попадании случайной точки в область
, принято обозначать в виде
.
Закон распределения системы двух дискретных случайных величин может быть задан с помощью таблицы
где — вероятность события, заключающегося в одновременном выполнении равенств
При этом
Таблица может содержать бесконечное множество строк и столбцов.
Функцией распределения -мерной случайной величины
называется функция
, выражающая вероятность совместного выполнения
неравенств
т.е.
Примечание. Функцию называют также совместной функцией распределения случайных величин
.
В двумерном случае для случайной величины функция распределения
определяется равенством
. Геометрически функция распределения
означает вероятность попадания случайной точки
в бесконечный квадрант, лежащий левее и ниже точки
. Правая и верхняя границы области в квадрант не включаются — это означает, что функция распределения непрерывна слева по каждому из аргументов.
В случае дискретной двумерной случайной величины её функция распределения определяется по формуле:
где суммирование вероятностей распространяется на все , для которых
, и все
, для которых
.
Отметим свойства функции распределения двумерной случайной величины, аналогичные свойствам функции распределения одномерной случайной величины.
где и
— функции распределения случайных величин
и
, т.е.
.
Закон распределения системы непрерывных случайных величин будем задавать с помощью функции плотности вероятности
. Плотностью вероятности (плотностью распределения или совместной плотностью) непрерывной двумерной случайной величины
называется вторая смешанная частная производная её функции распределения, т.е.
Вероятность попадания случайной точки в область
определяется равенством
Функция плотности вероятности обладает следующими свойствами:
Если все случайные точки принадлежат конечной области
, то последнее условие принимает вид
Математические ожидания дискретных случайных величии и
, входящих в систему, определяются по формулам
а математические ожидания непрерывных случайных величин — по формулам
Точка называется центром рассеивания системы случайных величин
.
Математические ожидания и
. можно найти и проще, если случайные величины
и
независимы. В этом случае из законов распределения этих случайных величин можно определить математические ожидания
и
по формуле, приведенной в §16 для дискретных случайных величин и в §22 для непрерывных случайных величин.
Дисперсии дискретных случайных величин и
определяются по формулам
Дисперсии же непрерывных случайных величии и
, входящих в систему, находятся по формулам
Средние квадратические отклонения случайных величин и
определяются по формулам
Для вычисления дисперсий могут быть применены формулы
Важную роль в теории систем случайных величин играет так называемый корреляционный момент (коваркация)
Для дискретных случайных величин корреляционный момент находится по формуле
а для непрерывных — по формуле
Случайные величины и
называются независимыми, если вероятность одной из них принять значение, лежащее в любом промежутке области её значений, не зависит от того, какое значение приняла другая величина. В этом случае
Ковариация двух случайных величин характеризует как степень зависимости случайных величин, так и их рассеяние вокруг точки .
Свойства ковариации случайных величин:
Здесь
для дискретных случайных величин и
и
для непрерывных величин.
- Ковариация двух независимых случайных величин равна нулю, т.е.
- Ковариация двух случайных величин по абсолютной величине не превосходит произведения их средних квадратических отклонений, т.е.
Для характеристики связи между величинами и
рассматривается так называемый коэффициент корреляции
являющийся безразмерной величиной. Свойства коэффициента корреляции:
Пример № 38
В двух ящиках находятся по шесть шаров; в первом ящике: 1 шар с №1,2 шара с №2, 3 шара с №3; во втором ящике: 2 шара с №1, 3 шара с №2, 1 шар с №3. Пусть — номер шара, вынутого из первого ящика.
— номер шара, вынутого из второго ящика. Из каждого ящика вынули по шару. Составить таблицу закона распределения системы случайных величин
. Найти математические ожидания и дисперсии случайных величин
и
. Определить коэффициент корреляции.
Решение:
Случайная точка (1,1) имеет кратность 1 х 2 = 2;
Всего случайных точек 6×6 = 36 (-кратную точку принимаем за
точек). Так как отношение кратности точки ко всему количеству точек равно вероятности появления этой точки, то таблица закона распределения системы случайных величин имеет вид
Сумма всех вероятностей, указанных в таблице, равна единице. Найдём математические ожидания случайных величин и
Точка (7/3; 11/6) является центром рассеивания для заданной системы .
Так как случайные величины и
независимы, то математические ожидания
и
можно подсчитать проще, используя ряды распределения:
Отсюда находим
От системы величин перейдём к системе центрированных величин
, где
Составим таблицу
Имеем
Отсюда
Заметим, что и
можно найти по формулам
Для нахождения коэффициента корреляции воспользуемся таблицей распределения системы центрированных случайных величин. Определим ковариацию:
Так как , то и коэффициент корреляции
.
Этот же результат мы могли получить и не определяя ковариации . Действительно, полагая
, получаем, что значение
повторяется 2 раза, значение
= 2 — 4 раза, а значение
= 3 — 6 раз. Значит при
получаем ряд распределения случайной величины
:
Если , то значение
повторяется 3 раза, значение
= 2-6 раз, а значение
= 3-9 раз. Следовательно, при
получается ряд распределения случайной величины
:
Наконец, если = 3, то значение
= 1 повторяется 1 раз, значение
= 2 -2 раза, а значение
= 3 — 3 раза. Ряд распределения случайной величины
при
= 3 имеет вид
Итак, при различных значениях получаем один и тот же ряд распределения случайной величины
. Так как ряд распределения случайной величины
не зависит от значений случайной величины
, то случайные величины
и
независимы. Отсюда следует, что коэффициент корреляции равен нулю.
Пример № 40
Система случайных величин подчинена закону распределения с плотностью
Область — квадрат, ограниченный прямыми
. Требуется: 1) определить коэффициент
; 2) вычислить вероятность попадания случайной точки
в квадрат
, ограниченный прямыми
3) найти математические ожидания
и
; 4) найти средние квадратические отклонения
и
.
Решение:
1. Коэффициент находим из уравнения
Находим математические ожидания и
; имеем
Следовательно, и
Находим средние квадратические отклонения и
:
Итак,
Предмет математическая статистика
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных — результатах наблюдений.
Первая задача математической статистики — указать способы сбора и группировки (если данных очень много) статистических сведений.
Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от целей исследования.
Основные понятия математической статистики
Генеральная совокупность — совокупность всех изучаемых объектов, — её объём (количество всех объектов).
Выборочная совокупность — совокупность объектов, отобранных для изучения, — объём выборки.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.
Таким образом, вместо большой совокупности объектов изучается совокупность объёма, значительно меньшего по количеству объектов . Результаты, полученные при изучении выборки, распространяются на объекты всей генеральной совокупности. Для этого выборка должна быть репрезентативной (представительной), то есть правильно представлять генеральную совокупность. Это обеспечивается случайностью отбора.
Виды отбора:
- простой случайный: повторный; бесповторный;
- сложный случайный: типический; механический; серийный.
Простой случайный отбор — производится без деления генеральной совокупности на части.
Повторный отбор — отобранный объект возвращается в генеральную совокупность.
Бссповторный отбор — отобранный объект не возвращается в генеральную
Сложный случайный отбор — производится после предварительного деления генеральной совокупности на части.
Типический отбор — генеральная совокупность делится на типы, из каждого типа случайно отбираются объекты пропорционально объёму типов. Механический отбор — генеральная совокупность делится на части механически, из каждой части случайно отбираются объекты.
Серийный отбор — генеральная совокупность делится на серии, и случайным образом отбираются целые серии объектов.
Статистическое распределение выборки и его характеристики
Пусть из генеральной совокупности извлечена выборка, причем наблюдалось
раз,
раз,
раз
— объем выборки. Наблюдаемые значениях, называют вариантами, а последовательность вариант, записанных в возрастающем порядке, — вариационным рядом. Числа наблюдений называются частотами, а их отношения к объему выоорки —
относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.
Результаты выборки представляются в виде статистического распределения:
где
— варианты;
— соответствующие им частоты;
— объём выборки;
— относительные частоты.
Распределение относительных частот:
Основные характеристики выборки:
— выборочная средняя;
— выборочная дисперсия;
— выборочное среднее квадратичное отклонение;
— исправленная дисперсия.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения
относительную частоту события
:
где — число вариант, меньших
— объем выборки.
Полигон и гистограмма
Полигон абсолютных частот — это ломаная, отрезки которой соединяют точки
Пример:
Полигон относительных частот — это ломаная, отрезки которой соединяют точки
Пример:
Статистическое распределение может носить интервальный (непрерывный) характер.
Пример:
— длина частичного интервала.
Гистограмма частот — ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты равны отношению
(плотность частоты).
Пример № 41
В результате испытания случайная величина приняла следующие значения
Требуется: 1) составить таблицу, устанавливающую зависимость между значениями случайной величины и её частотами; 2) построить статистическое распределение; 3) изобразить полигон распределения.
Решение:
1. Найдём объём выборки: . Составим таблицу
Статистическое распределение имеет вид
Контроль
Последнюю таблицу можно переписать в виде
Возьмём на плоскости точки (1; 0,04), (2; 0,08), (3; 0,12) и т.д. Последовательно соединив эти точки прямолинейными отрезками, получим полигон распределения случайной величины
.
Пример № 42
В результате испытания случайная величина приняла следующие значения
Требуется: составить таблицу статистического распределения, разбив промежуток (0, 25) на пять участков, имеющих одинаковые длины; построить гистограмму одинаковых частот.
Решение:
Предварительно составим таблицу
Статистическое распределение имеет вид
Гистограмма относительных частот изображена на рисунке
Точечные оценки параметров генеральной совокупности
Точечной называют оценку, которая определяется одним числом. Оценка параметра
называется несмещённой, если её математическое ожидание равно оцениваемому параметру, т.е.
. В противном случае оценка называется смещённой.
Оценка параметра
называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:
В случае использования состоятельных оценок оправдывается увеличение объёма выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельна, то практически достоверно, что при достаточно большом
Несмещённая оценка параметра
называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещённых оценок параметра
, вычисленных по выборкам одного и того же объёма
. Параметры генеральной совокупности
— генеральная средняя и
— генеральная дисперсия оцениваются по соответствующим параметрам выборки:
Пример № 43
Объем выборки:
или
Таким образом, точечные оценки характеристик генеральной совокупности
Для интервального распределения сначала находят середины интервалов .
Пример № 44
Переходим к дискретному распределению
Дальнейшие вычисления проводим, как в предыдущем примере. Получаем:
Таким образом:
Интервальная оценка (доверительный интервал) для генеральной средней
Интервальной называют оценку, которая определяется двумя числами -концами интервала.
Доверительным интервалом для параметра называется интервал
, содержащий истинное значение 9 с заданной вероятностью
, т.е.
Число называется доверительной вероятностью (надежностью), а значение
— уровнем значимости.
Интервальной оценкой (с надежностью ) математического ожидания а нормально распределенного количественного признака
по выборочной средней
при известном среднем квадратическом отклонении
служит доверительный интервал
где — объем выборки;
— значение аргумента функции Лапласа
(см. приложение, табл. 2), при котором
.
— генеральная средняя (оцениваемый параметр);
— средняя выборочная, точечная оценка генеральной средней;
— точность оценки,
— надёжность оценки.
— доверительный интервал для
.
с вероятностью (надёжностью)
.
Для нормального распределения признака
где — объём выборки;
— находят из соотношения
с помощью табл. 2 (см. приложение). Таким образом, для нормально распределённой величины
:
Чем больше , тем меньше
, то есть точность оценки увеличивается при увеличении объёма выборки.
Чем выше — надёжность оценки, тем меньше её точность (
увеличивается).
Если неизвестно, то
где
— исправленная выборочная дисперсия,
находится из табл. 4 (приложение) по заданным значениям
и
.
Интервальной оценкой (с надежностью ) среднего квадратического отклонения
нормально распределенного качественного признака
по «исправленному» выборочному среднему квадратическому отклонению
служит доверительный интервал
где — «исправленное» выборочное среднее квадратическое отклонение;
находят по табл. 5 приложения по заданным
и
.
Пример № 45
Найти доверительный интервал для оценки неизвестного математического ожидания «а» нормально распределённого признака, если известны:
Решение:
Из таблицы
Доверительный интервал
Пример № 46
Найти минимальный объём выборки, при котором с надёжностью 0,95 точность оценки математического ожидания нормально распределённого признака по выборочной средней будет равна 0,2, если среднее квадратическое отклонение равно 2.
Решение:
Дано:
найти .
Из формулы
находим
Из условия
находим
Тогда
Пример № 47
По заданным значениям характеристик нормально распределённого признака найти доверительный интервал для оценки неизвестного математического ожидания:
Решение:
. Из табл. 4 по данным
и
находим
. Тогда
Доверительный интервал (16,8 — 0,95; 16,8 + 0,95) = (15,85; 17,75).
Понятие о критериях согласия
Статистической называется гипотеза о неизвестном законе распределения случайной величины или о параметрах закона распределения, вид которого известен.
Нулевой (основной) гипотезой называется выдвинутая гипотеза .
Конкурирующей (альтернативной) гипотезой называется гипотеза , которая противоречит нулевой гипотезе
.
Пусть имеется статистическое распределение выборки для случайной величины :
По виду полигона или гистограммы, сравнивая их с графиками дифференциальных функций распределения, делаем предположение о виде закона распределения случайной величины.
Сделанное предположение (гипотеза) подтверждается расчётами критерия согласия.
Имеются различные критерии согласия: Хинчина, Колмогорова, Пирсона. Например, критерий Пирсона (хи-квадрат)
позволяет сравнивать близость частот — данного статистического распределения с теоретическими частотами
, найденными с помощью функции распределения предполагаемого закона:
где — дифференциальная,
— интегральная функции предполагаемого распределения.
Если вычисленное значение критерия не превосходит некоторого критического значения
взятого по таблице, то выдвинутая гипотеза принимается с заданным уровнем надёжности (вероятности)
. В противном случае гипотеза отвергается. В табл. 6 приложения:
— уровень значимости, это вероятность отвергнуть гипотезу;
— число степеней свободы,
, где
— число параметров предполагаемого распределения:
для нормального распределения (
и
),
для показательного распределения (
).
При проверке гипотезы возможны следующие ошибки: ошибка первого рода — отвергнуть гипотезу
при её правильности; ошибка второго рода — принятие гипотезы
при правильности альтернативной гипотезы
.
Виды зависимостей между случайными величинами X и Y
— количественные признаки, связанные между собой.
— их возможные значения.
Функциональная зависимость — каждому значению признака соответствует единственное значение признака
. Статистическая зависимость — каждому значению признака
соответствует статистическое распределение признака
:
Корреляционная зависимость — каждому значению признака соответствует среднее значение признака
(условная средняя
):
Аналогично:
— уравнение регрессии
по
.
— уравнение регрессии
по
.
Примеры: площадь квадрата есть функция от длины стороны квадрата
:
, зависимость функциональная.
Товарооборот магазина зависит от числа торговых работников
. Эта зависимость корреляционная. Две основные задачи теории корреляции:
- Определить форму корреляционной связи, то есть определить вид уравнения регрессии.
- Оценить тесноту (силу) корреляционной связи.
Корреляционная таблица
Все наблюдения числовых признаков и
с соответствующими частотами записываются в корреляционную таблицу.
Пример № 48
Числа 1; 3; 5 (левый столбец таблицы) показывают наблюдаемые значения признака . Числа 2; 4; 6 (первая строка) показывают наблюдаемые значения признака
.
Числа внутри таблицы показывают частоту появления соответствующей пары значений . Например, пара (1; 2) наблюдалась 2 раза, пара (3; 4) — 5 раз, пара (1; 4) не наблюдалась ни разу (соответствующая частота равна 0).
По данным наблюдений вычислены частоты :
— частота появления данного значения
,
— частота появления данного значения
,
— объём выборки, количество всех наблюдаемых пар
.
Так, значение = 1 наблюдалось 2 + 4 = 6 раз; значение
= 5 наблюдалось 3 + 9 + 3 = 15 раз и т.д. Объём выборки
= 6 + 11 + 15 + 32 или
= 5 + 14 + 13 + 32.
В общем виде корреляционная таблица выглядит так:
Условные средние по :
Условные средние по :
Виды уравнений регрессии
В случаях 1-5 параметры линейной зависимости находятся по формулам, указанным в следующем параграфе. Для случая 6 применяется непосредственно метод наименьших квадратов.
Пример № 49
Дана таблица
Определить коэффициент корреляции и уравнения линий регресии.
Решение:
Составим расчётную таблицу:
Из таблицы получаем:
Теперь находим
Вычисляем значение произведения
так как
то связь достаточно обоснована. Уравнения линий регрессии:
Построив точки, определяемые таблицей, и линии регрессии, видим, что обе линии регрессии проходят через точку (0,7029; 1,5782). Первая линия отсекает на оси ординат отрезок 3,0329, а вторая — на оси абсцисс отрезок 1,4566. Точки
расположены близко к линиям регрессии.
Метод наименьших квадратов
Служит для нахождения параметров уравнения регрессии. Пусть даны соответствующие значения рассматриваемых признаков и
:
Подберём функцию , наилучшим образом отражающую зависимость между признаками
и
.
Подставляя в функцию, получим теоретическое значение
(обозначим
):
— отклонения теоретических значений
от эмпирических значений
.
Суть метода наименьших квадратов: параметры выбранной функции находят так, чтобы сумма квадратов отклонений теоретических значений от эмпирических была наименьшей, т.е.
Нахождение параметров уравнения линейной регрессии:
Из системы нормальных уравнений:
Показатели тесноты корреляционной связи
— корреляционное отношение (для линейной и нелинейной связи).
— коэффициент корреляции (только для линейной связи). Свойства:
Формулы для вычислении:
— корреляционное отношение
к
, где
межгрупповая дисперсия, характеризует разброс условных средних
от общей средней
— общая дисперсия, характеризует разброс фактических данных от их общей средней
.
— корреляционное отношение
к
, где
— межгрупповая дисперсия, характеризует разброс условных средних
от общей средней
— общая дисперсия, характеризует разброс фактических данных
от их общей средней
Кстати дополнительная теория из учебников по теории вероятности тут.
Пример составления уравнения линейной регрессии и оценки тесноты корреляционной связи
Пусть — оценка студента по математике в школе,
— оценка по математике в первом семестре.
В результате опроса составлена следующая корреляционная таблица:
Оценить тесноту корреляционной связи между и
, вычислив коэффициент корреляции
. Составить уравнение линейной регрессии
по
.
Решение:
Для вычисления найдём
Общие средние:
- Это уравнение выражает зависимость средней оценки по математике в первом семестре от оценки в школе.
Аналогично, — уравнение регрессии
по
.
Тогда,
Построим прямые регрессии по
и
по
. Они всегда проходят через точку
.
Чем теснее связь между признаками и
, тем ближе друг к другу расположены прямые регрессии (угол между ними мал). Прямые совпадают, если связь между
и
функциональная.
Основы комбинаторики
Факториалом целого положительного числа (обозначается
!) называется произведение
Основное свойство факториала: .
Размещениями из элементов по
называются такие соединения по
элементов, которые отличаются друг от друга самими элементами или их порядком. Число всех размещений из и различных элементов по к (обозначается
):
Перестановками из элементов называются их соединения, отличающиеся друг от друга только порядком входящих в них элементов. Число всех перестановок из
различных элементов (обозначается
):
Если среди элементов
имеются одинаковые (
повторяется
раз,
—
раз,
раз и т.д.), то
Сочетаниями из элементов по
называются их соединения, отличающиеся друг от друга только самими элементами. Число всех сочетаний из
различных элементов по
(обозначается
):
Основное свойство сочетаний:
Основной закон комбинаторики. Пусть нужно провести к действий, причём первое действие можно провести способами, второе —
способами,…,
-е-
способами. Тогда все действия можно провести
способами.
Возможно эти страницы вам будут полезны:
- Решение задач по теории вероятностей
- Помощь по теории вероятности
- Заказать работу по теории вероятности
- Контрольная работа по теории вероятности
- Курсовая работа по теории вероятности
- Решение задач по математической статистике
- Помощь по математической статистике
- Заказать работу по математической статистике
- Контрольная работа по математической статистике
- Курсовая работа по математической статистике
- Теория вероятностей краткий курс для школьников и студентов (заочников)
Лучшее спасибо — порекомендовать эту страницу
При решении вероятностных задач часто приходится сталкиваться с ситуациями, в которых одно и тоже испытание повторяется многократно и исход каждого испытания независим от исходов других. Такой эксперимент еще называется схемой повторных независимых испытаний или схемой Бернулли.
Примеры повторных испытаний:
- бросание монеты или игрального кубика (вероятности выпадения герба/решки или определенной цифры одинаковы в каждом броске);
- извлечение из урны шара при условии, что вынутый шар после записи его цвета кладется обратно в урну (то есть состав
шаров в урне не меняется и не меняется вероятность вынуть шар нужного цвета); - включение приборов (ламп, станков и т.п.) с заранее заданной одинаковой вероятностью выхода из строя каждого;
- повторение стрелком выстрелов по одной и той же мишени при условии, что вероятность удачного попадания при каждом выстреле принимается одинаковой и т.д.
Итак, пусть в результате испытания возможны два исхода: либо появится событие А, либо противоположное ему событие. Проведем $n$ испытаний Бернулли. Это означает, что все $n$ испытаний независимы; вероятность появления события $А$ в каждом отдельно взятом или единичном испытании постоянна и от испытания к испытанию не изменяется (т.е. испытания проводятся в одинаковых условиях). Обозначим вероятность появления события $А$ в единичном испытании буквой $р$, т.е. $p=P(A)$, а вероятность противоположного события (событие $А$ не наступило) — буквой $q=P(overline{A})=1-p$.
Тогда вероятность того, что событие $А$ появится в этих $n$ испытаниях ровно $k$ раз, выражается формулой Бернулли
$$P_n(k)=C_n^k cdot p^k cdot q^{n-k}, quad q=1-p.$$
Распределение числа успехов (появлений события) носит название биномиального распределения.
Онлайн-калькуляторы для формулы Бернулли
Некоторые наиболее популярные типы задач, в которых используется формула Бернулли, разобраны в статьях и снабжены онлайн-калькулятором, вы можете перейти к ним по ссылкам:
- Задача про партии в шахматы
- Задача про выстрелы
- Задача про мальчиков и девочек
- Задача про лотерейные билеты
- Задача о наивероятнейшем значении
- Формула Пуассона
Примеры задач с решениями
Пример. В урне 20 белых и 10 черных шаров. Вынули 4 шара, причем каждый вынутый шар возвращают в урну перед извлечением следующего и шары в урне перемешивают. Найти вероятность того, что из четырех вынутых шаров окажется 2 белых.
Решение. Событие А – достали белый шар. Тогда вероятности
,
.
По формуле Бернулли требуемая вероятность равна .
Пример. Определить вероятность того, что в семье, имеющей 5 детей, будет не больше трех девочек. Вероятности рождения мальчика и девочки предполагаются одинаковыми.
Решение. Вероятность рождения девочки , тогда
.
Найдем вероятности того, что в семье нет девочек, родилась одна, две или три девочки:
,
,
,
.
Следовательно, искомая вероятность
.
Пример. Среди деталей, обрабатываемых рабочим, бывает в среднем 4% нестандартных. Найти вероятность того, что среди взятых на испытание 30 деталей две будут нестандартными.
Решение. Здесь опыт заключается в проверке каждой из 30 деталей на качество. Событие А — «появление нестандартной детали», его вероятность , тогда
. Отсюда по формуле Бернулли находим
.
Пример. При каждом отдельном выстреле из орудия вероятность поражения цели равна 0,9. Найти вероятность того, что из 20 выстрелов число удачных будет не менее 16 и не более 19.
Решение. Вычисляем по формуле Бернулли:
Пример. Независимые испытания продолжаются до тех пор, пока событие А не произойдет k раз. Найти вероятность того, что потребуется n испытаний (n ³ k), если в каждом из них .
Решение. Событие В – ровно n испытаний до k-го появления события А – есть произведение двух следующий событий:
D – в n-ом испытании А произошло;
С – в первых (n–1)-ом испытаниях А появилось (к-1) раз.
Теорема умножения и формула Бернулли дают требуемую вероятность:
Еще больше примеров решений
Надо заметить, что использование биномиального закона при большом числе испытаний вычислительно трудно. Поэтому с возрастанием значений $n$ становится целесообразным применение приближенных формул (Пуассона, Муавра-Лапласа), которые будут рассмотрены в следующих разделах.
Видеоурок про формулу Бернулли
Для тех, кому нагляднее последовательное видеообъяснение, 15-минутный ролик: