Основы теории вероятностей и математической статистики. Математика для программистов: теория вероятностей Простое событие в теории вероятности

Будут и задачи для самостоятельного решения, к которым можно посмотреть ответы.

Теория вероятностей о видах событий и вероятности их появления

Теория вероятностей изучает виды событий и вероятности их появления. Возникновение теории вероятностей относится к середине XVII века, когда математики заинтересовались задачами, поставленными азартными игроками и стали изучать такие события, как появление выигрыша. В процессе решения этих задач выкристаллизовались такие понятия, как вероятность и математическое ожидание. Ученые того времени – Гюйгенс (1629-1695), Паскаль (1623-1662), Ферма (1601-1665) и Бернулли (1654-1705) были убеждены, что на базе массовых случайных событий могут возникать четкие закономерности. При этом для исследований было достаточно элементарных арифметических и комбинаторных действий.

Итак, теория вероятностей объясняет и исследует различные закономерности, которым подчинены случайные события и случайные величины. Событием является любой факт, который можно констатировать в результате наблюдения или опыта. Наблюдением или опытом называют реализацию определенных условий, в которых событие может состояться.

Что нужно знать, чтобы определять вероятность появления события

Все события, за которыми люди наблюдают или сами создают их, делятся на:

  • достоверные события;
  • невозможные события;
  • случайные события.

Достоверные события наступают всегда, когда создан определенный комплекс обстоятельств. Например, если работаем, то получаем за это вознаграждение, если сдали экзамены и выдержали конкурс, то достоверно можем рассчитывать на то, что включены в число студентов. Достоверные события можно наблюдать в физике и химии. В экономике достоверные события связаны с существующим общественным устройством и законодательством. Например, если мы вложили деньги в банк на депозит и выразили желание в определенный срок их получить, то деньги получим. На это можно рассчитывать как на достоверное событие.

Невозможные события определенно не наступают, если создался определенный комплекс условий. Например, вода не замерзает, если температура составляет плюс 15 градусов по Цельсию, производство не ведется без электроэнергии.

Случайные события при реализации определенного комплекса условий могут наступить и могут не наступить. Например, если мы один раз подбрасываем монету, герб может выпасть, а может не выпасть, по лотерейному билету можно выиграть, а можно не выиграть, произведенное изделие может быть годным, а может быть бракованным. Появление бракованного изделия является случайным событием, более редким, чем производство годных изделий.

Ожидаемая частота появления случайных событий тесно связана с понятием вероятности. Закономерности наступления и ненаступления случайных событий исследует теория вероятностей.

Если комплекс нужных условий реализован лишь один раз, то получаем недостаточно информации о случайном событии, поскольку оно может наступить, а может не наступить. Если комплекс условий реализован много раз, то появляются известные закономерности. Например, никогда невозможно узнать, какой кофейный аппарат в магазине потребует очередной покупатель, но если известны марки наиболее востребованных в течение длительного времени кофейных аппаратов, то на основе этих данных возможно организовать производство или поставки, чтобы удовлетворить спрос.

Знание закономерностей, которым подчинены массовые случайные события, позволяет прогнозировать, когда эти события наступят. Например, как уже ранее отмечено, заранее нельзя предусмотреть результат бросания монеты, но если монета брошена много раз, то можно предусмотреть выпадение герба. Ошибка может быть небольшой.

Методы теории вероятностей широко используются в различных отраслях естествознания, теоретической физике, геодезии, астрономии, теории автоматизированного управления, теории наблюдения ошибок, и во многих других теоретических и практических науках. Теория вероятностей широко используется в планировании и организации производства, анализе качества продукции, анализе технологических процессов, страховании, статистике населения, биологии, баллистике и других отраслях.

Случайные события обычно обозначают большими буквами латинского алфавита A, B, C и т.д.

Случайные события могут быть:

  • несовместными;
  • совместными.

События A, B, C … называют несовместными , если в результате одного испытания может наступить одно из этих событий, но невозможно наступление двух или более событий.

Если наступление одного случайного события не исключает наступление другого события, то такие события называют совместными . Например, если с ленты конвейера снимают очередную деталь и событие А означает «деталь соответствует стандарту», а событие B означает «деталь не соответствует стандарту», то A и B – несовместные события. Если событие C означает «взята деталь II сорта», то это событие совместно с событием A, но несовместно с событием B.

Если в каждом наблюдении (испытании) должно произойти одно и только одно из несовместных случайных событий, то эти события составляют полное множество (систему) событий .

Достоверным событием является наступление хотя бы одного события из полного множества событий.

Если события, образующие полное множество событий, попарно несовместны , то в результате наблюдения может наступить только одно из этих событий. Например, студент должен решить две задачи контрольной работы. Определенно произойдет одно и только одно из следующих событий:

  • будет решена первая задача и не будет решена вторая задача;
  • будет решена вторая задача и не будет решена первая задача;
  • будут решены обе задачи;
  • не будет решена ни одна из задач.

Эти события образуют полное множество несовместных событий .

Если полное множество событий состоит только из двух несовместных событий, то их называют взаимно противоположными или альтернативными событиями.

Событие, противоположное событию , обозначают . Например, в случае одного подбрасывания монеты может выпасть номинал () или герб ().

События называют равновозможными , если ни у одного из них нет объективных преимуществ. Такие события также составляют полное множество событий. Это значит, что в результате наблюдения или испытания определенно должно наступить по меньшей мере одно из равновозможных событий.

Например, полную группу событий образуют выпадение номинала и герба при одном подбрасывании монеты, наличие на одной печатной странице текста 0, 1, 2, 3 и более 3 ошибок.

Классическая и статистическая вероятности. Формулы вероятностей: классической и статистической

Классическое определение вероятности. Возможностью или благоприятным случаем называют случай, когда при реализации определённого комплекса обстоятельств события А происходят. Классическое определение вероятности предполагает напрямую вычислить число благоприятных случаев или возможностей.

Вероятностью события А называют отношение числа благоприятных этому событию возможностей к числу всех равновозможных несовместных событий N , которые могут произойти в результате одного испытания или наблюдения. Формула вероятности события А :

Если совершенно понятно, о вероятности какого события идёт речь, то тогда вероятность обозначают маленькой буквой p , не указывая обозначения события.

Чтобы вычислить вероятность по классическому определению, необходимо найти число всех равновозможных несовместных событий и определить, сколько из них благоприятны определению события А .

Пример 1. Найти вероятность выпадения числа 5 в результате бросания игральной кости.

Решение. Известно, что у всех шести граней одинаковая возможность оказаться наверху. Число 5 отмечено только на одной грани. Число всех равновозможных несовместных событий насчитывается 6, из них только одна благоприятная возможность выпадения числа 5 (М = 1). Это означает, что искомая вероятность выпадения числа 5

Пример 2. В ящике находятся 3 красных и 12 белых одинаковых по размеру мячиков. Не глядя взят один мячик. Найти вероятность, что взят красный мячик.

Решение. Искомая вероятность

Найти вероятности самостоятельно, а затем посмотреть решение

Пример 3. Бросается игральная кость. Событие B - выпадение чётного числа. Вычислить вероятность этого события.

Пример 5. В урне 5 белых и 7 чёрных шаров. Случайно вытаскивается 1 шар. Событие A - вытянут белый шар. Событие B - вытянут чёрный шар. Вычислить вероятности этих событий.

Классическую вероятность называют также априорной вероятностью, так как её рассчитывают перед началом испытания или наблюдения. Из априорного характера классической вероятности вытекает её главный недостаток: только в редких случаях уже перед началом наблюдения можно вычислить все равновозможные несовместные события и в том числе благоприятные события. Такие возможности обычно возникают в ситуациях, родственных играм.

Сочетания. Если последовательность событий не важна, число возможных событий вычисляют как число сочетаний:

Пример 6. В группе 30 студентов. Трём студентам следует направиться на кафедру информатики, чтобы взять и принести компьютер и проектор. Вычислить вероятность того, что это сделают три определённых студента.

Решение. Число возможных событий рассчитываем, используя формулу (2):

Вероятность того, что на кафедру отправятся три определённых студента:

Пример 7. Продаются 10 мобильных телефонов. Их них у 3 есть дефекты. Покупатель выбрал 2 телефона. Вычислить вероятность того, что оба выбранных телефона будут с дефектами.

Решение. Число всех равновозможных событий находим по формуле (2):

По той же формуле находим число благоприятных событию возможностей:

Искомая вероятность того, что оба выбранных телефона будут с дефектами:

Найти вероятность самостоятельно, а затем посмотреть решение

Пример 8. В экзаменационных билетах 40 вопросов, которые не повторяются. Студент подготовил ответы на 30 из них. В каждом билете 2 вопроса. Какова вероятность того, что студент знает ответы на оба вопроса в билете?

Математика для программистов: теория вероятностей

Иван Камышан

Некоторые программисты после работы в области разработки обычных коммерческих приложений задумываются о том, чтобы освоить машинное обучение и стать аналитиком данных. Часто они не понимают, почему те или иные методы работают, и большинство методов машинного обучения кажутся магией. На самом деле, машинное обучение базируется на математической статистике, а та, в свою очередь, основана на теории вероятностей. Поэтому в этой статье мы уделим внимание базовым понятиям теории вероятностей: затронем определения вероятности, распределения и разберем несколько простых примеров.

Возможно, вам известно, что теория вероятностей условно делится на 2 части. Дискретная теория вероятностей изучает явления, которые можно описать распределением с конечным (или счетным) количеством возможных вариантов поведения (бросания игральных костей, монеток). Непрерывная теория вероятностей изучает явления, распределенные на каком-то плотном множестве, например на отрезке или в круге.

Можно рассмотреть предмет теории вероятностей на простом примере. Представьте себя разработчиком шутера. Неотъемлемой частью разработки игр этого жанра является механика стрельбы. Ясно, что шутер в котором всё оружие стреляет абсолютно точно, будет малоинтересен игрокам. Поэтому, обязательно нужно добавлять оружию разброс. Но простая рандомизация точек попадания оружия не позволит сделать его тонкую настройку, поэтому, корректировка игрового баланса будет сложна. В то же время, используя случайные величины и их распределения можно проанализировать то, как будет работать оружие с заданным разбросом, и поможет внести необходимые корректировки.

Пространство элементарных исходов

Допустим, из некоторого случайного эксперимента, который мы можем многократно повторять (например, бросание монеты), мы можем извлечь некоторую формализуемую информацию (выпал орел или решка). Эта информация называется элементарным исходом, при этом целесообразно рассматривать множество всех элементарных исходов, часто обозначаемое буквой Ω (Омега).

Структура этого пространства целиком зависит от природы эксперимента. Например, если рассматривать стрельбу по достаточно большой круговой мишени, - пространством элементарных исходов будет круг, для удобства размещенный с центром в нуле, а исходом - точка в этом круге.

Кроме того, рассматривают множества элементарных исходов - события (например, попадание в «десятку» - это концентрический круг маленького радиуса с мишенью). В дискретном случае всё достаточно просто: мы можем получить любое событие, включая или исключая элементарные исходы за конечное время. В непрерывном же случае всё гораздо сложнее: нам понадобится некоторое достаточно хорошее семейство множеств для рассмотрения, называемое алгеброй по аналогии с простыми вещественными числами, которые можно складывать, вычитать, делить и умножать. Множества в алгебре можно пересекать и объединять, при этом результат операции будет находиться в алгебре. Это очень важное свойство для математики, которая лежит за всеми этими понятиями. Минимальное семейство состоит всего из двух множеств - из пустого множества и пространства элементарных исходов.

Мера и вероятность

Вероятность - это способ делать выводы о поведении очень сложных объектов, не вникая в принцип их работы. Таким образом, вероятность определяется как функция от события (из того самого хорошего семейства множеств), которая возвращает число - некоторую характеристику того, насколько часто может происходить такое событие в реальности. Для определённости математики условились, что это число должно лежать между нулем и единицей. Кроме того, к этой функции предъявляются требования: вероятность невозможного события нулевая, вероятность всего множества исходов единичная, и вероятность объединения двух независимых событий (непересекающихся множеств) равна сумме вероятностей. Другое название вероятности - вероятностная мера. Чаще всего используется Лебегова мера , обобщающая понятия длина, площадь, объём на любые размерности (n -мерный объем), и таким образом она применима для широкого класса множеств.

Вместе совокупность множества элементарных исходов, семейства множеств и вероятностной меры называется вероятностным пространством . Рассмотрим, каким образом можно построить вероятностное пространство для примера со стрельбой в мишень.

Рассмотрим стрельбу в большую круглую мишень радиуса R , в которую невозможно промахнуться. Множеством элементарных событий положим круг с центром в начале координат радиуса R . Поскольку мы собираемся использовать площадь (меру Лебега для двумерных множеств) для описания вероятности события, то будем использовать семейство измеримых (для которых эта мера существует) множеств.

Примечание На самом деле, это технический момент и в простых задачах процесс определения меры и семейства множеств не играет особой роли. Но понимать, что эти два объекта существуют, необходимо, ведь во многих книгах по теории вероятности теоремы начинаются со слов: «Пусть (Ω,Σ,P) - вероятностное пространство … ».

Как уже сказано выше, вероятность всего пространства элементарных исходов должна равняться единице. Площадь (двумерная мера Лебега, которую мы обозначим λ 2 (A) , где А – событие) круга по хорошо известной со школы формуле равна π *R 2 . Тогда мы можем ввести вероятность P(A) = λ 2 (A) / (π *R 2) , и эта величина уже будет лежать между 0 и 1 для любого события А.

Если предположить, что попадание в любую точку мишени равновероятно, поиск вероятности попадания стрелком в какую-то то область мишени сводится к поиску площади этого множества (отсюда можно сделать вывод, что вероятность попадания в конкретную точку нулевая, ведь площадь точки равна нулю).

Например, мы хотим узнать, какова вероятность того, что стрелок попадёт в «десятку» (событие A – стрелок попал в нужное множество). В нашей модели, «десятка» представляется кругом с центром в нуле и радиусом r. Тогда вероятность попадания в этот круг P(A) = λ 2 /(A)π *R 2 = π * r 2 /(π R 2)= (r/R) 2 .

Это одна из самых простых разновидностей задач на «геометрическую вероятность», - большинство таких задач требуют поиска площади.

Случайные величины

Случайная величина – функция, переводящая элементарные исходы в вещественные числа. К примеру, в рассмотренной задаче мы можем ввести случайную величину ρ(ω) – расстояние от точки попадания до центра мишени. Простота нашей модели позволяет явно задать пространство элементарных исходов: Ω = {ω = (x,y) такие числа, что x 2 +y 2 ≤ R 2 } . Тогда случайная величина ρ(ω) = ρ(x,y) = x 2 +y 2 .

Средства абстракции от вероятностного пространства. Функция распределения и плотность

Хорошо, когда структура пространства хорошо известна, но на самом деле так бывает далеко не всегда. Даже если структура пространства известна, она может быть сложна. Для описания случайных величин, если их выражение неизвестно, существует понятие функции распределения, которую обозначают F ξ (x) = P(ξ < x) (нижний индекс ξ здесь означает случайную величину). Т.е. это вероятность множества всех таких элементарных исходов, для которых значение случайной величины ξ на этом событии меньше, чем заданный параметр x .

Функция распределения обладает несколькими свойствами:

  1. Во-первых, она находится между 0 и 1 .
  2. Во-вторых, она не убывает, когда ее аргумент x растёт.
  3. В третьих, когда число -x очень велико, функция распределения близка к 0 , а когда само х большое, функция распределения близка к 1 .

Вероятно, смысл этой конструкции при первом чтении не слишком понятен. Одно из полезных свойств – функция распределения позволяет искать вероятность того, что величина принимает значение из интервала. Итак, P (случайная величина ξ принимает значения из интервала ) = F ξ (b)-F ξ (a) . Исходя из этого равенства, можем исследовать, как изменяется эта величина, если границы a и b интервала близки.

Пусть d = b-a , тогда b = a+d . А следовательно, F ξ (b)-F ξ (a) = F ξ (a+d) - F ξ (a) . При малых значениях d , указанная выше разность так же мала (если распределение непрерывное). Имеет смысл рассматривать отношение p ξ (a,d)= (F ξ (a+d) - F ξ (a))/d . Если при достаточно малых значениях d это отношение мало отличается от некоторой константы p ξ (a) , не зависящей от d, то в этой точке случайная величина имеет плотность, равную p ξ (a) .

Примечание Читатели, которые ранее сталкивались понятием производной, могут заметить что p ξ (a) – производная функции F ξ (x) в точке a . Во всяком случае, можно изучить понятие производной в посвященной этой теме статье на сайте Mathprofi.

Теперь смысл функции распределения можно определить так: её производная (плотность p ξ , которую мы определили выше) в точке а описывает, насколько часто случайная величина будет попадать в небольшой интервал с центром в точке а (окрестность точки а) по сравнению с окрестностями других точек. Другими словами, чем быстрее растёт функция распределения, тем более вероятно появление такого значения при случайном эксперименте.

Вернемся к примеру. Мы можем вычислить функцию распределения для случайной величины, ρ(ω) = ρ(x,y) = x 2 +y 2 , которая обозначает расстояние от центра до точки случайного попадания в мишень. По определению F ρ (t) = P(ρ(x,y) < t) . т.е. множество {ρ(x,y) < t)} – состоит из таких точек (x,y) , расстояние от которых до нуля меньше, чем t . Мы уже считали вероятность такого события, когда вычисляли вероятность попадания в «десятку» - она равна t 2 /R 2 . Таким образом, Fρ(t) = P(ρ(x,y) < t) = t 2 /R 2 , для 0

Мы можем найти плотность p ρ этой случайной величины. Сразу заметим, что вне интервала она нулевая, т.к. функция распределения на этом промежутке неизменна. На концах этого интервала плотность не определена. Внутри интервала её можно найти, используя таблицу производных (например из на сайте Mathprofi) и элементарные правила дифференцирования. Производная от t 2 /R 2 равна 2t/R 2 . Значит, плотность мы нашли на всей оси вещественных чисел.

Ещё одно полезное свойство плотности – вероятность того, что функция принимает значение из промежутка, вычисляется при помощи интеграла от плотности по этому промежутку (ознакомиться с тем, что это такое, можно в статьях о собственном , несобственном , неопределенном интегралах на сайте Mathprofi).

При первом чтении, интеграл по промежутку от функции f(x) можно представлять себе как площадь криволинейной трапеции. Ее сторонами являются фрагмент оси Ох, промежуток (горизонтальной оси координат), вертикальные отрезки, соединяющие точки (a,f(a)), (b,f(b)) на кривой с точками (a,0), (b,0) на оси Ох. Последней стороной является фрагмент графика функции f от (a,f(a)) до (b,f(b)) . Можно говорить об интеграле по промежутку (-∞; b] , когда для достаточно больших отрицательных значений, a значение интеграла по промежутку будет меняться пренебрежимо мало по сравнению с изменением числа a. Аналогичным образом определяется и интеграл по промежуткам }