Случайность в числах: от броска монеты до нормального распределения
Результат подбрасывания монеты — случайная величина: принимает значение 0 или 1, каждое с вероятностью 0,5. Рост человека — тоже случайная величина: принимает любое значение в некотором диапазоне, имеет среднее около 170 см. Случайная величина — числовая функция на пространстве элементарных исходов, характеризующая результат случайного эксперимента.
Дискретные случайные величины
Принимают конечное или счётное число значений. Характеризуются функцией вероятностей P(X=xᵢ) = pᵢ, где Σpᵢ = 1.
Примеры распределений:
- Бернулли: два исхода (успех/неудача). Основа для всех «да/нет» задач
- Биномиальное: число успехов в n независимых испытаниях. B(n,p). Вопрос «сколько орлов при 10 подбрасываниях?»
- Пуассона: число событий за время при постоянной интенсивности λ. Описывает: число звонков в колл-центр за час, число распадов атомов за секунду, число ошибок в тексте на страницу
- Геометрическое: номер первого успеха в серии испытаний
Непрерывные случайные величины
Принимают любое значение в непрерывном диапазоне. Характеризуются плотностью распределения f(x) ≥ 0, ∫f(x)dx = 1. Вероятность попадания в интервал = площадь под кривой плотности на этом интервале.
Ключевые непрерывные распределения:
- Нормальное (Гаусса): N(μ,σ²). Символ «колоколообразной кривой». Встречается повсюду: рост и вес людей, ошибки измерений, суммы многих независимых случайных факторов (ЦПТ). Параметры: μ — среднее (положение), σ — стандартное отклонение (ширина)
- Равномерное: постоянная плотность на [a,b]. Результат правильного генератора случайных чисел
- Показательное (экспоненциальное): время между событиями пуассоновского потока. Время работы до отказа, время ожидания в очереди
- Логнормальное: логарифм величины нормально распределён. Типично для цен активов, доходов населения, размеров частиц
Характеристики: математическое ожидание и дисперсия
Математическое ожидание E(X) = Σxᵢpᵢ (дискр.) / ∫xf(x)dx (непр.) — «среднее» значение, центр тяжести распределения. Дисперсия D(X) = E((X-E(X))²) — средний квадрат отклонения от среднего, мера разброса. Стандартное отклонение σ = √D — в тех же единицах, что и X, удобно для интерпретации.
Правило 68-95-99,7 для нормального распределения: в интервале [μ-σ, μ+σ] находится 68% наблюдений, [μ-2σ, μ+2σ] — 95%, [μ-3σ, μ+3σ] — 99,7%.
Центральная предельная теорема (ЦПТ)
Одна из фундаментальных теорем теории вероятностей: сумма большого числа независимых одинаково распределённых случайных величин (с конечной дисперсией) стремится к нормальному распределению, независимо от исходного распределения. Это объясняет повсеместность нормального распределения: большинство реально измеряемых величин — результат суммирования многих независимых факторов. Именно на ЦПТ основаны доверительные интервалы, критерии проверки гипотез и вся классическая статистика.
