Так же как и теория вероятностей, математическая статистика имеет свои ключевые понятия, к которым относятся: генеральная совокупность, теоретическая функция распределения, выборка, эмпирическая функция распределения, статистика. Именно с определения этих понятий, а также с установления связи между ними и объектами, изучаемыми в теории вероятностей, мы начнем изложение математической статистики, предварительно дав краткое описание задач, которые собираемся решать. Кроме того, в последнем параграфе главы остановимся на некоторых распределениях, наиболее часто встречающихся в математической статистике.
Задачи математической статистики
Математическая статистика, являясь частью общей прикладной математической дисциплины «Теория вероятностей и математическая статистика», изучает, как и теория вероятностей, случайные явления, использует одинаковые с ней определения, понятия и методы и основана на той же самой аксиоматике А.Н. Колмогорова.
Однако задачи, решаемые математической статистикой, носят специфический характер. Теория вероятностей исследует явления, заданные полностью их моделью, и выявляет еще до опыта те статистические закономерности, которые будут иметь место после его проведения. В математической статистике вероятностная модель явления определена с точностью до неизвестных параметров. Отсутствие сведений о параметрах компенсируется тем, что нам позволено проводить «пробные» испытания и на их основе восстанавливать недостающую информацию.
Попытаемся показать различие этих двух взаимосвязанных дисциплин на простейшем примере — последовательности независимых одинаковых испытаний, или схеме Бернулли (часть 1, гл.4). Схему Бернулли можно трактовать как подбрасывание несимметричной монеты с вероятностью выпадения «герба» (успеха) р и «цифры» (неудачи) В теории вероятностей р и q задаются «извне» (например, для симметричной монеты
Методы теории вероятностей позволяют, зная р и q, определить вероятность выпадения т «гербов» при п подбрасываниях монеты (биномиальное распределение, часть 1, гл.4, параграф 1), найти асимптотику этой вероятности при увеличении числа подбрасываний (теоремы Пуассона и Муавра-Лапласа,
часть 1, гл.4, параграфы 2-4) и т.д. В математической статистике значения р и q неизвестны заранее, но мы можем произвести серию подбрасываний монеты. Цель проведения испытаний как раз и заключается либо в определении р и q, либо в проверке некоторых априорных суждений относительно их значений. Таким образом, судя уже по этому простейшему примеру, задачи математической статистики являются в некотором смысле обратными задачам теории вероятностей.
В математической статистике обычно принято выделять два основных направления исследований.
Первое направление связано с оценкой неизвестных параметров. Возвращаясь к нашему примеру, предположим, что мы произвели п подбрасываний монеты и установили, что в из них выпал «герб». Тогда наиболее естественной оценкой вероятности р является наблюденная частота
Как известно из закона больших чисел Бернулли (часть 1, гл. 4, параграф 5), с увеличением числа испытаний частота
стремится к вероятности р, т. е.
является состоятельной оценкой вероятности р. Оказывается, наряду с простотой и естественностью оценка
будет и наилучшей с многих точек зрения, т. е. она обладает свойством эффективности. Однако если нам заранее определено число п подбрасываний монеты, то сказать со 100%-й гарантией что-либо об истинном значении р мы не можем (за исключением разве что тривиальных суждений типа «если выпадет хотя бы один „герб» то вероятность выпадения „герба» не может равняться нулю»). Поэтому наряду с точечными оценками в математической статистике принято определять интервальные оценки или, иными словами, доверительные интервалы, опираясь при этом на «уровень доверия», или доверительную вероятность.
Второе направление в математической статистике связано с проверкой некоторых априорных предположений, или статистических гипотез. Так, до опыта мы можем предположить, что монета симметрична, т.е. высказать гипотезу о равенстве Противоположное предположение, естественно, будет состоять в том, что
и тоже представляет собой гипотезу. Принято называть одну из этих гипотез (как правило, более важную с практической точки зрения) основной
а вторую — альтернативной или конкурирующей
В приведенном выше примере нужно проверить основную гипотезу
против конкурирующей гипотезы
Заметим, что в нашем случае основная гипотеза
полностью определяет вероятностную модель подбрасывания монеты, т.е. является простой (состоит из одной точки), в отличие от конкурирующей гипотезы
являющейся сложной (состоит из более чем одной точки). Задача проверки статистических гипотез состоит в выборе правила или критерия, позволяющего по результатам наблюдений проверить (по возможности, наилучшим образом) справедливость этих гипотез и принять одну из них. Так же, как и при оценке неизвестных параметров, мы не застрахованы от неверного решения; в математической статистике они подразделяются
на ошибки первого и второго рода. Ошибка первого рода состоит в том, что мы принимаем конкурирующую гипотезу в то время как справедлива основная гипотеза
аналогично определяется ошибка второго рода. Возвращаясь к примеру с монетой, приведем следующий критерий проверки двух перечисленных гипотез: основную гипотезу
будем принимать в том случае, если наблюденная частота
удовлетворяет неравенству
в противном случае считаем верной конкурирующую гипотезу
Вероятность ошибки первого рода (принять симметричную монету за несимметричную) в этом случае определяется как вероятность выполнения неравенства
в схеме Бернулли с равновероятными исходами. Вероятность ошибки второго рода (принять несимметричную монету за симметричную) также определяется из схемы Бернулли, но с неравновероятными исходами и будет зависеть от истинного значения р.
Далее мы увидим, что задача проверки статистических гипотез наиболее полно решается для случая двух простых гипотез. Можно поставить и задачу проверки нескольких гипотез (в примере с монетой можно взять, например, три гипотезы: однако мы такие задачи рассматривать не будем.
Условно математическую статистику можно подразделить на исследование байесовских и небайесовских моделей.
Байесовские модели возникают тогда, когда неизвестный параметр является случайной величиной и имеется априорная информация о его распределении. При байесовском подходе на основе опытных данных априорные вероятности пересчитываются в апостериорные. Применение байесовского подхода фактически сводится к использованию формулы Байеса (см. часть 1, гл. 3, параграф 5), откуда, собственно говоря, и пошло его название. Байесовский подход нами будет применяться только как вспомогательный аппарат при доказательстве некоторых теорем.
Небайесовские модели появляются тогда, когда неизвестный параметр нельзя считать случайной величиной и все статистические выводы приходится делать, опираясь только на результаты «пробных» испытаний. Именно такие модели мы будем рассматривать в дальнейшем изложении.
В заключение этого параграфа отметим, что в математической статистике употребляют также понятия параметрических и непараметрических моделей. Параметрические модели возникают тогда, когда нам известна с точностью до параметра (скалярного или векторного) функция распределения наблюдаемой характеристики и необходимо по результатам испытаний определить этот параметр (задача оценки неизвестного параметра) или проверить гипотезу о принадлежности его некоторому заранее выделенному множеству значений (задача проверки статистических гипотез). Все приведенные выше примеры с подбрасыванием монеты представляют собой параметрические модели. Примеры непараметрических моделей мы рассмотрим позже.
Основные понятия математической статистики
Основными понятиями математической статистики являются: генеральная совокупность, выборка, теоретическая функция распределения.
Генеральная совокупность. Будем предполагать, что у нас имеются N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики X. Характеристика X, вообще говоря, может быть и векторной (например, линейные размеры объекта), однако для простоты изложения мы ограничимся только скалярным случаем, тем более что переход к векторному случаю никаких трудностей не вызывает. Совокупность этих N объектов назовем генеральной совокупностиью.
Поскольку все наши статистические выводы мы будем делать, основываясь только на значениях числовой характеристики X, естественно абстрагироваться от физической природы самих объектов и отождествить каждый объект с присущей ему характеристикой X. Таким образом, с точки зрения математической статистики генеральная совокупность представляет собой N чисел, среди которых, конечно, могут быть и одинаковые.
Выборка. Для того чтобы установить параметры генеральной совокупности, нам позволено произвести некоторое число п испытаний. Каждое испытание состоит в том, что мы случайным образом выбираем один объект генеральной совокупности и определяем его значение X. Полученный таким образом ряд чисел будем называть (случайной) выборкой объема п, а число
элементом выборки.
Заметим, что сам процесс выбора можно осуществлять различными способами: выбрав объект и определив его значение, изымать этот объект и не допускать к последующим испытаниям (выборка без возвращения); после определения его значения объект возвращается в генеральную совокупность и может полноправно участвовать в дальнейших испытаниях (выборка с возвращением) и т.д.
Разумеется, если бы мы смогли провести сплошное обследование всех объектов генеральной совокупности, то не нужно было бы применять никакие статистические методы и саму математическую статистику можно было бы отнести к чисто теоретическим наукам. Однако такой полный контроль невозможен по следующим причинам. Во-первых, часто испытание сопровождается разрушением испытуемого объекта; в этом случае мы имеем выборку без возвращения. Во-вторых, обычно необходимо исследовать весьма большое количество объектов, что просто невозможно физически. Наконец, может возникнуть такое положение, когда многократно измеряется один и тот же объект, но каждый замер производится со случайной ошибкой, и цель последующей статистической обработки заключается именно в уточнении характеристик объекта на основе многократных наблюдений; при этом результат каждого наблюдения надо считать новым объектом генеральной совокупности (простейшим примером такой ситуации является многократное подбрасывание монеты с целью определения вероятности выпадения «герба»). Следует помнить также, что выборка обязательно должна удовлетворять условию репрезентативности или, говоря более простым языком, давать обоснованное представление о генеральной совокупности.
С ростом объема N генеральной совокупности исчезает различие между выборками с возвращением и без возвращения. Мы, как обычно это делается в математической статистике, будем рассматривать случай бесконечно большого объема генеральной совокупности и поэтому, употребляя слово «выборка», не будем указывать, какая она — с возвращением или без него.
Теоретическая функция распределения. Пусть — выборка единичного объема из заданной генеральной совокупности. Поскольку сам процесс выбора производится случайным образом, то
является случайной величиной и, как и всякая случайная величина, имеет функцию распределения
Нетрудно видеть, что если объем N генеральной совокупности конечен, то при случайном выборе объекта мы находимся в рамках схемы классической вероятности (часть 1, гл.2, параграф 1) и значение функции распределения F(x) совпадает с отношением
— число тех объектов генеральной совокупности, значения которых меньше х.
В случае выборки произвольного объема п каждый элемент
выборки также будет иметь функцию распределения F(x), причем для выборки с возвращением наблюдения
будут независимы между собой (чего нельзя сказать о выборке без возвращения). Поскольку, как уже говорилось, мы будем рассматривать выборки из генеральной совокупности бесконечно большого объема, а в этом случае исчезает различие между выборками разного типа, мы приходим к интерпретации (с точки зрения теории вероятностей) выборки
как п независимых одинаково распределенных с функцией распределения F(x) случайных величин или, допуская некоторую вольность речи, как п независимых реализаций наблюдаемой случайной величины X, имеющей функцию распределения F(x). Функция распределения F(x) называется теоретической функцией распределения. Однако теоретическая функция распределения F(x) либо неизвестна, либо известна не полностью, и именно относительно F(x) мы будем делать наши статистические выводы. Заметим, что в соответствии с общими положениями теории вероятностей совместная функция распределения
выборки
задается формулой
В дальнейшем, как правило, мы будем предполагать, что F(x) является функцией распределения либо дискретной, либо непрерывной наблюдаемой случайной величины X. В первом случае будем оперировать рядом распределения случайной величины X, записанным в виде табл. 1, а во втором — плотностью распределения
Простейшие статистические преобразования
Прежде чем переходить к детальному анализу наблюденных статистических данных, обычно проводят их предварительную обработку. Иногда результаты такой обработки уже сами по себе дают наглядную картину исследуемого явления, в большинстве же случаев они служат исходным материалом для получения более подробных статистических выводов.
Вариационный и статистический ряды. Часто бывает удобно пользоваться не самой выборкой а некоторой ее модификацией, называемой вариационным рядом. Вариационный ряд
представляет собой ту же самую выборку
но расположенную в порядке возрастания элементов:
Такое преобразование не приводит к потере информации относительно теоретической функции распределения F(x), поскольку, переставив элементы вариационного ряда
в случайном порядке, мы получим новый набор случайных величин
совместная функция распределения
которых в точности совпадает с функцией распределения
первоначальной выборки
Для употребляют название «крайние члены вариационного ряда».
Пример 1. Измерение проекции вектора скорости молекул водорода на одну из осей координат дало (с учетом направления вектора) результаты представленные в табл.2.
Вариационный ряд этой выборки приведен в табл. 3. Крайними членами вариационного ряда являются
Если среди элементов выборки (а значит, и среди элементов вариационного ряда
имеются одинаковые, что происходит при наблюдении дискретной случайной величины, а также довольно часто встречается при наблюдении непрерывной случайной величины с округлением значений, то наряду с вариационным рядом используют представление выборки в виде статистического
ряда (табл.4), в котором представляют собой расположенные в порядке возрастания различные значения элементов выборки
— числа элементов выборки, значения которых равны соответственно
Пример 2. В течение минуты каждую секунду регистрировалось число попавших в счетчик Гейгера частиц. Результаты наблюдений приведены в табл. 5.
Статистический ряд выборки представлен в табл. 6.
Статистики. Для получения обоснованных статистических выводов необходимо проводить достаточно большое число испытаний, т.е. иметь выборку достаточно большого объема п. Ясно, что не только использование такой выборки, но и хранение ее весьма затруднительно. Чтобы избавиться от этих трудностей, а также для других целей, полезно ввести понятие статистики, общее определение которой формулируется следующим образом. Назовем статистикой произвольную (измеримую) k-мерную функцию от выборки
Как функция от случайного вектора статистика S также будет случайным вектором (см. часть 1, гл.6, параграф 7), и ее функция распределения
определяется для дискретной наблюдаемой случайной величины X формулой
и для непрерывной — формулой
где суммирование или интегрирование производится по всем возможным значениям (в дискретном случае каждое
принадлежит множеству
для которых выполнена система неравенств
Пример 3. Пусть выборка произведена из генеральной совокупности с теоретической функцией распределения
являющейся нормальной с математическим ожиданием (средним значением) т и дисперсией
Рассмотрим двумерную статистику
где
Тогда
Мы, однако, не будем вычислять записанный интеграл, а воспользуемся тем фактом (см. пример 29, часть 1, гл.6, параграф 7), что любое линейное преобразование переводит нормально распределенный вектор в вектор, снова имеющий нормальное распределение, причем ортогональное преобразование переводит вектор с независимыми координатами, имеющими одинаковые дисперсии, в вектор с также независимыми и имеющими те же самые дисперсии координатами.
Из курса теории вероятностей известно, что статистика имеет нормальное распределение со средним га и дисперсией
Положим
Очевидно, что
Пусть теперь А — линейное ортогональное преобразование пространства ставящее в соответствие каждому вектору
вектор
(как известно из курса линейной алгебры, такое преобразование всегда существует). Тогда, если
будет нормально распределенным случайным вектором, имеющим независимые координаты
с нулевым средним и дисперсией
Кроме того,
Далее, рассмотрим
— квадрат длины вектора
Простейшие преобразования показывают, что
С другой стороны, в силу ортогональности преобразования А
Отсюда, в частности, следует, что
т.е. представляет собой сумму квадратов п — 1 независимых случайных величин, распределенных по стандартному нормальному закону. Вспоминая теперь, что случайные величины
независимы, получаем окончательный ответ: статистики
независимы
статистика
распределена по нормальному закону с параметрами
а случайная величина
(в том случае, когда дисперсия
неизвестна, отношение
не является статистикой, поскольку зависит от неизвестного параметра
— по закону
степенями свободы (см. также параграф 4).
Отметим, что проведенные рассуждения будут нами постоянно использоваться в гл. 4, посвященной статистическим задачам, связанным с нормально распределенными наблюдениями.
Важный класс статистик составляют так называемые достаточные статистики. Не давая пока строгого математического определения, скажем, что статистика S является достаточной, если она содержит всю ту информацию относительно теоретической функции распределения F(x), что и исходная выборка В частности, вариационный ряд всегда представляет собой достаточную статистику. Более сложными примерами достаточных статистик являются число успехов в схеме Бернулли и двумерная статистика S из примера 3 для выборки из генеральной совокупности с нормальной теоретической функцией распределения. В современной математической статистике достаточные статистики играют очень важную роль.
Эмпирическая функция распределения. Пусть мы имеем выборку объема п из генеральной совокупности с теоретической функцией распределения F(x). Построим по выборке
аналог теоретической функции распределения F(x). Положим
где — число элементов выборки, значения которых
меньше х. Поскольку каждое
меньше х с вероятностью
а сами
независимы, то
является целочисленной случайной величиной, распределенной по биномиальному закону:
Функция носит название эмпирической (выборочной) функции распределения. Ясно, что при каждом х значение эмпирической функции распределения
является случайной величиной, принимающей значения
если же рассматривать
как функцию от х, то
представляет собой случайный процесс.
Построение эмпирической функции распределения удобно производить с помощью вариационного ряда
Функция
постоянна на каждом интервале
а в точке
увеличивается на 1 /п.
Пример 4. График эмпирической функции распределения, построенной по вариационному ряду из табл. 3, приведен на рис. 1.
Если выборка задана статистическим рядом (см. табл. 4), то эмпирическая функция распределения также постоянна на интервалах но ее значение в точке
увеличивается на
а не на 1/n
Пример 5. График эмпирической функции распределения, построенной по статистическому ряду из табл. 6, приведен на рис. 2.
Гистограмма, полигон. Для наглядности выборку иногда преобразуют следующим образом. Всю ось абсцисс делят на интервалы длиной
и определяют функцию
постоянную на i-м интервале и принимающую на этом интервале значение
— число элементов выборки, попавших в интервал
Функция
называется гистограммой.
При наблюдении дискретной случайной величины вместо гистограммы часто используют полигон частот. Для этого по оси абсцисс откладывают все возможные значения наблюдаемой величины X, а по оси ординат, пользуясь статистическим рядом, либо числа
элементов выборки, принявших значения
(полигон частот), либо соответствующие наблюденные частоты
(полигон относительных частот). Для большей наглядности соседние точки соединяются отрезками прямой.
Для непрерывной наблюдаемой случайной величины полигоном относительных частот иногда называют ломаную линию, соединяющую середины отрезков, составляющих гистограмму.
Пример 6. Построим гистограмму и полигон относительных частот выборки, представленной в табл. 2. Для этого выберем интервалы одинаковой длины Числа
и значения
на каждом интервале приведены в табл. 7. Гистограмма выборки показана на рис. 3 сплошной линией, а полигон относительных частот — штриховой линией.
Пример 7. Построим полигон относительных частот выборки, приведенной в табл. 5. Возможные значения наблюдаемой случайной величины X (числа частиц, попавших в счетчик Гейгера) представляют собой неотрицательные целые числа. Воспользовавшись статистическим рядом из табл. 6, получаем полигон относительных частот, изображенный на рис. 4.
Предельное поведение эмпирической функции распределения.
Предположим, что по выборке мы построили эмпирическую функцию распределения
(здесь и в дальнейшем в том случае, когда нам важна зависимость какой-то характеристики от объема выборки п, будем снабжать ее дополнительным нижним индексом (n)). Как мы уже говорили, число
элементов выборки, принявших значение, меньшее х, распределено по биномиальному закону с вероятностью успеха
Тогда при
в силу усиленного закона больших чисел (часть 1, гл.8, параграф 2) значения эмпирических функций распределения
сходятся при каждом х к значению теоретической функции распределения F(x). В. И. Гливенко и Ф. П. Кантелли обобщили этот факт и доказали следующую теорему.
Теорема Гливенко-Кантелли. При с вероятностью, равной единице
Смысл теоремы Гливенко-Кантелли заключается в том, что при увеличении объема выборки п у эмпирической функции распределения исчезают свойства случайности и она приближается к теоретической функции распределения.
Аналогично, если п велико, то значение гистограммы в точке х приближенно равно
где — концы интервала, в котором находится х, а
есть длина этого интервала. Если теоретическая функция распределения имеет плотность распределения р(х) и при этом длины интервалов
малы, то гистограмма
достаточно хорошо воспроизводит эту плотность.
Выборочные характеристики. Эмпирическая функция распределения построенная по фиксированной выборке
обладает всеми свойствами обычной функции распределения (дискретной случайной величины). В частности, по ней можно найти математическое ожидание (среднее)
второй момент
дисперсию
момент k-го порядка
центральный момент k-го порядка
и т.д. Соответствующие характеристики называются выборочными (выборочное среднее, выборочный второй момент, выборочная дисперсия и т.п.). Ясно, что выборочные характеристики как функции от случайных величин сами являются случайными величинами, причем их распределения определяются в соответствии с общими положениями теории вероятностей (см. часть 1, гл.6, параграф 7). Так, функция распределения выборочного среднего
для случая дискретной наблюдаемой случайной величины определяется формулой
где суммирование ведется по всем принимающим значения
и удовлетворяющим неравенству
а функция распределения выборочного второго момента
для непрерывного случая — формулой
Наряду с выборочной дисперсией часто используют и другую характеристику разброса выборки вокруг среднего:
Характеристику также будем называть выборочной дисперсией, а для того чтобы не путать
каждый раз будем указывать, о какой именно выборочной дисперсии идет речь. Выборочная дисперсия
отличается от выборочной дисперсии
только лишь наличием множителя
который с увеличением объема выборки п стремится к единице, и, казалось бы, нет смысла вводить две практически одинаковые величины. Однако, как мы увидим из дальнейшего,
является несмещенной оценкой теоретической дисперсии
чего нельзя сказать о выборочной дисперсии
хотя стандартные методы приводят именно к
Пример 8. Подсчитаем выборочное среднее и выборочные дисперсии для выборки, приведенной в табл. 2:
Для подсчета выборочной дисперсии можно было бы воспользоваться также формулой
Основные распределения математической статистики
Наиболее часто в математической статистике используются: нормальное распределение, распределение (распределение Пирсона), t-распределение (распределение Стьюдента), F-распределение (распределение Фишера), распределение Колмогорова и
-распределение. Все эти распределения связаны с нормальным. В свою очередь, широкое распространение нормального распределения обусловлено исключительно центральной предельной теоремой (см. часть 1, гл.8, параграф 4). Ввиду их особой важности все названные распределения затабулированы и содержатся в различных статистических таблицах, а также, частично, в большинстве учебников по теории вероятностей и математической статистике. Наиболее полными из известных и доступных читателю в нашей стране являются таблицы Л.Н. Большева и Н. В. Смирнова [1], на которые мы и будем ссылаться в дальнейшем.
Нормальное распределение. Одномерное стандартное нормальное распределение (стандартный нормальный закон) задается своей плотностью распределения (см. часть 1, гл.5, параграф 4)
Значения функции Ф(x) и плотности стандартного нормального распределения, а также квантилей
(функции
обратной функции стандартного нормального распределения) приведены в [1], табл. 1.1-1.3 (см. также табл.2 и 3 приложения).
Общее одномерное нормальное распределение характеризуется двумя параметрами: средним (математическим ожиданием) т и дисперсией Его можно трактовать как распределение случайной величины
где случайная величина подчинена стандартному нормальному закону. Плотность распределения и функцию распределения общего нормального закона будем обозначать через
Многомерное (k-мерное) нормальное распределение (часть 1, гл.6, параграф 4) определяется вектором средних
и матрицей ковариаций
-распределение (см. часть 1, гл.5, параграф 4, а также примеры 28 и 30, часть 1, гл.6, параграф 7). Пусть
— независимые случайные величины, распределенные по стандартному нормальному закону. Распределение случайной величины
носит название —распределения с п степенями свободы,
-распределение имеет плотность распределения
где введено в параграфе 4 гл. 5.
Значения функции -распределения и а-процентных точек (а-про-центная точка
-распределения представляет собой
-квантиль
-распределения приведены в [1], табл. 2.1а и 2.2а. В дальнейшем нам будет полезно следующее свойство. Пусть
независимые случайные величины, распределенные по нормальному закону с одинаковыми параметрами
Положим
Тогда случайная величина
имеет -распределение, но с п-1 степенями свободы. Доказательство этого факта содержится в примере 3.
Еще одна схема, в которой появляется -распределение — полиномиальная схема (см. часть 1, гл.4, параграф 7). Пусть производится п независимых одинаковых испытаний, в каждом из которых с вероятностью
может произойти одно из событий
Обозначим через
число появлений события
Тогда из многомерного аналога интегральной теоремы Муавра-Лапласа следует, что случайная величина
при асимптотически распределена по закону
степенями свободы.
t-распределение. Пусть — независимые случайные величины, причем
распределена по стандартному нормальному закону, а
имеет
-распределение с п степенями свободы. Распределение случайной величины
называется t-распределением с п степенями свободы, t-распределение имеет плотность распределения
Значения функции t-распределения и -процентных точек
квантилей
t-распределения приведены в [1], табл. 3.1а и 3.2.
Далее, пусть — независимые одинаково распределенные случайные величины, подчиненные нормальному закону со средним т. Положим
Тогда случайные величины независимы, а случайная величина
имеет t-распределение с n-1 степенями свободы (доказательство этого см. в примере 3).
F-распределение. Пусть две независимые случайные величины, имеющие
-распределения с
степенями свободы. Распределение случайной величины
носит название F-распределения с параметрами F-распределение имеет плотность распределения
Значения -процентных точек
-квантилей
-распределения приведены в [1], табл. 3.5.
Распределение Колмогорова. Функция распределения Колмогорова имеет вид
Распределение Колмогорова является распределением случайной величины
где — броуновский мостик, т. е. винеровский процесс с закрепленными концами
на отрезке
(см. [11]).
Значения функции распределения Колмогорова приведены в [1], табл.6.1. Квантили распределения Колмогорова будем обозначать через
-распределение. Функция
—распределения задается формулой
Здесь — модифицированная функция Бесселя,
-распределение представляет собой распределение случайной величины
где — броуновский мостик.
Значения функции -распределения приведены в [1], табл. 6.4а. Квантили
-распределения будем обозначать через
Оценки неизвестных параметров
Как уже говорилось в гл. 1, одним из двух основных направлений в математической статистике является оценивание неизвестных параметров. В этой главе мы дадим определение оценки, опишем те свойства, которые желательно требовать от оценки, и приведем основные методы построения оценок. Завершается глава изложением метода построения доверительных интервалов для неизвестных параметров.
Статистические оценки и их свойства
Предположим, что в результате наблюдений мы получили выборку из генеральной совокупности с теоретической функцией распределения F(x). Относительно F(x) обычно бывает известно только, что она принадлежит определенному параметрическому семейству
зависящему от числового или векторного параметра
Как правило, для простоты изложения будем рассматривать случай числового параметра
и лишь иногда обращаться к векторному параметру
в векторном случае будем использовать запись
Для большей наглядности будем все неизвестные параметры (за исключением теоретических моментов
обозначать буквой
(снабжая их при необходимости индексами), хотя в теории вероятностей для них обычно приняты другие обозначения. Наша цель состоит в том, чтобы, опираясь только на выборку
оценить неизвестный параметр
Оценкой неизвестного параметра построенной по выборке
назовем произвольную функцию
зависящую только от выборки Ясно, что как функция от случайной величины
оценка
сама будет являться случайной величиной и, как всякая случайная величина, будет иметь функцию распределения
определяемую в дискретном случае формулой
где суммирование ведется по всем переменным принимающим значения
из ряда распределения наблюдаемой случайной величины X и удовлетворяющим неравенству
и в непрерывном случае — формулой
где интегрирование ведется по области, выделяемой неравенством Как уже говорилось, иногда для того, чтобы подчеркнуть зависимость оценки от объема выборки п, будем наряду с обозначением
употреблять обозначение
Нужно четко представлять себе, что зависимость оценки
от неизвестного параметра
осуществляется только через зависимость от
выборки
что в свою очередь реализуется зависимостью от
функции распределения
Приведенное выше определение отождествляет понятие оценки
(вектора оценок
с одномерной (k-мерной) статистикой.
Пример:
Предположим, что проведено п испытаний в схеме Бернулли с неизвестной вероятностью успеха В результате наблюдений получена выборка
где
— число успехов i-м испытании. Ряд распределения наблюдаемой величины X — числа успехов в одном испытании представлен в табл. 1.
В качестве оценки рассмотрим наблюденную частоту успехов
где
представляет собой суммарное число успехов в п испытаниях Бернулли. Статистика распределена по биномиальному закону с параметром
поэтому ряд распределения оценки
имеет вид, приведенный в табл. 2.
Пример:
Выборка произведена из генеральной совокупности с теоретической функцией распределения
являющейся нормальной с неизвестным средним
В качестве оценки
снова рассмотрим выборочное среднее
Функция распределения задается формулой
Однако вместо непосредственного вычисления написанного n-мерного интеграла заметим, что статистика
распределена по нормальному закону с параметрами (математической ожидание) и
(дисперсия). Значит, оценка
распределена также по нормальному закону с параметрами
Разумеется, на практике имеет смысл использовать далеко не любую оценку.
Пример:
Как и в примере 1, рассмотрим испытания в схеме Бернулли. Однако теперь в качестве оценки неизвестной вероятности успеха возьмем
Такая оценка будет хороша лишь в том случае, когда истинное значение ее качество ухудшается с увеличением отклонения
от 1 /2.
Приведенный пример показывает, что желательно употреблять только те оценки, которые по возможности принимали бы значения, наиболее близкие к неизвестному параметру. Однако в силу случайности выборки в математической статистике мы, как правило, не застрахованы полностью от сколь угодно большой ошибки. Значит, гарантировать достаточную близость оценки к оцениваемому параметру
можно только с некоторой вероятностью и для того, чтобы увеличить эту вероятность, приходится приносить необходимую жертву — увеличивать объем выборки п.
Опишем теперь те свойства, которые мы хотели бы видеть у оценки.
Главное свойство любой оценки, оправдывающее само название «оценка», — возможность хотя бы ценой увеличения объема выборки до бесконечности получить точное значение неизвестного параметра . Оценка
называется состоятельной, если с ростом объема выборки она сходится к оцениваемому параметру
Можно рассматривать сходимость различных типов: по вероятности, с вероятностью единица, в среднем квадратичном и т.д. Обычно рассматривается сходимость по вероятности, т.е. состоятельной называется такая оценка
которая для любого
при всех возможных значениях неизвестного параметра
удовлетворяет соотношению
Отметим, что правильнее было бы говорить о состоятельности последовательности оценок поскольку для каждого значения п объема выборки оценка
может определяться по своему правилу. Однако в дальнейшем мы будем употреблять понятие состоятельности только для оценок, построенных по определенным алгоритмам, поэтому будем говорить просто о состоятельности оценки.
Пример:
Оценка из примера 1 является состоятельной оценкой неизвестной вероятности успеха
. Это является прямым следствием закона больших чисел Бернулли.
Пример:
Пусть выборка произведена из генеральной совокупности с неизвестной теоретической функцией распределения F(x). Тогда в силу закона больших чисел выборочный момент
сходится к теоретическому моменту значит, представляет собой состоятельную оценку
Аналогично, выборочные дисперсии
и выборочные центральные моменты
являются состоятельными оценками теоретической дисперсии
и теоретических центральных моментов
Отметим, что поскольку в этом примере не предполагается принадлежность теоретической функции распределения F(x) какому-либо параметрическому семейству, то мы имеем дело с задачей оценки неизвестных моментов теоретической функции распределения в непараметрической модели.
Пример:
Выборка произведена из генеральной совокупности с теоретической функцией распределения F(x), имеющей плотность распределения Коши
с неизвестным параметром Поскольку плотность распределения Коши симметрична относительно
то казалось бы естественным в качестве оценки
параметра
взять выборочное среднее
Однако как и сама наблюдаемая случайная величина X, имеет распределение Коши с тем же параметром
(это легко установить с помощью характеристических функций, см. часть 1, гл.8, параграф 3), т.е. не сближается с параметром
а значит, не является состоятельной оценкой параметра
Из курса теории вероятностей известно (см. часть 1, гл.7, параграф 1), что мерой отклонения оценки от параметра
служит разность
В математической статистике разность
называется смещением оценки Ясно, что
в дискретном случае и
в непрерывном, где суммирование или интегрирование ведется по всем возможным значениям
Оценка называется несмещенной, если
при всех е. ее среднее значение
совпадает с оцениваемым параметром
Пример:
Оценка неизвестной вероятности успеха
из примера 1 является несмещенной. Действительно,
Пример:
Выборочные моменты являются несмещенными оценками теоретических моментов
поскольку
Вычислим теперь математическое ожидание выборочной дисперсии
Таким образом, является смещенной (хотя и состоятельной, см. пример 5) оценкой дисперсии
Поскольку
то
и представляет собой уже несмещенную оценку
Можно показать также, что выборочные центральные моменты
являются смещенными оценками теоретических центральных моментов
Пример:
Пусть — выборка из генеральной совокупности с теоретической функцией распределения
являющейся нормальной с неизвестным средним
Поскольку
то оценка
является несмещенной. Очевидно, однако, что она не является состоятельной.
Примеры 8 и 9 показывают, что состоятельная оценка может быть сметенной и, наоборот, несмещенная оценка не обязана быть состоятельной.
Рассматривая несколько оценок неизвестного параметра мы, разумеется, хотели бы выбрать из них ту, которая имела бы наименьший разброс, причем при любом значении неизвестного параметра
. Мерой разброса оценки
как и всякой случайной величины, является дисперсия
(дисперсия, как и распределение оценки, зависит от неизвестного параметра ). Однако для смещенной оценки
дисперсия служит мерой близости не к оцениваемому параметру
а к математическому ожиданию
Поэтому естественно искать оценки с наименьшей дисперсией не среди всех оценок, а только среди несмещенных, что мы и будем делать в дальнейшем. Для несмещенных оценок дисперсия определяется также формулой
Имеется несколько подходов к нахождению несмещенных оценок с минимальной дисперсией. Это связано с тем, что такие оценки существуют не всегда, а найти их бывает чрезвычайно сложно. Здесь мы изложим понятие эффективности оценки, основанное на неравенстве Рао-Крамера.
Теорема:
Неравенство Рао-Крамера. Пусть — несмещенная оценка неизвестного параметра
построенная по выборке объема п. Тогда (при некоторых дополнительных условиях регулярности, наложенных на семейство
где — информация Фишера, определяемая в дискретном случае формулой
а в непрерывном — формулой
Прежде чем переходить к доказательству теоремы, заметим, что по неравенству Рао-Крамера дисперсия любой несмещенной оценки не может быть меньше Назовем эффективностью
несмещенной оценки
величину
Ясно, что эффективность любой оценки при каждом
заключена между нулем и единицей, причем чем она ближе к единице при каком-либо
тем лучше оценка
при этом значении неизвестного параметра.
Несмещенная оценка называется эффективной (по Рао-Краме-ру), если
при любом
Доказательство теоремы 1. Доказательство этой и всех остальных теорем будем проводить (если не сделано специальной оговорки) для непрерывного случая. Это связано с тем, что непрерывный случай, как правило, более сложен, и читатель, усвоивший доказательство для непрерывного случая, легко проведет его для дискретного.
Как мы увидим из хода доказательства, условия регулярности семейства упомянутые в формулировке теоремы, есть не что иное, как условия, гарантирующие законность дифференцирования под знаком интеграла в формулах (1) и (3). В разных книгах сформулированы различные достаточные условия. Мы упомянем одно из них, приведенное в [11]:
функция для всех (точнее, для почти всех) х непрерывно дифференцируема по
информация Фишера
конечна, положительна и непрерывна по
Приступим теперь к собственно доказательству теоремы. Заметим прежде всего, что, дифференцируя тождество
(в силу сформулированного условия это можно делать), получаем
Далее, в силу несмещенности оценки имеем
Дифференцируя это равенство по и учитывая очевидное тождество
полученное из (1) и (2), находим
Воспользовавшись неравенством Коши-Буняковского
при
имеем
Заметим теперь, что в силу тождества (2)
Тогда неравенство (5) можно переписать в виде откуда и следует неравенство Рао-Крамера.
Замечание:
Для превращения используемого при доказательстве теоремы 1 неравенства Коши-Буняковского, в равенство необходимо и достаточно существование таких функций аргумента х и
аргумента
что ,
При этом оценка должна иметь вид
Обозначая
и интегрируя уравнение (6), получаем, что необходимым условием существования эффективной оценки является возможность представления плотности распределения в виде
где — функции, зависящие только от
функции, зависящие только от
Аналогичное представление для ряда распределения должно иметь место и в дискретном случае. Семейство плотностей или рядов распределения такого вида носит название экспоненциального.
Экспоненциальные семейства играют в математической статистике важную роль. В частности, как мы показали, только для этих семейств могут существовать эффективные оценки, которые к тому же определяются формулой
(появление множителя связано с неоднозначностью определения функций
в представлении (7)). Однако следует помнить, что не для всякого экспоненциального семейства существует эффективная оценка (в принятом нами смысле), поскольку эффективная оценка по определению должна быть несмещенной, что, вообще говоря, нельзя сказать об оценке (8) в случае произвольного экспоненциального семейства. Впрочем, из тождества (1) вытекает весьма простой способ проверки несмещенности (8) непосредственно по
заключающийся в выполнении равенства
Замечание:
Неравенство Рао-Крамера можно обобщить на случай смещенных оценок:
И в этом случае неравенство превращается в равенство только тогда, когда семейство распределений экспоненциально.
Пример:
Рассмотрим оценку неизвестной вероятности успеха
в схеме Бернулли из примера 1. Как показано в примере 7, эта оценка несмещенная. Дисперсия
имеет вид
Найдем информацию Фишера (напомним, что в данном случае наблюдаемая величина X принимает всего два значения 0 и 1 с вероятностями соответственно):
Таким образом, и, значит, оценка
эффективная.
Пример:
Рассмотрим оценку неизвестного среднего нормального закона из примера 2. Поскольку эта оценка представляет собой выборочное среднее, то в соответствии с результатами, полученными в примере 8, она является несмещенной. Найдем ее эффективность. Для этого прежде всего заметим, что
Далее,
И в этом примере оценка является эффективной.
Пример:
Оценим неизвестную дисперсию нормального закона при известном среднем т. Плотность нормального распределения представима в виде
где
т.е. по отношению к неизвестной дисперсии принадлежит экспоненциальному семейству. Поэтому эффективная оценка
дисперсии
должна по формуле (8) иметь вид
С другой стороны, нетрудно видеть, что откуда следует несмещенность оценки
и, значит, ее эффективность. Впрочем, эффективность оценки легко установить и на основе неравенства Рао-Крамера.
Пусть теперь мы оцениваем не дисперсию, а среднее квадратичное отклонение И в этом случае имеет место представление (7), только теперь
Поэтому равенство не превращается в тождество ни при каком выборе g, и, значит, эффективной (в смысле Рао-Крамера) оценки среднего квадратичного отклонения нормального закона не существует. Рассмотрим оценку
равную корню квадратному из оценки дисперсии с точностью до постоянного множителя Читателю предлагается проверить, что оценка
несмещенная. Кроме того, в следующем параграфе будет показано, что среди всех несмещенных оценок среднего квадратичного отклонения
она имеет минимальную дисперсию (хотя и не является эффективной).
Пример:
Пусть выборка произведена из генеральной совокупности с равномерным на интервале
теоретическим распределением. Оценим неизвестный параметр
Обозначим через
максимальный член вариационного ряда. В качестве оценки параметра
возьмем
Функция распределения статистики
задается формулой
Тогда
Значит, оценка несмещенная. Далее,
Мы видим, что дисперсия оценки при
убывает, как
Такая оценка оказалась более эффективной, поскольку дисперсия эффективной оценки убывает только, как 1 /п. Разгадка парадокса чрезвычайно проста: для данного семейства не выполнены условия регулярности, необходимые при доказательстве неравенства Рао-Крамера. Используя понятие достаточной статистики, в следующем параграфе мы докажем минимальность дисперсии данной оценки.
В заключение этого параграфа отметим, что эффективные по Рао-Крамеру оценки существуют крайне редко. Правда, как мы увидим в параграфе 4, эффективность по Рао-Крамеру играет существенную роль в асимптотическом анализе оценок, получаемых методом максимального правдоподобия. Кроме того, существуют обобщения неравенства Рао-Крамера (например, неравенство Бхаттачария [7]), позволяющие доказывать оптимальность более широкого класса оценок.
В следующем параграфе мы рассмотрим другой подход к определению оценок с минимальной дисперсией, базирующийся на достаточных статистиках.
Наиболее распространенные методы нахождения оценок приводятся в параграфах 3-6.
Наконец, в параграфе 7 описан подход к построению доверительных интервалов для неизвестных параметров.
Достаточные оценки
Первый шаг в поисках другого (не основанного на неравенстве Рао-Крамера) принципа построения оценок с минимальной дисперсией состоит во введении понятия достаточной статистики (отметим, что достаточные статистики играют в современной математической статистике весьма важную роль, причем как при оценке неизвестных
параметров, так и при проверке статистических гипотез). Назовем k-мерную статистику
достаточной для параметра если условное распределение
выборки
при условии
не зависит от параметра
Пример:
Пусть — число успехов в i-м испытании Бернулли (см. пример 1). Рассмотрим статистику
— общее число успехов в п испытаниях Бернулли. Покажем, что она является достаточной для вероятности успеха Для этого найдем условное распределение
Воспользовавшись определением условной вероятности, получаем
Если то вероятность
совпадает с вероятностью
т.е.
(напомним еще раз, что каждое может принимать здесь только значение О или 1, причем
Поскольку вероятность
определяется формулой Бернулли
то из (9) получаем, что
т. е. не зависит от Если же
то
откуда
т. е. опять-таки не зависит от Таким образом, S — достаточная статистика.
Очевидно, что использовать приведенное выше определение для проверки достаточности конкретных статистик весьма сложно, особенно в непрерывном случае. Простой критерий достаточности задается следующей теоремой.
Теорема:
Факторизационная теорема Неймана-Фишера. Для того чтобы статистика была достаточной для параметра
необходимо и достаточно, чтобы ряд распределения
в дискретном случае или плотность распределения
в непрерывном случае выборки были представимы в виде
где функция зависит только от
а функция
— только от
Доказательство:
Для простоты изложения ограничимся только дискретным случаем. По определению условной вероятности,
Очевидно, что числитель в правой части (II) совпадает с вероятностью в том случае, когда
и равен нулю в противном. Поскольку событиями нулевой вероятности можно пренебречь, то ограничимся случаем
и запишем (11) в виде
Теперь, если S — достаточная статистика, то левая часть (12) не зависит от Обозначая ее через
— через
приходим к (10), что доказывает необходимость (10). И наоборот, пусть выполнено (10). Тогда
Подставляя последнее равенство в (12), имеем
т.е. не зависит от а значит, статистика S является достаточной.
Замечание к теореме 2. Очевидно, что представление (10) справедливо с точностью до функции зависящей только от
Пример:
Пусть — выборка из генеральной совокупности с теоретической функцией распределения, являющейся нормальной со средним
и дисперсией
Покажем, что (двумерная) статистика
где
является достаточной для (двумерного) параметра (см. также пример 3 из гл. 1). Действительно, плотность распределения
выборки
представима в виде
т.е. имеет вид (10), где
Пример:
Пусть — выборка из генеральной совокупности с равномерным на интервале
теоретическим распределением (см. пример 13). Покажем, что максимальный член вариационного ряда
является (одномерной) достаточной статистикой для Действительно, вспоминая, что плотность
равномерно распределенной на интервале
величины равна
при
и нулю в противном случае, получаем для плотности распределения выборки
выражение
В частности, область изменения каждого аргумента при отличной от нуля плотности распределения зависит от параметра
Рассмотрим функцию
и положим
С учетом введенных функций.
Здесь уже при определении функции сверху не наложено никаких ограничений, поскольку они автоматически ограничены своим максимальным значением S, которое в свою очередь не превосходит
Но это означает, что функция
не зависит от параметра
и в соответствии с теоремой 2 статистика
является достаточной для параметра
Пример:
Покажем, что для экспоненциального семейства (7) существует одномерная достаточная статистика. Этот факт легко установить, если подставить выражение (7) в формулу для плотности распределения выборки
Полагая теперь
видим, что одномерная статистика
является достаточной для параметра
Как уже говорилось в гл. 1, смысл достаточной статистики S заключается в том, что она включает в себя всю ту информацию о неизвестном параметре которая содержится в исходной выборке
Интуиция подсказывает нам: оценка с наименьшей дисперсией (если она существует) должна зависеть только от достаточной статистики S. И действительно, следующий наш шаг будет заключаться в переходе от произвольной оценки
к оценке
зависящей только от достаточной статистики S, причем этот переход совершится таким образом, чтобы дисперсия оценки
не превосходила дисперсии исходной оценки
Начиная с этого момента и до конца параграфа будем для простоты предполагать, что неизвестный параметр является одномерным.
Пусть имеется некоторая оценка этого параметра, а также (произвольная) статистика S. Рассмотрим условное математическое ожидание
случайной величины
при условии S (см. часть 1, гл. 7, параграф 5). Следующее утверждение, играющее основную роль в наших рассуждениях, было получено независимо Д. Блекуэлом, М.М. Рао и А.Н. Колмогоровым.
Теорема:
Улучшение оценки по достаточной статистике. Пусть S — достаточная статистика, а — несмещенная оценка параметра
Тогда условное математическое ожидание
является несмещенной оценкой параметра
зависящей только от достаточной статистики S и удовлетворяющей неравенству
при всех
Доказательство:
В силу достаточности статистики 5 условное распределение, а значит, и условное математическое ожидание оценки при условии S не зависит от неизвестного параметра
(для произвольной статистики S функция
вообще говоря, может зависеть от т.е.
представляет собой оценку параметра
причем зависящую только от S. Далее, из равенства
для условного математического ожидания немедленно следует несмещенность оценки
Наконец,
Используя опять свойство условного математического ожидания, получаем
Поэтому
Замечание:
Неравенство (13) превращается для некоторого в равенство тогда и только тогда, когда
(почти всюду по мере
Замечание:
Утверждение теоремы остается в силе и для смещенной оценки В частности,
Смысл теоремы 3 заключается в том, что взятие условного математического ожидания, т. е. переход к оценке зависящей только от достаточной статистики S, не ухудшает любую оценку
при всех значениях неизвестного параметра
Пример:
Пусть — выборка из нормально распределенной генеральной совокупности с неизвестным средним
и известной дисперсией
В примере 9 было показано, что оценка
даже не является состоятельной оценкой
хотя она и несмещенная. Рассмотрим статистику
Нетрудно показать, что статистика S является достаточной для параметра Поэтому мы можем определить новую оценку
Для ее вычисления заметим, что величины
имеют двумерное нормальное распределение со средними
дисперсиями
и ковариацией
Но тогда, как известно из курса теории вероятностей, условное распределение
при условии S = s также является нормальным со средним значением
как раз и представляющим собой значение
при S = s. Поскольку коэффициент корреляции
то среднее значение условного распределения
совпадает с s/n и окончательно получаем
Иными словами, мы из совсем плохой оценки получили эффективную (см. пример 11) оценку
Рассмотренный пример приоткрывает нам те возможности, которые несет с собой теорема 3. Однако, прежде чем сделать последний шаг, введем еще одно определение. Назовем статистику полной для семейства распределений
если из того, что
при всех (мы для простоты предположили существование плотности распределения
следует, что функция
тождественно равна нулю. Теперь мы в состоянии сформулировать окончательный итог наших поисков.
Теорема:
Минимальность дисперсии оценки, зависящей от полной достаточной статистики. Пусть S — полная достаточная статистика, — несмещенная оценка неизвестного параметра
Тогда
является единственной несмещенной оценкой с минимальной дисперсией.
Доказательство теоремы немедленно вытекает из предыдущих результатов. Действительно, в силу теоремы 3 оценка с минимальной дисперсией обязательно должна находиться среди оценок, зависящих только от достаточной статистики S; в противном случае ее можно было бы улучшить с помощью условного математического ожидания. Но среди оценок, зависящих только от S, может быть максимум одна несмещенная. В самом деле, если таких оценок две: то функция
имеет при всех значениях математическое ожидание
что в силу полноты статистики S влечет за собой равенство нулю. Само же существование несмещенной оценки
зависящей только от S, гарантируется существованием просто несмещенной оценки
Перейдем к обсуждению полученных результатов.
Условие полноты статистики S, как мы видим, сводится к единственности несмещенной оценки зависящей только от статистики S. Нам не известно общих теорем, которые давали бы простые правила проверки полноты произвольной статистики S. Однако, как мы увидим из примеров, в конкретных случаях кустарные способы обычно дают хорошие результаты.
Сравнение размерностей полной статистики S и оцениваемого параметра дает право говорить, что, как правило, статистика S должна иметь ту же размерность, что и
а поскольку мы ограничились одномерным параметром
то S также должна быть одномерной. Это приводит к следующим полезным определениям. Оценка
называется достаточной, если она является достаточной как одномерная статистика. Аналогично, назовем оценку
полной, если она является полной статистикой.
Сформулируем очевидное следствие из теоремы 4. которое удобно применять во многих частных случаях.
Следствие из теоремы 4. Если оценка несмещенная и зависит только от полной достаточной статистики S, то она имеет минимальную дисперсию.
Пример:
Пусть — выборка из генеральной совокупности, распределенной по нормальному закону с известным средним m и неизвестным средним квадратичным отклонением
Нетрудно показать, что статистика
является достаточной для параметра Покажем, что она также полная. Для этого вспомним (см. параграф 4 гл. 1), что случайная величина
имеет
-распределение с п степенями свободы, а значит, статистика
имеет плотность распределения
Пусть теперь — такая функция, что
при всех
Положим
Тогда
что для всех
Но из теории преобразований Лапласа известно, что в этом случае оригинал
а значит, и функция
также должны тождественно равняться нулю, что и доказывает полноту статистики S.
Рассмотрим теперь оценку
(см. пример 12) неизвестного среднего квадратичного отклонения Эта оценка несмещенная и зависит только от полной достаточной статистики S. Поэтому по следствию из теоремы 4 она имеет минимальную дисперсию, хотя, как было показано в примере 12, и не является эффективной по Рао-Крамеру.
Пример:
Рассмотрим оценку
параметра равномерного на интервале
распределения (см. пример 13). В примере 13 показано, что эта оценка несмещенная. Статистика
является достаточной (см. пример 16). Покажем, наконец, что — полная статистика. Действительно, для любой функции
Отсюда, в частности, следует, что если при всех
то
при всех х. Поэтому и статистика
полная.
Таким образом, в силу следствия из теоремы 4 и в этом примере оценка имеет минимальную дисперсию.
Метод моментов
Пусть мы имеем выборку из генеральной совокупности с теоретической функцией распределения F(x), принадлежащей k-параметрическому семейству
с неизвестными параметрами
которые нужно оценить. Поскольку нам известен вид теоретической функции распределения, мы можем вычислить первые k теоретических моментов. Эти моменты, разумеется, будут зависеть от k неизвестных параметров
Суть метода моментов заключается в следующем: так как выборочные моменты являются состоятельными оценками теоретических моментов (см. пример 8), мы можем в написанной системе равенств при большом объеме выборки п теоретические моменты заменить на выборочные
а затем, решая эту систему относительно
найти оценки неизвестных параметров. Таким образом, в методе моментов оценки
неизвестных параметров
определяются из системы уравнений
Можно показать, что при условии непрерывной зависимости решения этой системы от начальных условий оценки, полученные методом моментов, будут состоятельными. Более того, справедлива следующая теорема.
Теорема:
Асимптотическая нормальность оценок, полученных методом моментов. При некоторых условиях, наложенных на семейство совместное распределение случайных величин
при сходится к (многомерному) нормальному закону с нулевыми средними и матрицей ковариаций, зависящей от теоретических моментов
и матрицы
Доказательство:
Будем полагать, что выполнены следующие условия: а) параметры однозначно определяются своими моментами
б) существует теоретический момент порядка 2k (это эквивалентно существованию дисперсий у выборочных моментов
в) функция
дифференцируема по с отличным от нуля якобианом
Доказательство теоремы проведем для одномерного случая, предоставляя общий случай читателю. Оно является комбинацией следующих результатов: теоремы о дифференцируемости обратного отображения и центральной предельной теоремы. Действительно, поскольку существует дисперсия DX, то при каждом истинном значении параметра
в силу центральной предельной теоремы выборочное среднее
асимптотически при распределено по нормальному закону с параметрами
С другой стороны, сама оценка
записывается в виде
где — обратная к
функция. В силу сделанных предположений обратное отображение
в окрестности точки
приближенно представляет собой линейную функцию
причем Но тогда и случайная величина
как приближенно линейное преобразование приближенно нормальной случайной величины
распределена приближенно по нормальному закону со средним
и дисперсией
Это доказывает утверждение теоремы.
Пример:
Найдем методом моментов оценку неизвестной вероятности успеха в схеме Бернулли. Поскольку в схеме Бернулли только один неизвестный параметр, для его определения необходимо приравнять теоретическое математическое ожидание числа успехов в одном испытании
выборочному среднему
Итак, оценка полученная методом моментов, представляет собой наблюденную частоту успехов. Свойства этой оценки были нами достаточно полно исследованы в примерах 1, 4, 7 и 10.
Пример:
Выборка произведена из генеральной совокупности с теоретической функцией распределения, имеющей гамма-плотность
с двумя неизвестными параметрами Первые два момента случайной величины X, имеющей гамма-распределение, задаются формулами:
Отсюда для определения оценок неизвестных параметров
получаем систему двух уравнений:
решение которой имеет вид
Вообще говоря, в методе моментов не обязательно использовать первые k моментов. Более того, можно рассматривать моменты не обязательно целого порядка. Иногда для использования в методе моментов привлекают более или менее произвольные функции сравнивая выборочные средние
функций с теоретическими средними
Пример:
Пусть выборка произведена из нормальной генеральной совокупности с известным средним т и неизвестной дисперсией
Попробуем для оценивания
применить метод моментов, взяв выборочное среднее
Но теоретическое среднее
не зависит от параметра
Это означает, что использование выборочного среднего для оценивания неизвестной дисперсии неправомочно и нужно привлекать моменты других порядков. В частности, применяя второй выборочный момент
и вспоминая, что
получаем оценку
Следует отметить, что оценки, полученные методом моментов, обычно имеют эффективность существенно меньше единицы и даже являются смещенными. Иногда из-за своей простоты они используются в качестве начального приближения для нахождения более эффективных оценок.
Метод максимального правдоподобия
Метод максимального правдоподобия является наиболее распространенным методом нахождения оценок. Пусть по-прежнему выборка произведена из генеральной совокупности с неизвестной теоретической функцией распределения F(x), принадлежащей известному однопараметрическому семейству
Функция
в дискретном случае и
в непрерывном называется функцией правдоподобия. Отметим,что в функции правдоподобия элементы выборки
являются фиксированными параметрами, а
— аргументом (а не истинным значением неизвестного параметра). Функция правдоподобия по своей сути представляет собой не что иное, как вероятность (в непрерывном случае плотность распределения) получить именно ту выборку
которую мы реально имеем, если бы значение неизвестного параметра равнялось
Естественно поэтому в качестве оценки неизвестного параметра
выбрать
доставляющее наибольшее значение функции правдоподобия
Оценкой максимального правдоподобия называется такое значение
для которого
При практической реализации метода максимального правдоподобия удобно пользоваться не самой функцией правдоподобия, а ее логарифмом.
Уравнением правдоподобия называется уравнение
Если функция правдоподобия дифференцируема по в каждой точке, то оценку максимального правдоподобия
следует искать среди значений
удовлетворяющих уравнению правдоподобия или принадлежащих границе области допустимых значений
. Для наиболее важных семейств
уравнение правдоподобия имеет единственное решение
которое и является оценкой максимального правдоподобия.
Пример:
Найдем оценку неизвестной вероятности успеха в схеме Бернулли, но теперь уже в отличие от примера 21 методом максимального правдоподобия. Поскольку
если X = 0, то функцию правдоподобия можно записать так:
где — суммарное число успехов в п испытаниях. Тогда уравнение правдоподобия принимает вид
Решая это уравнение, имеем
Поскольку
то представляет собой выпуклую вверх функцию
Значит,
доставляет максимум функции правдоподобия
т.е. является оценкой максимального правдоподобия. Эта оценка представляет собой, как и в примере 21, наблюденную частоту успехов.
Оказывается, имеется тесная связь между эффективными оценками и оценками, полученными методом максимального правдоподобия. А именно, справедлива следующая теорема.
Теорема:
Совпадение эффективной оценки с оценкой максимального правдоподобия. Если (естественно, при условиях регулярности теоремы 1) существует эффективная оценка то она является оценкой максимального правдоподобия
Доказательство теоремы 6 представляет собой дальнейшее уточнение доказательства теоремы 1. Действительно, как следует из замечания 1 к теореме 1, из существования эффективной оценки вытекает (6) и (8)
Отсюда и из (4) следует равенство
Поэтому из условия строгой положительности информации I вытекает строгая положительность которая в свою очередь влечет за собой единственность решения
уравнения правдоподобия
Это решение совпадает с эффективной оценкой и задает единственный максимум функции правдоподобия
В общем случае оценка максимального правдоподобия может быть не только неэффективной, но и смещенной. Тем не менее она обладает свойством асимптотической эффективности в следующем смысле.
Теорема:
Асимптотическая эффективность оценки максимального правдоподобия. При некоторых условиях на семейство уравнение правдоподобия имеет решение, при
асимптотически распределенное по нормальному закону со средним
и дисперсией
где I — информация Фишера.
Доказательство:
Сначала сформулируем условия теоремы (см. [9]), которые, как мы увидим далее, гарантируют возможность дифференцируемости под знаком интеграла и разложения в ряд Тейлора до первого члена:
а) для (почти) всех х существуют производные
б) при всех справедливы неравенства
где функции интегрируемы на
причем M не зависит от
в) информация I конечна и положительна для всех
Обозначим через истинное значение неизвестного параметра
В силу условий теоремы справедливо следующее разложение
в окрестности
причем Тогда после умножения на
уравнение правдоподобия можно записать в виде
где случайные величины определяются выражениями
Рассмотрим поведение при больших п. Дифференцируя (1) по
получаем
Поэтому
Вернемся к уравнению (14) и воспользуемся сначала тем фактом, что при в силу закона больших чисел
причем, согласно условиям теоремы,
Тогда можно показать, что уравнение (14) будет в некоторой окрестности
иметь асимптотически единственное решение
которое к тому же определяется приближенной формулой
Величина по центральной предельной теореме, при
имеет асимптотически нормальное распределение с нулевым средним и дисперсией
Поэтому оценка также асимптотически распределена по нормальному закону с параметрами
Замечание:
Доказанная теорема гарантирует, что среди всех решений уравнения правдоподобия существует по крайней мере одно обладающее свойством асимптотической эффективности в указанном смысле. Более того, такое решение асимптотически единственно в некоторой окрестности точки
(т. е. вероятность того, что в этой окрестности имеется другое решение уравнения правдоподобия, с ростом п стремится к нулю) и именно оно доставляет локальный максимум функции правдоподобия в этой окрестности. Но с самого начала мы назвали оценкой максимального правдоподобия оценку, доставляющую глобальный максимум функции правдоподобия. Такая оценка, вообще говоря, может не совпадать с
и даже быть неединственной. Однако если семейство распределений
удовлетворяет естественному свойству разделимости, смысл которого сводится к тому, что для достаточно удаленных друг от друга
распределения
также достаточно хорошо отличаются друг от друга, то любая оценка максимального правдоподобия будет состоятельной, т.е. стремиться к оцениваемому параметру. Вкупе с доказанной теоремой это означает асимптотическую единственность оценки максимального правдоподобия и совпадение ее с
что позволяет при асимптотическом анализе свойств оценки максимального правдоподобия говорить не об одном из решений уравнения правдоподобия или даже не об одной из оценок максимального правдоподобия, а просто об оценке максимального правдоподобия
Детальный разбор этого явления можно найти в [И]. Там же показано, что для оценки близости распределений удобно использовать расстояние Кульбака-Лейблера
поскольку в силу закона больших чисел именно к расстоянию Кульбака-Лейблера при сходится с точностью до знака, постоянной
здесь — аргумент функции правдоподобия, а
— истинное значение неизвестного параметра.
В случае, когда семейство зависит от нескольких неизвестных параметров
при использовании метода максимального правдоподобия нужно искать максимум функции правдоподобия или ее логарифма по k аргументам
Уравнение правдоподобия превращается в систему уравнений
Пример:
Выборка произведена из нормальной генеральной совокупности с неизвестными параметрами
(среднее) и
(дисперсия). Найдем их оценки
методом максимального правдоподобия. Логарифм функции правдоподобия задается формулой
Система уравнений правдоподобия имеет вид
Таким образом,
Читателю предлагается самостоятельно показать, что доставляют максимум функции правдоподобия
Оценки
параметров
совпадают с выборочным средним
и выборочной дисперсией
Отметим, что оценка
неизвестного математического ожидания
является эффективной (см. пример 11), чего нельзя сказать об оценке
неизвестной дисперсии
которая, как мы знаем, является даже смещенной.
Оказывается, однако, что если мы в качестве оценки параметра рассмотрим выборочную дисперсию
то эта оценка будет уже не только несмещенной, но и иметь минимальную дисперсию среди всех несмещенных оценок параметра
Последний факт вытекает из неравенства Бхаттачария [7], обобщающего неравенство Рао-Крамера, а также может быть установлен из свойств многомерных достаточных оценок [11].
Метод минимального расстояния
Суть этого метода заключается в следующем. Предположим, что любым двум функциям распределения поставлено в соответствие число
называемое расстоянием, причем Пусть теперь, как обычно, задана выборка
из генеральной совокупности с теоретической функцией распределения F(x), принадлежащей параметрическому семейству
Вычислим расстояние между эмпирической функцией распределения
и функциями распределения
из данного семейства. Оценкой, полученной методом минимального расстояния, называется такое значение
для которого
т. е. такое значение которое определяет ближайшую к
в смысле расстояния р функцию распределения из семейства
Приведем примеры некоторых наиболее часто встречающихся в математической статистике расстояний.
Равномерное расстояние (расстояние Колмогорова) определяется формулой
Расстояние имеет вид
Расстояние употребляется для функций распределения
дискретных случайных величин
принимающих одинаковые значения
и задается выражением
где вероятности определяются рядами распределения случайных величин
Использование приведенных выше расстояний для получения оценок весьма сложно в вычислительном плане, и поэтому они употребляются крайне редко. Здесь мы упомянули об этих расстояниях только потому, что применение оценок, полученных с их помощью, позволяет упростить вычисление уровней значимости критериев при проверке сложных непараметрических статистических гипотез, поскольку такие оценки естественным образом связаны с соответствующими критериями (см. параграф 5 гл. 3).
Метод номограмм
Еще одним методом, позволяющим, пользуясь только номограммами (специальным образом разлинованными листами бумаги, которые в математической статистике носят название вероятностной бумаги), весьма просто и быстро оценить неизвестные параметры, является метод номограмм. Его сущность состоит в следующем. Пусть мы имеем выборку из генеральной совокупности с неизвестной теоретической функцией распределения, принадлежащей двухпараметрическому семейству
Предположим теперь, что каким-то чрезвычайно простым способом удалось построить функцию распределения
из семейства
достаточно хорошо приближающую эмпирическую функцию распределения
Тогда
будут являться оценками неизвестных параметров
причем в силу теоремы Гливенко-Кантелли состоятельными при весьма слабых условиях, накладываемых на семейство
Казалось бы, мы пришли к не менее сложной задаче: найти «чрезвычайно простой» способ приближения эмпирической функции распределения функцией распределения из семейства Оказывается, однако, что графики функций распределения тех семейств
в которых
по сути дела, связаны с параметрами «сдвига» и «масштаба» (к таким семействам относятся, например, нормальное, логнормальное и т.д.), можно с помощью некоторых нелинейных преобразований координат превратить в семейство прямых линий. Тогда, построив в этих новых координатах график эмпирической функции распределения
нетрудно визуально провести прямую, которая достаточно хорошо приближает
а затем уже по коэффициентам проведенной прямой найти оценки
и неизвестных параметров
Практическая реализация метода номограмм происходит следующим образом. Сначала выборку преобразуют в вариационный ряд
и на номограмме для соответствующего семейства
откладывают точки
с координатами
абсциссы которых
представляют собой точки скачков эмпирической функции распределения
а ординаты
— середины этих скачков. Затем «на глаз» проводят прямую линию, проходящую как можно ближе ко всем точкам
Наконец, с помощью пояснений к номограмме по коэффициентам прямой находят оценки
неизвестных параметров
Пример 26. Предполагая в примере 1 из гл. 1, что проекция вектора скорости молекул водорода распределена по нормальному закону, оценим с помощью метода номограмм неизвестное математическое ожидание и дисперсию
Воспользовавшись вариационным рядом выборки, найдем координаты точек
(табл.3). Отложим точки
на номограмме для нормального распределения (на нормальной вероятностной бумаге) и проведем «на глаз» прямую А, задаваемую уравнением
(рис. 1).
Оценка математического ожидания
совпадает с точкой пересечения прямой А с осью абсцисс, т. е.
Для того чтобы найти оценку дисперсии
определим значение коэффициента
Тогда
Для сравнения приведем значения оценок этих же параметров, полученные методом максимального
правдоподобия (см. пример 18, а также пример 8 из гл. 1): Как видим, оценки весьма близки.
Следует отметить, что с помощью метода номограмм можно судить также о правильности выбора семейства Действительно, по множеству точек
сразу видно, группируются они вокруг некоторой прямой или нет. Если нет, то возникают серьезные сомнения в принадлежности теоретического распределения F(x) семейству
Доверительные интервалы
Полученные в предыдущих параграфах оценки неизвестных параметров естественно называть точечными, поскольку они оценивают неизвестный параметр одним числом или точкой. Однако, как мы знаем, точечная оценка не совпадает с оцениваемым параметром и более разумно было бы указывать те допустимые границы, в которых может находиться неизвестный параметр при наблюденной выборке
К сожалению, в подавляющем большинстве важных для практики случаев при любой выборке
достоверная область, в которой может находиться неизвестный параметр
совпадает со всей возможной областью изменения этого параметра, поскольку такую выборку мы можем получить с ненулевой вероятностью (или плотностью распределения) при каждом значении
Поэтому приходится ограничиваться нахождением границ изменения неизвестного параметра с некоторой наперед заданной степенью доверия или доверительной вероятностью.
Доверительной вероятностью назовем такую вероятность что событие вероятности
можно считать невозможным. Разумеется, выбор доверительной вероятности полностью зависит от исследователя, причем во внимание принимаются не только его личные наклонности, но и физическая суть рассматриваемого явления. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки. В математической статистике обычно используют значения доверительной вероятности 0,9, 0,95, 0,99, реже 0,999, 0,9999 и т. д.
Задавшись доверительной вероятностью мы уже можем по выборке
определить интервал
в котором будет находиться неизвестный параметр
Такой интервал называется доверительным интервалом (иногда также говорят «интервальная оценка») доверительной вероятности
для неизвестного параметра
Отметим, что доверительная вероятность а ни в коей мере не является вероятностью неизвестному параметру
принадлежать доверительному интервалу
поскольку, как мы предположили с самого начала, априорные сведения о параметре
в частности о его распределении, отсутствуют. Когда говорят, что неизвестный параметр не может выйти за границу доверительного интервала
констатируют только, что если при любом истинном значении
в результате эксперимента получена выборка
а затем по ней построен доверительный интервал
то этот интервал с вероятностью
накроет значение
Доверительные интервалы определим, следуя Ю. Нейману, опираясь на точечные оценки. По заданной оценке доверительные интервалы доверительной вероятности а можно построить различными способами. На практике обычно используют два типа доверительных интервалов: симметричные и односторонние. Ограничимся описанием процедуры построения симметричных доверительных интервалов. Односторонние доверительные интервалы находятся совершенно аналогично.
Итак, пусть у нас имеется выборка из генеральной совокупности с неизвестной теоретической функцией распределения F(x), принадлежащей однопараметрическому семейству
Предположим также, что нами выбрана некоторая оценка
по которой мы хотим построить симметричный доверительный интервал доверительной вероятности
Для этого возьмем произвольное значение
и найдем функцию распределения
оценки
Определим
и
из решения уравнений (см. рис. 2):
(напомним, что носят название
-квантилей функции распределения
Таким образом, при заданном
оценка
будет с вероятностью
заключена в интервале
причем вероятность попадания
как влево, так и вправо от интервала
имеет одно и то же значение
(отсюда происходит название «симметричный»). Откладывая теперь на графике рис. 3 по оси абсцисс значение параметра
а по оси ординат — соответствующие ему значения
получим кривые
В силу принципа невозможности события, происходящего с вероятностью 1 — а, заключаем, что все возможные пары
могут находиться только внутри области G между кривыми
Для окончания построения доверительного интервала остается заметить, что, получив по выборке
оценку
мы вправе сделать вывод: неизвестный параметр
в обязан лежать внутри интервала где
определяются из решения уравнений
Именно интервал и является симметричным доверительным интервалом доверительной вероятности
Пример 27. Построим симметричный доверительный интервал доверительной вероятности а для неизвестной вероятности успеха в схеме Бернулли. Естественно в качестве оценки
взять наблюденную частоту
где — суммарное наблюденное число успехов (см. пример 24).
При малом объеме выборки п процедура построения доверительных интервалов трудоемка, поскольку она практически сводится к перебору значений неизвестного параметра. Поэтому существуют специальные таблицы (см. [1], табл. 5.2), которые по наблюденным значениям числа успехов и числа неудач
дают границы доверительного интервала доверительной вероятности а.
При больших объемах выборки п пользуются тем фактом, что в силу интегральной теоремы Муавра-Лапласа оценка распределена приближенно по нормальному закону со средним
и дисперсией
Тогда решения уравнений
связаны с -квантилями
(см. [1], табл. 1.3) стандартного нормального закона формулами
Учитывая, что уравнения кривых
можно записать в единой эквивалентной форме
Последнее уравнение, как нетрудно видеть, представляет собой уравнение эллипса (рис. 4) (физически непонятный выход эллипса за полосу связан с тем, что при
близких к нулю или единице, необходимо в соответствии с теоремой Пуассона использовать не нормальную, а пуассоновскую аппроксимацию оценки
Уравнение для определения границ
доверительного интервала имеет вид
откуда окончательно получаем
Пример:
Построим симметричный доверительный интервал доверительной вероятности а для неизвестного среднего нормального закона при известной дисперсии
Эффективной оценкой
параметра
как мы знаем (пример 18), является выборочное среднее
Оценка также распределена по нормальному закону с параметрами
Поэтому
т.е. представляют собой уравнения двух параллельных прямых (рис. 5). Решая уравнения получаем границы доверительного интервала
или, учитывая, что
Пример:
Как и в предыдущем примере, предположим, что выборка произведена из нормальной генеральной совокупности, но с неизвестной дисперсией
а среднее известно и равно т. В качестве оценки
неизвестной дисперсии
возьмем выборочную дисперсию
Тогда случайная величина будет иметь
-распределение с п степенями свободы, а значит, решения уравнений
определяются формулами
где — а-квантиль
-распределения с п степенями свободы (см. [1], табл. 2.26). Уравнения
представляют собой уравнения двух лучей, исходящих из начала координат (рис.6), и, значит, границы симметричного доверительного интервала доверительной вероятности а для неизвестной дисперсии задаются формулами
Пример:
Рассмотрим, наконец, случай, когда в выборке из нормальной генеральной совокупности неизвестны оба параметра: среднее и дисперсия
В качестве их оценок воспользуемся выборочным средним
и выборочной дисперсией
(см. пример 25).
Построение доверительного интервала для неизвестного среднего начнем с определения случайной величины
которая, как говорилось в параграфе 4 гл. 1, имеет t-распределение с п — 1 степенями свободы. Обозначим через -квантили t-распределения (см. [1], табл. 3.2). Тогда значение оценки среднего с вероятностью а будет лежать в пределах
Продолжая рассуждения, как и в случае известной дисперсии, и учитывая равенство получаем окончательные выражения для границ
симметричного доверительного интервала доверительной вероятности a:
Доверительный интервал доверительной вероятности а для неизвестной дисперсии
строится точно так же, как и в примере 29:
При этом нужно учитывать, что квантили берутся для
-распределения с
степенями свободы, поскольку одна степень свободы уходит на определение неизвестного среднего
В заключение отметим, что в современной математической статистике доверительные интервалы строят так же, основываясь на критериях значимости.
Решение заданий и задач по предметам:
- Теория вероятностей
- Математическая статистика
Дополнительные лекции по теории вероятностей:
- Случайные события и их вероятности
- Случайные величины
- Функции случайных величин
- Числовые характеристики случайных величин
- Законы больших чисел
- Статистические оценки
- Статистическая проверка гипотез
- Статистическое исследование зависимостей
- Теории игр
- Вероятность события
- Теорема умножения вероятностей
- Формула полной вероятности
- Теорема о повторении опытов
- Нормальный закон распределения
- Определение законов распределения случайных величин на основе опытных данных
- Системы случайных величин
- Нормальный закон распределения для системы случайных величин
- Вероятностное пространство
- Классическое определение вероятности
- Геометрическая вероятность
- Условная вероятность
- Схема Бернулли
- Многомерные случайные величины
- Предельные теоремы теории вероятностей
- Генеральная совокупность
Математическая статистика — это раздел математики, посвященный методам сбора, анализа и обработки статистических данных для научных и практических целей.
Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений; следовательно, математическая статистика имеет дело с массовыми явлениями.
Методы анализа массовых явлений — предмет многих научных дисциплин; но только в том случае, когда для анализа привлекаются формальные (абстрактные) математические модели, эти методы становятся статистическими.
Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.
Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности. Теория статистических выводов тесно связана с другой математической наукой — теорией вероятностей и базируется на ее математическом аппарату.
Содержание:
Введение в математическую статистику
Трудно найти современную область научных исследований, где бы не использовались методы математической статистики. В последнее время они нашли широкое применение в медицине, биологии, социологии, и спорте, т. е. в областях, сравнительно недавно считавшихся далекими от математики.
Чтобы понять роль математической статистики, достаточно рассмотреть типичную схему эксперимента. Специалист, занимающийся исследованиями в конкретной области (воспользуемся здесь термином «исследователь», обращаясь к деятельности научного работника), который предложил новый подход к решению определенной задачи, например новую методику, должен доказать справедливость своей рабочей гипотезы. Чаще всего единственное, что он может сделать для этой цели, — провести хорошо организованный эксперимент, результаты которого убедительно доказывают его предположения.
Традиционная схема эксперимента заключается в том, что набираются две группы испытуемых: контрольная и экспериментальная, примерно одинаковые по всем факторам, имеющим важное значение для цели исследования (пол, возраст, квалификация и т. п.). Контрольная группа подготавливается по традиционной методике, а экспериментальная — с применением предлагаемых нововведений. После определенного этапа подготовки проводится контрольное обследование и по его результатам судят об эффективности предлагаемой методики.
Конечно, на этапе формирования конкретных целей и задач эксперимента исследователь не нуждается в методах математической статистики. Здесь он является специалистом в своей области и оперирует принятыми там понятиями. Но уже на этапе отбора в контрольную и экспериментальную группы ему приходится сталкиваться с целым рядом новых для него вопросов. Какова должна быть численность групп и как должны отбираться кандидаты в эти группы? Можно ли утверждать, что по уровню подготовленности спортсмены в обеих группах одинаковы или уже на этапе отбора одна из групп существенно отличается от другой?
Дело в том, что исследователь обычно хочет знать, насколько достоверно результаты эксперимента, полученные им на группах ограниченного объема, можно обобщить для всех спортсменов данной квалификации. Интуитивно он понимает, что чем больше численность групп, тем убедительнее должны быть результаты эксперимента. Но увеличение численности групп связано с возрастанием организационных, материальных, временных и других затрат, поэтому понятно стремление уменьшить эти затраты. В общем виде ответить на вопрос о достаточности групп нельзя без анализа целей эксперимента, но, как правило, в каждом конкретном случае найти решение этой задачи можно с помощью формальных методов математической статистики. При отборе претендентов в контрольную и экспериментальную группы также применяются статистические методы, позволяющие исключить предвзятость и произвол и тем самым повысить достоверность результатов.
После проведения контрольных наблюдений исследователь получает фактический материал, представляющий собой, как правило, большой объем чистовых данных. Массив этих чисел трудно обозрим, и сделать какие-то конкретные выводы непосредственно по ним невозможно. Здесь используются методы описательной статистики, позволяющие провести классификацию первичных данных, представить их в наиболее наглядной форме и получить некоторые обобщающие показатели, которые дают возможность сравнивать между собой различные данные и делать определенные выводы.
В качестве обобщающих числовых показателей используются средние значения и характеристики варьирования (рассеяния) экспериментальных данных. Получив эти показатели для контрольной и экспериментальной групп, исследователь видит, что они различаются. Но возникает следующий вопрос: насколько достоверны эти различия? Можно ли объяснить наблюдаемое различие действием предложенных нововведений или это различие — случайность, обусловленная малым объемом фактических данных и сильной вариативностью испытуемых? Здесь не обойтись без применения математических методов проверки статистических гипотез..
Перечисленными вопросами не исчерпывается круг задач, решаемых при конкретных исследованиях с использованием методов математической статистики. Очень часто целью исследования является установление наличия и степени связи между спортивным результатом и определенными показателями тренированности, между силой мышц и скоростью их сокращения, между спортивным достижением в одном и другом видах спорта и т. п. Подобные задачи решаются методами корреляционного и регрессионного анализа.
Генеральная совокупность и выборка
Экспериментальные данные обычно представляют собой результаты измерения некоторых признаков (спортивный результат. и пр.) объектов, выбранных из большой совокупности объектов.
Часть объектов исследования, определенным образом выбранная из более обширной совокупности, называется выборкой, а исходная совокупность, из которой взята выборка, — генеральной (основной) совокупностью.
Всегда необходимо четко определять, что понимается под генеральной совокупностью. Ее состав и численность зависят от объектов и целей проводимого исследования. Объектами исследования, составляющими генеральную совокупность, являются в спорте обычно отдельные спортсмены. Если, например, самостоятельной задачей является обследование лиц, поступающих в данный институт в текущем году, то генеральная совокупность — все абитуриенты института этого года. Если мы хотим получить подобные данные для всех институтов страны, то абитуриенты данного института — уже выборка из более широкой генеральной совокупности — всех абитуриентов физкультурных вузов этого года.
Исследования, в которых участвуют все без исключения объекты, составляющие генеральную совокупность, называются сплошными исследованиями. Такие исследования нетипичны для спорта, где обычно используется выборочный метод. Суть его в том, что для обследования привлекается лишь выборка из генеральной совокупности, но по результатам этого обследования судят о свойствах всей генеральной совокупности. Конечно, для этого к выборке должны предъявляться определенные требования. Эти требования, а также правила отбора объектов генеральной совокупности в выборку обсуждаются в гл. 5.
Статистическая совокупность и статистические признаки
Все объекты (элементы), составляющие генеральную совокупность, должны иметь хотя бы один общий признак, позволяющий классифицировать объекты, сравнивать их друг с другом (пол, возраст, спортивная квалификация и т. п.). Наличие общего признака является основой для образования статистической совокупности. Таким образом, статистическая совокупность представляет собой результаты описания или измерения общих признаков объектов исследования.
Если статистическая совокупность получена в результате выборочного исследования, то она называется выборочной совокупностью, или просто выборкой. Под генеральной (статистической) совокупностью тогда подразумевается совокупность всех возможных значений признака в данном исследовании.
Важнейшая характеристика выборки — объем выборки, т. е. число элементов в ней. Объем выборки принято обозначать символом n. Относительно объема генеральной совокупности, обозначаемого N, как правило, делается предположение, что он бесконечно велик, т. е. выборка получается из бесконечной генеральной совокупности.
По одним признакам элементы генеральной совокупности могут полностью совпадать, значения же других признаков изменяются от одного элемента к другому. Например, объектами исследования могут быть представители одного вида спорта, одинаковой квалификации, одного пола и возраста, но различающиеся по силе мышц, быстроте реакции, показателям систем дыхания и кровообращения и т. д. Предметом изучения в статистике являются именно изменяющиеся (варьирующие) признаки, которые иногда называют статистическими признаками. Они делятся на качественные и количественные.
Качественные признаки — это признаки, которыми объект обладает либо не обладает. Они не поддаются непосредственному измерению (например, спортивная специализация, квалификация, национальность, территориальная принадлежность и т. п.).
Количественные признаки представляют собой результаты подсчета или измерения. В соответствии с этим они делятся на дискретные и непрерывные.
Дискретные признаки могут принимать лишь отдельные значения из некоторого ряда чисел, например число подтягиваний на перекладине, число попаданий и промахов при серии выстрелов и т. п.
Непрерывные признаки могут принимать любые значения в определенном интервале. Например, время прохождения дистанции, скорость движения, угол в суставе.
Отдельные числовые значения варьирующего признака называются вариантами. Варианты принято обозначать строчными латинскими буквами из конца алфавита: х, у, z.
Причины варьирования признаков
Признаки варьируют под воздействием большого числа различных факторов. Лишь небольшую часть этих факторов удается контролировать в процессе исследования. Пусть, например, изучаемым признаком в нашем исследовании является спортивный результат в каком-либо виде спорта. Основные факторы, определяющие спортивный результат испытуемых, нам известны (контролируются), в противном случае наше исследование лишено смысла. К числу контролируемых факторов относятся пол, возраст, спортивная квалификация, программа специальной подготовки и ряд других. Но всегда остается большое число факторов, не поддающихся контролю (влияние погодных условий, эмоциональное состояние испытуемых, мотивация и т. п.). Предсказать влияние таких неучтенных факторов на спортивный результат невозможно, поэтому наблюдаемые значения результатов оказываются случайными, а факторы, обусловливающие случайное поведение изучаемого признака, называются случайными факторами. Все перечисленные факторы (контролируемые и случайные) естественным образом определяют значение спортивного результата, поэтому их можно назвать естественными причинами варьирования результатов.
Помимо естественных причин варьирования результатов на их значения оказывают влияние ошибки измерения, которые складываются из систематических погрешностей измерительных приборов, личных ошибок исследователя (описки, пропуски и т. п.) и случайных ошибок измерения. Природа и величина случайных ошибок могут быть различными в зависимости от физических принципов, используемых в измерительных приборах. Систематические приборные погрешности могут быть в принципе уменьшены до пренебрежимо малого уровня с помощью совершенных измерительных средств. Личные ошибки исследователя зависят от его опыта и внимания и принципиально также могут быть исключены.
Случайные ошибки остаются и вместе с естественными факторами варьирования сказываются на значениях признака.
Однако, как правило, в практике спортивных измерений случайные ошибки измерения существенно меньше величины естественного варьирования признака, поэтому будем считать, что варьирование результатов измерения признака обусловлено только естественным варьированием изучаемого признака.
Эмпирические распределения
В этой лекции рассматриваются методы построения эмпирических распределений, т. е. распределений элементов выборки по значениям изучаемого признака. Построение эмпирических распределений — необходимый этап применения статистических методов.
Здесь и далее выборочные исследования будем называть «эксперимент». При рассмотрении конкретных примеров суть эксперимента будет поясняться. Выборочные данные, полученные в ходе эксперимента, будут соответственно экспериментальными (эмпирическими) данными.
По эмпирическим данным, представляющим собой выборку из некоторой генеральной совокупности, оцениваются параметры, позволяющие описать всю генеральную совокупность, определяется интервал, в котором с заданным уровнем доверия находится истинное значение оцениваемого параметра, а затем проверяются те или иные утверждения и делаются выводы о свойствах всей генеральной совокупности.
Эти методы будут рассмотрены в последующих лекциях, и, как мы увидим, их применение всегда связано с выбором подходящей математической модели для описания свойств генеральной совокупности. Правомерность использования любого статистического метода основана на предположении, что генеральная совокупность соответствует выбранной математической модели. Это предположение должно быть сделано до проведения эксперимента, однако, как правило, для обоснованного предположения не хватает информации, и тогда выбор математической модели производится на основе построения и анализа эмпирических распределений. Поэтому необходимо прежде всего уметь строить эмпирические распределения, чтобы правильно применять методы математической статистики.
Табличное представление экспериментальных данных. Вариационные ряды
Как правило, необработанные (первичные) экспериментальные данные представлены в виде неупорядоченного набора чисел, записанных исследователем в порядке их поступления. Этот набор данных трудно обозрим, и сделать по ним какие-то выводы невозможно. Поэтому первичные данные нуждаются в обработке, которая всегда начинается с их группировки.
Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.
Рассмотрим группировку на конкретном примере.
В табл. 2.1 приведены экспериментальные данные, представляющие собой результаты в беге на 100 м, показанные группой школьников — юношей IX классов (50 человек).
В этом примере выборка представляет собой 50 измеренных значений признака (результатов в беге на 100 м), т.е. объем выборки n =50. Как видим, уже при таком сравнительно небольшом объеме выборки таблица исходных данных становится трудно обозримой, поэтому и используется группировка как прием систематизации экспериментальных данных.
Группировка заключается в распределении вариант выборки по группам, или интервалам группировки, каждый из которых содержит некоторый диапазон значений изучаемого признака.
Первая задача, которую необходимо решить при группировке, состоит в том, чтобы разбить весь диапазон варьирования признака в выборке (между минимальной й максимальной вариантами выборки) на интервалы группировки. Эта задача требует определения числа интервалов группировки и ширины каждого из них. Обычно предпочтительны интервалы одинаковой ширины, а при выборе числа интервалов исходят из следующих соображений.
Группировка производится для того, чтобы построить эмпирическое распределение и сформировать с его помощью предположения о форме распределения изучаемого признака в генеральной совокупности, из которой взята выборка.
При увеличении числа интервалов группировки и, следовательно, при сужении каждого из них уменьшается число экспериментальных данных, попадающих в каждый интервал. Поскольку выборочные значения случайны, они случайным образом распределяются по интервалам группировки, поэтому картина эмпирического распределения будет содержать много случайных деталей, что мешает установить общие закономерности варьирования признака.
И наоборот, при чрезмерно широких интервалах группировки нельзя получить детальной картины распределения, поэтому возникает опасность упустить важные закономерные подробности формы распределения.
Поэтому вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке. Однако приближенно число интервалов k можно оценить исходя только из объема выборки n. Делается это одним из следующих способов:
1) по формуле Стерджеса:
2) с помощью табл. 2.2.
Вернемся к нашему примеру и воспользуемся рекомендациями табл. 2.2 для выбора числа интервалов группировки. Для объема выборки n = 50 принимаем k — 7. Заметим, что расчет по формуле Стерджеса дает k = 6,6.
Если число интервалов выбрано, то ширина каждого из них определяется по следующей формуле:
где h — ширина интервалов; — максимальная и минимальная варианты выборки.
находятся непосредственно по таблице исходных данных (табл. 2.1.).
Для рассматриваемого примера
Поскольку исходные данные определены с точностью 0,1 с, то нет никакого смысла в более точном вычислении h, поэтому округлим найденное значение ширины интервалов с учетом требуемой точности. Обычно округление производится в сторону увеличения, чтобы не уменьшать общий диапазон варьирования признака. С учетом этих замечаний принимаем h = 0,8 с.
Теперь остается наметить границы интервалов группировки. Нижняя граница первого интервала выбирается так, чтобы минимальная варианта выборки попадала примерно в середину этого интервала. Отсюда нижняя граница первого интервала определяется как
О 8
Для нашего примера
Прибавив к этой величине ширину интервала, найдем нижнюю границу второго интервала Это будет одновременно и верхняя граница
предыдущего (первого) интервала.
Аналогично находим и т. д. для всех семи интервалов.
После того как намечены границы всех интервалов, остается распределить по этим интервалам выборочные варианты. Однако при этом возникает следующий вопрос: как поступать в тех случаях, если какая-либо из вариант попадает точно на границу соседних интервалов группировки, т. е. варианта совпадает с нижней границей одного и верхней границей соседнего с ним интервала? Такие варианты могут быть с одинаковыми основаниями отнесены к любому из соседних интервалов, и, чтобы исключить неопределенность такой ситуации, уменьшим верхние границы всех интервалов на величину, равную точности измерения признака (в нашем примере на 0,1 с).
Для удобства последующей обработки сгруппированных данных вычислим срединные значения интервалов группировки , которые отстоят от нижних границ на величину, равную половине ширины интервалов, т. е.
где — нижняя граница
-го интервала.
Теперь можно приступать к заполнению статистической таблицы. Для этого заготовим таблицу, состоящую из 8 столбцов, назначение которых поясним по ходу изложения (табл. 2.3).
Заполняем вначале 3 первых столбца таблицы. В первом столбце содержится номер интервала группировки, во втором —.границы, а в третьем — срединные значения интервалов.
Далее на основании таблицы первичных данных (см. табл. 2.1) заполняем четвертый столбец. Этот столбец необязателен, но он обеспечивает удобство составления статистической таблицы и позволяет избежать возникающих при этом ошибок. Его назначение в том, чтобы упростить распределение вариант выборки по интервалам группировки. Имея перед собой таблицу исходных данных (табл. 2.1), условными значками, например черточками, отмечаем повторяемость вариант в каждом интервале, т. е. по порядку для каждого из чисел, представленных в таблице исходных данных, ставим условный значок в строке табл. 2.3, соответствующей интервалу группировки, в который это число попадает. Для удобства последующего подсчета условные значки по мере накопления объединяем в группы (в табл. 2.3 принято объединение в группы по 5).
После того как исходные данные будут исчерпаны, остается подсчитать число условных значков в каждой строке табл. 2.3. Получившиеся числа записываем в пятый столбец таблицы. Они имеют в статистике определенное название. Числа, показывающие, сколько раз варианты, относящиеся к каждому интервалу группировки, встречаются в выборке, называются частотами интервалов.
Обозначим частоты символом . Общая сумма всех частот всегда равна объему выборки п, что можно использовать для проверки правильности составления статистической таблицы.
Прежде чем продолжить заполнение статистической таблицы, дадим ряд определений.
Накопленная частота интервала — это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота. Накопленные частоты обозначим
Частостью (относительной частотой) называется отношение частоты к объему выборки. Обозначим частости символом
Накопленной частостью называется отношение накопленной частоты к объему выборки.
Обозначив накопленную частность как -, получаем:
Сумма всех частостей всегда равна 1.
Накопленные частоты для рассматриваемого примера приведены в столбце 6 табл. 2.3, частости — в столбце 7, а накопленные частости — в столбце 8.
Следует отметить, что в таком полном виде статистическая таблица необходима далеко не всегда. Часто бывает достаточным ограничиться подсчетом частот. Но остальные данные бывают полезны при последующем анализе результатов эксперимента, о чем речь пойдет ниже.
Табличное представление данных о результатах в беге на 100 м
В заключение этого раздела дадим очень важное определение вариационного ряда.
Вариационным рядом называется двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.
Вариационные ряды бывают интервальными и безынтервальными.
В интервальном вариационном ряду частоты (или частости), характеризующие повторяемость вариант в выборке, распределяются по интервалам группировки. В рассмотренном выше примере интервальный вариационный ряд представлен столбцами 3 и 5 (или 3 и 7) табл. 2.3. Интервальный вариационный ряд строится, если изучаемый признак варьирует непрерывно, но используется и для дискретно варьирующих признаков в тех случаях, когда признак варьирует в широких пределах.
В безынтервальном вариационном ряду частоты (или частости) распределяются непосредственно по значениям варьирующего признака. Для построения безынтервального вариационного ряда необходимо варианты выборки расположить в порядке возрастания или убывания (проранжировать) и затем подсчитать, сколько раз каждая из них встречается в выборке. Безынтервальный вариационный ряд применяется в тех случаях, когда исследуемый признак варьирует дискретно и слабо.
Пусть, например, при подсчете количества подтягиваний на перекладине для группы испытуемых получены данные, значения которых лежат в диапазоне от 10 до 15. Таким образом, данная выборка содержит всего шесть вариант: 10, 11, 12, 13, 14, 15. В этом случае сами варианты играют роль интервалов группировки и остается только подсчитать, сколько раз каждая из них встречается в выборке.
Графическое представление экспериментальных данных
Для повышения наглядности эмпирических распределений используется их графическое представление. Наиболее распространенными способами графического представления являются гистограмма, полигон частот и полигон накопленных частот (кумулята).
Гистограмма
Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников, как показано на рис. 2.1. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал. Таким образом, высоты прямоугольников должны быть пропорциональны величинам
где ,-—частота
-го интервала группировки; hi — ширина
-ro интервала группировки.
На графике гистограммы основание прямоугольников откладывается по оси абсцисс (х), а высота — по оси ординат (у) прямоугольной системы координат.
Однако в тех случаях, когда ширина всех интервалов группировки одинакова, вид гистограммы не изменится, если по оси ординат откладывать не величины , а частоты интервалов
На рис. 2.1, а представлена гистограмма распределения результатов в беге на 100 м, построенная по данным табл. 2.3. При группировке в табл. 2.3 были приняты интервалы одинаковой ширины, поэтому на гистограмме по оси ординат отложены частоты интервалов Заметим, что в табл. 2.3 мы искусственно уменьшили верхние границы всех интервалов группировки на 0,1 с единственной целью — исключить неоднозначность в распределении вариант, попадающих точно на границы соседних интервалов. При графическом представлении распределений в таком уменьшении верхних границ уже нет никакого смысла, поэтому на гистограмме рис. 2.1, а верхние границы интервалов совпадают с нижними границами соседних интервалов.
Продемонстрируем построение гистограммы для случаев, когда ширина некоторых интервалов группировки неодинакова. Объединим в табл. 2.3 два интервала, имеющих границы (14,8—15,6) и (15,6—16,4). Ширина такого объединенного интервала будет вдвое больше ширины остальных интервалов. Поэтому, чтобы не нарушить принцип построения гистограммы (площади прямоугольников пропорциональны частотам интервалов), по оси ординат уже нельзя откладывать частоты, а высоты прямоугольников должны быть пропорциональны отношениям . Гистограмма, полученная в результате такого объединения интервалов, приведена на рис. 2.1, б.
Полигон частот
Другим распространенным способом графического представления является полигон частот.
Полигон частот образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов,
Срединные значения откладываются по оси х, а частоты — по оси у.
Из сравнения двух рассмотренных способов графического представления эмпирических распределений следует, что для получения полигона частот из построенной гистограммы нужно середины вершин прямоугольников, образующих гистограмму, соединить отрезками прямых. Полигон частот для рассмотренного выше примера с результатами в беге на 100 м (данные табл. 2.3) представлен на рис. 2.2.
Полигон частот используется для представления распределений как непрерывных, так и дискретных признаков. В случае непрерывного распределения полигон частот является более предпочтительным способом графического представления, чем гистограмма, если график эмпирического распределения описывается плавной зависимостью.
Полигон накопленных частот
Полигон накопленных частот (к у м у-л я т а) получается при соединении отрезками прямых точек, координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. Если по оси ординат откладывать накопленные частости, то полученный график называется полигоном на. полигон накопленных частот результатов в беге на 100 м (данные табл. 2.3) приведен на рис. 2.3.
На практике полигон накопленных частот используется в основном для представления дискретных данных. Ему свойственна более плавная форма, чем у гистограммы или полигона частот.
Данное свойство и позволяет иногда отдавать предпочтение этому способу графического представления эмпирических распределений.
Числовые характеристики выборки
Вариационные ряды и графики эмпирических распределений дают наглядное представление о том, как варьирует признак в выборочной совокупности. Но они недостаточны для полной характеристики выборки, поскольку содержат много деталей, охватить которые невозможно без применения обобщающих числовых характеристик.
Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют сравнивать их между собой. Наибольшее практическое значение имеют характеристики положения, рассеяния и асимметрии эмпирических распределений.
В этой лекции рассматриваются характеристики положения и рассеяния, а также практические методы их вычисления. Характеристики асимметрии будут рассмотрены в гл. 6 применительно к проверке гипотез о виде распределения генеральной совокупности.
Характеристики положения
В этом разделе рассмотрены характеристики положения, определяющие положение центра эмпирического распределения. Чаще всего употребляются такие характеристики положения, как среднее арифметическое, медиана и мода.
Среднее арифметическое
Среднее арифметическое, или просто среднее, — одна из основных характеристик выборки. Оно представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).
Если воспользоваться геометрической интерпретацией, то среднее арифметическое можно определить как точку на оси х, которая является абсциссой центра масс гистограммы.
Среднее принято обозначать той же буквой, что и варианты выборки, с той лишь разницей, что над буквой ставится символ усреднения — черта. Например, если обозначить исследуемый признак через X, а его числовые значения — через то среднее арифметическое имеет обозначение х.
Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных. Точность вычисления по необработанным данным всегда выше, но процесс вычисления оказывается трудоемким при большом объеме выборки.
Для несгруппированных данных среднее арифметическое определяется по следующей формуле:
где n — объем выборки; — варианты выборки;
обозначение суммы n чисел
, где индекс i (порядковый номер) суммируемых чисел пробегает значения от 1 до п (1, 2, …, n).
Если данные сгруппированы, то
где n — объем выборки; k — число интервалов группировки; — частоты интервалов;
— срединные значения интервалов.
Среднее арифметическое, вычисленное по формуле (3.2), называют также взвешенным средним, подчеркивая этим, что в формуле (3.2) суммируются с коэффициентами (весами), равными частотам попадания в интервалы группировки.
Пример 3.1.
В качестве одного из тестов для оценки уровня физической подготовленности студентов 1-го курса технического вуза были выбраны прыжки в длину с места. Результаты контрольной группы студентов в количестве 15 человек оказались следующими (в см):
- 212 223 225 208 230 216 241 202
- 235 225 228 252 237 246 219
Требуется определить средний результат в контрольной группе.
По формуле (3.1) находим
В приведенном примере значение среднего арифметического вычислено приближенно, с округлением до значащей цифры, соответствующей точности измерения признака. Вопрос о том, с какой же точностью необходимо вычислять среднее, здесь подробно рассматривать не будем.).
Пример 3.2.
Вычислим среднее арифметическое результатов в беге на 100 м для экспериментальных данных, сгруппированных в табл. 2.3. Для наглядности промежуточные результаты расчетов приведены в табл. 3.1.
Среднее, рассчитанное по формуле (3.2), оказывается равным
Медиана
Медианой (Me) называется такое значение признака X, когда одна половина значений экспериментальных данных меньше ее, а вторая половина — больше.
Собственно, этим и ограничивается смысловое значение медианы. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных.
Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как
Пусть, например, имеется ранжированная выборка, содержащая нечетное число членов n = 9: 12 14 14 18 20 22 22 26 28. Тогда ранг медианы и медиана, обозначаемая символом Me, совпадает с пятым членом ряда: Me = 20.
Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Например, получен ряд из 10 членов: 6 8 10 12 14 16 18 20 22 24.
Ранг медианы оказывается равным
Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.
Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом.
Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных частостей. Медианным будет тот интервал, в котором накопленная частота впервые окажется больше n/2 (n — объем выборки) или накопленная частость — больше 0,5. Внутри медианного интервала медиана определяется по следующей формуле:
где — нижняя граница медианного интервала;
— половина объема выборки; h — ширина интервалов группировки;
— накопленная частота интервала, предшествующего медианному;
— частота медианного интервала.
В качестве примера найдем медиану для экспериментальных данных, представленных в табл. 2.3. Медиана содержится в интервале (14,8; 15,6), которому соответствует накопленная частота 27 n/2 = 25. По формуле (3.3) находим
Определив медиану, мы тем самым нашли, что в группе испытуемых одна половина бегунов показала результат лучше 15,5 с, а другая — хуже.
Как видим, медиана несколько отличается от ранее найденного среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.
Для тех случаев, когда эмпирическое распределение оказывается сильно асимметричным, среднее арифметическое теряет свою практическую ценность, поскольку при этом значительно большая часть значений признака оказывается выше или ниже среднего арифметического. В этой ситуации медиана представляет собой лучшую характеристику центра распределения.
Мода
Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто.
Интервал группировки с наибольшей частотой называется модальным.
Для определения моды используется следующая формула:
где — нижняя граница модального интервала; h — ширина интервала группировки;
— частота модального интервала;
—частота интервала, предшествующего модальному;
—частота интервала, следующего за модальным.
Для данных табл. 2.3 имеем:
с, т. е. наибольшее число бегунов в исследуемой группе показали результат, близкий к 15,7 с.
На рис. 3.1 представлена гистограмма распределения результатов в беге на 100 м с нанесенными на нее средним арифметическим, медианой и модой. Из приведенного графика видно, что указанные характеристики положения отличаются друг от друга. Это свидетельствует об асимметрии эмпирического распределения. Вообще, среднее, медиана и мода совпадают только в том случае, если распределение унимодальное (с одним максимумом) и симметричное. Чем больше распределение отличается от симметричного, тем сильнее различие между этими характеристиками.
Характеристики рассеяния
Средние значения не дают полной информации о варьирующем признаке. Нетрудно представить себе два эмпирических распределения, у которых средние одинаковы, но при этом у одного из них значения признака рассеяны в узком диапазоне вокруг среднего, а у другого — в широком. Поэтому наряду со средними значениями вычисляют и характеристики рассеяния выборки. Рассмотрим наиболее употребительные из них.
Размах вариации
Размах вариации вычисляется как разность между максимальной и минимальной вариантами выборки:
Как видим, размах вычисляется очень просто, и в этом его главное и единственное достоинство. Информативность этого показателя невелика. Можно привести очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. Не будем здесь подробно останавливаться на особенностях применения данного показателя, укажем лишь, что размах вариации используется иногда в практических исследованиях при малых (не более 10) объемах выборки. Например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. При больших объемах выборки к его использованию надо относиться с осторожностью.
Дисперсия и стандартное отклонение
Дисперсия и стандартное отклонение являются важнейшими характеристиками рассеяния.
Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического. Дисперсия, вычисляемая по выборочным данным, называется выборочной дисперсией и обознача-ется
Выборочную дисперсию вычисляют по приведенным ниже формулам:
Для несгруппированных даных:
В этой формуле — сумма квадратов отклонений значений признака Х{ от среднего арифметического х. Для получения среднего квадрата отклонений эта сумма поделена на объем выборки n.
Для сгруппированных в интервальный вариационный ряд данных:
Здесь ~ срединные значения интервалов группировки;
а
—взвешенная сумма квадратов отклонений.
На практике выборочная дисперсия в виде (3.5) или (3.6) вычисляется редко, а вместо этих формул используются следующие.
Для несгруппированных данных:
Для данных, сгруппированных в интервалы:
Различие этих формул лишь в том, что в последних деление сумм квадратов отклонений производится не на объем выборки п, как того требует вычисление среднего квадрата, а на n — 1. Смысл этого уточнения будет ясен из гл. 5 (см. замечание 1 к гл. 5).
Стандартным отклонением (или средним квадратическим отклонением) называется положительный корень квадратный из дисперсии:
Размерность стандартного отклонения в отличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для характеристики рассеяния используют обычно стандартное отклонение, а не дисперсию.
Вычисление дисперсии и стандартного отклонения непосредственно по формулам (3.7) — (3.9) неудобно по следующим причинам:
- При вычислении суммы квадратов отклонений приходится каждый раз вычитать из значений признака (или срединных значений интервалов)
предварительно вычисленное х, а затем возводить полученные разности в квадрат. При ручных методах вычислений это вызывает трудности, особенно в случаях многоразрядных значений xi.
- Среднее арифметическое
, входящее в эти формулы, обычно вычисляется с некоторой погрешностью округления. Она приводит к накоплению ошибки округления результатов (дисперсии и стандартного отклонения). Опасность существенных ошибок округления увеличивается с увеличением объема выборки.
Поэтому на практике используют другие расчетные формулы, более удобные как для ручных расчетов, так и для вычислений на ЭВМ.
Для несгруппированных данных
или
Соответственно, если данные сгруппированы
Приведенные формулы легко получаются из исходных выражений (3.7), (3.8), если в последних раскрыть квадрат разности под знаком суммы. Читателю предлагается проверить справедливость формул (3.10) — (3.13) самостоятельно.
Формулы (3.10) и (3.12) применяются для определения дисперсии, если среднее арифметическое уже вычислено. При этом следует иметь в виду, что при подстановке х в эти формулы его значение не следует округлять, иначе результат может получиться с большой ошибкой.
Формулы (3.11) и (3.13) используются в тех случаях, когда среднее и дисперсия вычисляются одновременно.
Пример 3.3.
Рассмотрим вначале пример вычисления характеристик рассеяния по несгруппированным первичным данным. Воспользуемся данными примера 3.1 и найдем дисперсию и стандартное отклонение результатов в прыжках в длину с места для контрольной группы студентов.
Таблица 3.3
По формуле (3.11) получаем:
Стандартное отклонение составит:
Промежуточные расчеты приведены в табл. 3.3.
Пример3.4
В качестве примера расчета для сгруппированных данных найдем дисперсию и стандартное отклонение результатов в беге на 100 м по данным табл. 2.3.
Взвешенная сумма квадратов срединных значений интервалов группировки на основании расчетов в табл. 3.4 составит:
Взвешенная сумма срединных значений По формуле (3.13)
Отсюда стандартное отклонение
Коэффициент вариации
Стандартное отклонение выражается в тех же единицах измерения, что и характеризуемый им признак. Если требуется сравнить между собой степень варьирования признаков, выраженных в разных единицах измерения, возникают определенные неудобства. Пусть, например, результаты в беге на 100 м, показанные группой IX классов, имеют стандартное отклонение 0,9 с (данные примера 3.4), а исследование роста тех же учащихся показывает, что его стандартное отклонение составляет 6 см (при среднем росте 168 см). Какой из признаков варьирует сильнее? Очевидно, что только на основании сравнения стандартных отклонений на этот вопрос ответить нельзя. Требуется сопоставить стандартные отклонении со средними арифметическими этих признаков. Поэтому вводится относительный показатель называемый коэффициентом вариации.
Обычно он выражается в процентном отношении:
Коэффициент вариации является относительной мерой рассеяния признака.
Для рассматриваемых примеров:
Как видим, результаты в беге на основании полученных выборочных данных варьируют сильнее, чем рост учащихся.
Коэффициент вариации используется и как показатель однородности выборочных наблюдений. По данным 18], считается, что если коэффициент вариации не превышает 10%, то выборку можно считать однородной, т. е. полученной из одной генеральной совокупности.
Однако к использованию коэффициента вариации нужно подходить с осторожностью. Продемонстрируем возможные ошибки на следующем примере. Если на основании многолетних наблюдений среднее арифметическое среднесуточных температур 8 марта составляет в какой-либо местности 0°С, то по формуле (3.14) получим бесконечный коэффициент вариации независимо от разброса температур. Поэтому в данном случае коэффициент вариации не применим в качестве показателя рассеяния температур, а специфику явления более объективно оценивает стандартное отклонение S.
Коэффициент вариации можно использовать как относительную меру рассеяния только в тех случаях, когда значения признака измерены в шкале с абсолютным нулем.
Практически коэффициент вариации применяется в основном для сравнения выборок из однотипных генеральных совокупностей.
Упрощенные методы вычисления среднего арифметического, дисперсии и стандартного отклонения
В тех случаях, когда экспериментальные данные х, представлены большим числом значащих цифр, вычисление среднего арифметического, и особенно дисперсии и стандартного отклонения, усложняется наличием громоздких операций над многоразрядными числами (см. примеры 3.3 и 3.4). Конечно, эти трудности становятся несущественными, если для статистических расчетов применяются ЭВМ. Но в тех случаях, когда возникает необходимость в ручных вычислениях, полезно помнить элементарные правила, позволяющие существенно упростить расчеты. Кроме того, рассмотренные ниже методы позволяют упростить обработку данных и при использовании вычислительных средств за счет упрощения процедуры ввода данных с клавиатуры ЭВМ или калькулятора. Это уменьшает затраты времени и число допускаемых при вводе ошибок.
Эти методы основаны на следующих математических свойствах среднего арифметического и дисперсии.
1. Если вычесть из всех выборочных значений любое постоянное число хо, т. е. заменить исходные данные
на новые значения
путем преобразования
и найти среднее арифметическое и дисперсию
для преобразованных данных
то эти характеристики будут связаны со средним арифметическим х и дисперсией
для исходных данных следующим образом:
Следовательно, можно вместо непосредственного определения выборочных характеристик х и вначале вычесть из выборочных данных
некоторое постоянное число
а затем найти среднее арифметическое и дисперсию по преобразованным таким образом данным. При этом, как следует из формул (3.15) и (3.16), чтобы найти среднее арифметическое
нужно добавить
к среднему арифметическому
определенному по преобразованным данным, а дисперсии
для исходных и преобразованных данных будут равны между собой.
Смысл предварительного преобразования исходных данныхсостоит в том, чтобы упростить расчеты, заменив исходные данные более простыми числами
Обычно в качестве
выбирается варианта, находящаяся примерно в середине ранжированного ряда выборочных значений
, поэтому рассматриваемый метод называется в литературе методом условного среднего.
2. Если разделить выборочные значения х-, на постоянный коэффициент С, т. е. использовать преобразование
числовые характеристики
вычисленные по преобразованным данным, будут связаны с искомыми
следующим образом:
Этот прием во многих случаях позволяет упростить вычисления, если удается путем деления на постоянный коэффициент преобразовать исходные данные в целые числа или уменьшить разрядность исходных данных. Пусть, например, исходные данные измерены с точностью 0,5 единицы (…11,5, 12,0, 12,5 13,5…). Тогда естественным упрощением будет деление этих значений на С = = 0,5, в результате чего получим преобразованные данные (… 23 24 25 27…), оперировать которыми проще.
3. Иногда полезным оказывается совместное использование двух рассмотренных выше приемов, например, преобразование вида: В этом случае
Такое преобразование исходных данных всегда позволяет достичь существенного упрощения, если выборочные среднее арифметическое и дисперсия вычисляются по сгруппированным в интервальный вариационный ряд данным. В качестве условного среднего выбирается срединное значение примерно в центре вариационного ряда, а постоянный коэффициент С берется равным ширине интервалов группировки h. При этом любые исходные данные всегда преобразуются в натуральные числа 1, 2, 3, 4…, и вычисление выборочных характеристик для преобразованных данных сводится к элементарным операциям. Искомые характеристики
в соответствии с (3.19) и (3.20) вычисляются по следующим формулам:
где преобразованные срединные значения:
— частоты интервалов группировки.
Пример 3.5.
Определим методом условного среднего среднее арифметическое и стандартное отклонение результатов в прыжках в длину с места, показанных контрольной группой студентов I курса (данные примера 3.1). Для этого ранжируем исходные данные, располагая их в порядке возрастания (столбец 2 табл. 3.5).
Та6лица 3.5 Вычисление среднего арифметического и дисперсии результатов в прыжках в длину с места методом условного среднего
Расчет среднего арифметического и дисперсии результатов в беге на 100 м методом условного среднего
В качестве условного среднего выбираем значение 225, находящееся примерно в середине ранжированного ряда.
По формулам (3.15) и (3.16) находим:
Отсюда стандартное отклонение
Промежуточные расчеты приведены в табл. 3.5. Разумеется, получены те же значения выборочных характеристик, что и в примерах 3.1 и 3.3 при вычислении прямым методом, но сравнение табл. 3.5 с табл. 3.3 показывает, что промежуточные вычисления упростились.
Пример 3.6.
Продемонстрируем применение упрощенных методов для сгруппированных в интервальный вариационный ряд данных. Воспользуемся приведенными выше в примерах 3.2 и 3.4 данными о результатах в беге на 100 м группы школьников.
На основании приведенных в п. 3 настоящего раздела рекомендаций выбираем условное среднее =16,0 и коэффициент С = 0,8.
По формулам (3.21) и (3.22) находим:
Промежуточные расчеты приведены в табл. 3.6 и наглядно демонстрируют упрощение, достигаемое при использовании метода условного среднего (сравните с табл. 3.2 и 3.4).
Задачи к гл. 2.3
1. Ниже приведены результаты (в см), показанные группой школьников (70 человек) в тесте «Прыжок в высоту с места».
A. Выполните группировку данных при числе интервалов группировки к = 8, используя рекомендации гл. 2; для исключения неопределенности при распределении вариант, приходящихся на границы интервалов группировки, верхние границы интервалов уменьшаются на величину, равную точности измерения признака.
Б. Сгруппируйте данные, увеличив для исключения указанной неопределенности нижние границы интервалов группировки на величину, равную точности измерения.
B. Постройте для обоих методов группировки гистограмму, полигон частот и полигон накопленных частот. Наблюдается ли различие в форме распределений?
Г. Определите для двух случаев группировки среднее арифметическое и стандартное отклонение. Прокомментируйте результаты, полученные в п.п. «А», и «Г».
2. Ниже приведены результаты (в см) измерения длины бегового шага для 43 спринтеров в зоне 20 м от линии финиша на дистанции 100 м:
А. Составьте интервальный вариационный ряд, постройте гистограмму, полигон частот и полигон накопленных частот.
Б. Найдите среднее арифметическое и стандартное отклонение прямым методом и методом условного среднего с помощью преобразования исходных данных: .
3. Группа юных спортсменов в количестве 50 человек для оценки уровня общефизической подготовки тестировалась но числу подтягиваний на перекладине. Результаты распределились следующим образом:
А. Постройте полигон частот и полигон накопленных частот.
Б. Определите среднее арифметическое и стандартное отклонение прямым методом и методом условного среднего с помощью преобразования:
4. Ниже приведены результаты (в мл) исследования жизненной емкости легких (ЖЕЛ) 20 школьников:
Определите среднее арифметическое и стандартное отклонение результатов прямым методом и методом условного среднего.
5. Найдите Me и Мо по данным задач 2 и 3.
6. Ниже приведены результаты (в кГ), показанные группой студентов (65 человек), динамометрии правой руки.
А. Найдите среднее арифметическое и медиану для представленных данных. Какие выводы о форме распределения можно сделать из сопоставления среднего и медианы?
Б. Постройте гистограмму распределения. Рассчитайте коэффициент вариации. Какие предположения можно сделать относительно однородности выборки (однородности состава обследуемой группы студентов)?
Элементы теории вероятностей
В предыдущих двух лекциях были рассмотрены эмпирические распределения и методы вычисления их числовых характеристик. Но обработка экспериментальных данных не ограничивается рассмотренными методами. Обычно исследователь, получив данные эксперимента на одной или нескольких группах испытуемых и определив по ним некоторые обобщающие числовые характеристики (среднее, стандартное отклонение и др.), пытается найти ответ на следующие вопросы: насколько точно полученные результаты можно обобщить для более широкой совокупности (например, на всех спортсменов данного возраста и квалификации)? Как хорошо его данные согласуются с данными других исследователей? Насколько достоверно различие экспериментальных данных, полученных в разных группах испытуемых или в одной и той же группе, но в разные промежутки времени? Существует ли связь между различными признаками, изучаемыми в проводимом исследовании, и если да, то насколько она сильна?
В ряде случаев исследователь пытается установить некую экспериментальную зависимость между изучаемыми признаками, чтобы по значениям одного из них, легко поддающегося измерению, установить значение другого, измерить который трудно или невозможно.
Конечно, в зависимости от целей конкретного исследования задачи могут быть различными и не ограничиваются приведенным перечнем.
Методы математической статистики, с помощью которых можно получить ответы на поставленные выше вопросы, рассматриваются в гл. 5—7. Чаще всего эти методы основаны на использовании тех или иных согласующихся с условиями проводимого эксперимента математических моделей, разработанных теорией вероятностей.
В данной лекции рассматриваются некоторые ее элементарные. положения в том минимальном объеме, который необходим для дальнейшего изложения.
Статистический подход к определению вероятности
Испытание, событие, случайная величина
Под испытанием (случайным испытанием) в теории вероятностей принято понимать наблюдение какого-либо явления при соблюдении определенного комплекса условий, который должен каждый раз строго выполняться при повторении данного испытания. Если то же самое явление наблюдается при другом комплексе условий, то это уже другое испытание.
Результаты испытаний можно охарактеризовать качественно и количественно.
Качественная характеристика заключается в регистрации какого-либо явления, которое может наблюдаться или не наблюдаться при данном испытании. Любое из этих явлений называется в теории вероятностей событием.
Когда речь идет о соблюдении комплекса условий данного испытания, имеется в виду постоянство значений всех факторов, контролируемых в данном испытании. Но при этом, как правило, имеет место большое число неконтролируемых факторов, которые трудно или невозможно учесть. Значения неконтролируемых факторов могут быть различными при каждом повторении испытания, поэтому результаты испытания оказываются случайными. Событие может произойти или не произойти.
Теория вероятностей рассматривает именно такие случайные события. При этом предполагается, что испытание может быть повторено неограниченное (по крайней мере, теоретически) число раз. Например, выполнение штрафного броска в баскетболе есть испытание, а попадание в кольцо — событие.
Другим примером события, часто приводимым в учебниках по теории вероятностей, является выпадение определенного числа очков (от 1 до 6) при бросании игральной кости.
События в теории вероятностей принято обозначать начальными прописными латинскими буквами А, В, С, …
Количественная характеристика испытания состоит в определении значений некоторых величин, которыми интересуются при данном испытании (например, число подтягиваний на перекладине или время на беговой дистанции). В силу действия большого числа неконтролируемых факторов эти величины могут принимать различные значения в результате испытания. Причем до испытания невозможно предсказать значение величины, поэтому она называется случайной величиной.
Вероятность событий
Будем фиксировать число испытаний, в результате которых появилось некоторое событие А. Пусть было проведено N испытаний, в результате которых событие А появилось ровно раз. Тогда число
называется частотой события, а отношение
— частостью (относительной частотой) события.
Замечательным экспериментальным фактом является то, что частость события при большом числе повторений испытания начинает мало изменяться и стабилизируется около некоторого определенного значения, в то время как при малом числе повторений она принимает различные, совершенно случайные значения. Поэтому интуитивно ясно, что если при неограниченном повторении испытания частость события будет стремиться к вполне определенному числовому значению, то это значение можно принять в качестве объективной характеристики события А. Такое число Р(A), связанное с событием А, называется вероятностью события А.
Математически неограниченное число повторений испытания записывается в виде предела при N, стремящемся к бесконечности
;
Поскольку никогда не может превзойти N, то вероятность оказывается заключенной в интервале
Следует отметить, что приведенное определение вероятности является абстрактным, оно не может быть экспериментально проверено, так как на практике нельзя реализовать бесконечно большое число повторений испытания.
Действия над событиями
В этом разделе приводятся основные правила операций над событиями с использованием для наглядности их графического изображения в виде диаграмм.
Вначале введем понятие «поле событий» как совокупности всех случайных событий данного испытания, для которых определены вероятности. На рис. 4.1 поле событий изображено в виде заштрихованного прямоугольника.
1. Сумма (объединение) событий (рис. 4.2) представляет собой сложное событие, состоящее в появлении хотя бы одного из событий A и B. Объединение событий обозначается как
2. Произведением (пересечением) событий А и В называется их совместное появление (рис. 4.3). Обозначается произведение событий как , или АВ,
3. Достоверным событием называется событие, которое обязательно происходит в результате данного испытания (рис. 4.4). Оно обозначается обычно как Е.
4. Невозможное событие — событие, которое не может произойти в результате данного испытания. Принятое обозначение — .
5. Несовместными называются события, которые в результате данного испытания не могут произойти вместе (рис. 4.5). Примеры несовместных событий: попадание и промах при выстреле, выпадение двух и трех очков при бросании игральной кости. Рис. 4.5 наглядно показывает, что для несовместных событий АВ=- .
6. Противоположным к А событием называется событие, состоящее в непоявлении события А (рис. 4.6). Обозначается противоположное событие символом А. Примеры противоположных событий: промах и попадание при выстреле, выпадение герба или цифры при одном подбрасывании монеты.
Исчисление вероятностей
Непосредственное определение вероятностей
В некоторых простейших случаях вероятности событий могут быть легко определены непосредственно исходя из условий испытаний.
Представим себе общую схему таких испытаний.
Пусть испытание имеет n возможных исходов, т. е. отдельных событий, могущих появиться в результате данного испытания; причем при каждом повторении испытания возможен один и только один из этих исходов. Таким образом, все n исходов испытания несовместны. Кроме того, по условиям испытания нет никаких оснований предполагать, что один из исходов появляется чаще других, т. е. все исходы являются равновозможными.
Допустим теперь, что при п равновозможных исходах интерес представляет некоторое событие А, появляющееся при каждом из т исходов и не появляющееся при остальных n —m исходах. Тогда принято говорить, что в данном испытании имеется п случаев, из которых m благоприятствуют появлению события А.
Вероятность события А в такой схеме равна отношению числа случаев, благоприятствующих событию А, к общему числу всех равновозможных несовместных случаев:
Формула (4.1) представляет собой так называемое классическое определение вероятности по Лапласу, пришедшее из области азартных игр, где теория вероятностей применялась для определения перспективы выигрыша.
Рассмотрим несколько примеров на вычисление вероятностей по формуле (4.1).
Пример 4.1
Испытание состоит в подбрасывании игральной кости, на каждой из граней которой проставлено число очков (от 1 до 6). Какова вероятность того, что: 1) выпадает 2 очка? 2) выпадает нечетное число очков?
В данном испытании имеется 6 равновозможных случаев (выпадение 1, 2, 3, 4, 5, 6 очков), так как нет оснований предполагать, что появление какого-то определенного числа очков более вероятно (если, конечно, кость симметрична). Поэтому вероятность выпадения любого числа очков, в том числе и 2, при одном подбрасывании 1 равна —
Событию А, заключающемуся в появлении нечетного числа очков, благоприятствуют три случая (выпадение 1, 3 и 5), поэтому по формуле (4.1) получаем
Пример 4.2
В урне 5 белых и 10 черных шаров. Шары тщательно перемешивают и затем наугад вынимают 1 шар. Какова вероятность того, что вынутый шар окажется белым?
В этом примере имеется 15 случаев, причем ожидаемому событию (появлению белого шара) благоприятствуют 5 из них, поэтому искомая вероятность составит
Основные правила вычисления вероятностей сложных событий
Ниже приведены основные правила, позволяющие определить вероятность появления сложного события на основании известных вероятностей составляющих его более простых событий.
1. Вероятность достоверного события равна единице:
2. Вероятность объединения (суммы) несовместных событий равна сумме их вероятностей:
Эти два равенства являются аксиомами теории вероятностей, т. е. принимаются в качестве исходных, но требующих доказательства свойств вероятностей. На их основе строится вся теория вероятностей.
Все остальные, приведенные ниже без доказательств формулы могут быть выведены из принятых аксиом.
3. Вероятность невозможного события равна нулю:
4. Вероятность события, противоположного событию А, равна
Формула (4.5) оказывается полезной на практике в тех случаях, когда вычисление вероятности непосредственно события А затруднительно, в то время как вероятность противоположного события находится просто.
5. Теорема сложения вероятностей. Вероятность объединения произвольных событий равна сумме их вероятностей за вычетом вероятности произведения событий:
Для несовместных событий Р(АВ) = 0 и формула (4.6) переходит в (4.2).
6. Условная вероятность. Если требуется найти вероятность события В при условии, что произошло некоторое другое событие А, то такую ситуацию характеризуют с помощью условной вероятности Условная вероятность равна отношению вероятности произведения событий А и В к вероятности события А:
В тех случаях, когда события А и В несовместны, Р(АВ) = 0 и соответственно
Определение условной вероятности в виде (4.7) дает возможность записать следующую формулу для вычисления вероятности произведения событий:
Последняя формула носит название теоремы умножения вероятностей.
7. Вероятности для независимых событий. Два события называются независимыми, если появление одного из них не изменяет вероятности другого, иначе говоря, появление одного из них не содержит никакой информации о другом.
Для независимых событий A и В:
Поскольку вероятность события Л (или В) для независимых событий по определению не изменяется при появлении другого события, то условная вероятность Р(А В) совпадает с вероятностью события Л, а условная вероятность — с Р(В). Вероятности Р(А) и Р(В) в отличие от условных вероятностей называются безусловными.
Теорема умножения вероятностей для независимых событий записывается следующим образом:
т. е. вероятность произведения независимых событий равна произведению их вероятностей.
Пример 4.3
В урне 5 белых, 4 черных и 8 красных шаров. Какова вероятность того, что первый наугад вынутый шар окажется черным или красным?
Здесь имеется всего 17 случаев, из которых появлению черного шара благоприятствует 4, а появлению красного — 8. Поэтому вероятность события Л — появление черного шара:
а вероятность события В — появление красного шара:
Поскольку события A и В несовместны (вынимается всего один шар), то по формуле (4.2) сложения вероятностей несовместных событий получаем:
Пример 4.4
В студенческой группе 25 человек. Какова вероятность того, что дни рождения хотя бы у двоих совпадают?
Вероятность того, что дни рождения у двух произвольно взятых людей совпадают, равна .(Считаем, что попадание дня рождения на любой день в году — равновозможные случаи). Тогда вероятность того, что дни рождения двух людей не совпадают, по формуле (4.5) для вероятности противоположного события равна
Вероятность того, что день рождения третьего отличается от дней рождения двух предыдущих, составит
(363 случая из 365 благоприятствуют этому событию). Рассуждая аналогично, находим, что для 25-го члена группы эта вероятность равна
Теперь найдем вероятность того, что дни рождения всех 25 членов группы не совпадают. Поскольку все эти события (несовпадение дня рождения каждого очередного члена группы с днями рождения предыдущих) независимы, то по формуле (4.10) умножения вероятностей независимых событий получаем: Мы нашли вероятность того, что дни рождения у всех 25 человек не совпадают. Вероятность противоположного события будет вероятностью того, что хотя бы у двоих дни рождения совпадают, т. е. искомой вероятностью.
Определяем ее по формуле
Пример 4.5
В урне 3 белых и 7 черных шаров. Какова вероятность того, что два подряд наугад вытянутых шара окажутся белыми?
Нас интересует вероятность произведения двух событий: — при первом испытании вынут белый шар и
— при втором испытании вынут белый шар. По формуле (4.8) вероятность такого события равна
=
Вероятность события
составит:
После первого испытания в урне осталось 9 шаров, из которых 2 белых, поэтому условная вероятность
Отсюда искомая вероятность равна:
Случайные величины
Выше мы уже дали интуитивное определение случайной величины, характеризующей количественные результаты испытания и способной в одних и тех же условиях испытания под воздействием случайных причин принимать различные значения.
Изучение случайных величин в теории вероятностей требует связи этих величин с определенными событиями, которые заключаются в попадании случайной величины в некоторый интервал и для которых определены вероятности. Иначе говоря, необходимо связать случайную величину с полем событий данного испытания (см. определение поля событий в разделе 4.3).
Для формального определения случайной величины можно поступить следующим образом: пусть при измерении определенного признака объекта получается некоторая величина X, выражаемая действительными числами. Определим событие А как событие, состоящее в том, что величина X меньше или равна заданному числовому значению В последовательности испытаний, т. е. при измерениях на некоторой последовательности объектов, событие А может появиться или не появиться. Тогда, если для любого заданного х определена вероятность
X называется случайной величиной.
Обычно рассматриваются два типа случайных величин: дискретные и непрерывные.
Дискретные случайные величины принимают в результате испытания одно из дискретного множества значений. Они хорошо подходят для описания результатов измерений, связанных с подсчетом и выражаемых целыми числами.
Примеры дискретных случайных величин: число подтягиваний на перекладине, число попаданий в кольцо в серии из 10 штрафных бросков и т. п.
Вероятность принятия дискретной случайной величиной каждого из возможных ее значений больше нуля. Эта вероятность может быть записана как
Здесь X — обозначение случайной величины; — конкретные числовые значения, принимаемые дискретной случайной величиной;
— вероятности этих значений.
Индекс i может в общем случае пробегать значения от —
Функция связывающая значения дискретной случайной величины с их вероятностями, называется ее распределением (законом распределения).
Непрерывные случайные величины в результате испытания могут принимать любые значения из некоторого интервала.
Примеры непрерывных случайных величин: спортивный результат в беге или прыжках, рост и масса тела человека, сила мышц и др.
Строго говоря, при практических измерениях результаты всегда получаются с точностью до некоторого значения (например, 0, 01 с при измерении времени на беговой дистанции), поэтому их можно было бы описывать, пользуясь моделью дискретных случайных величин, так как они принимают дискретные значения из некоторого интервала: результат в беге—10,12; 10,13; 10,14; …. рост человека —171, 172, 173 Но число возможных значений, как правило, настолько велико, что гораздо удобнее оказывается модель непрерывных случайных величин, хотя она и является в данном случае математической идеализацией.
Поскольку число возможных значений непрерывной случайной величины бесконечно велико и чаще всего нет оснований предположить, что одни значения появляются существенно чаще других, то вероятность принятия непрерывной случайной величиной каждого отдельного значения оказывается равной нулю. По этой причине нельзя описать распределение непрерывной случайной величины в виде вероятностей ее отдельных значений, как в случае дискретных случайных величин. Здесь необходимы другие подходы, которые будут рассмотрены в разделах 4.6 и 4.7.
Функция распределения
Рассмотрим вероятность того, что случайная величина X окажется меньше или равной некоторому заданному числу х, т. е.
Эта вероятность, рассматриваемая как функция переменной х, называется функцией распределения случайной величины X. Она используется для записи распределений как дискретных, так и непрерывных случайных величин.
Обратимся вначале к дискретной случайной величине и поясним построение функции распределения на конкретном примере.
Пусть баскетболист выполняет серию из 10 штрафных бросков, причем вероятность попадания в кольцо для каждой из попыток равна 0,5. Определим вероятность того, что в данной серии баскетболист поразит кольцо ровно 0; 1; 2; …; 10 раз.
Вероятность попадания с одной попытки обозначим как Р = 0,5. Тогда вероятность промаха составит q = 1—Р = 0,5.
Этот пример подходит под общую схему, известную в теории вероятностей как схема Бернулли, описываемая биномиальным распределением: если р — вероятность «успеха» в данном испытании, a q— 1 — р — вероятность «неуспеха», тогда вероятность того, что в п испытаниях «успех» наступит ровно х раз, определяется следующим выражением:
где — биномиальные коэффициенты (число возможных сочетаний из п элементов по х).
Биномиальное распределение широко используется в математической статистике, таблицы биномиальных вероятностей приведены в [4].
Для нашего примера вероятности попадания в кольцо ровно 0; 1; 2; …; 10 раз равны:
Случайная величина (число попаданий в серии из 10 бросков) обозначается через X. События, состоящие в том, что случайная величина X принимает каждое из возможных значений X = 0, X = 1, …, X = 10, являются несовместными, так как случайная величина X может принимать в данной серии испытаний только одно значение.
Определим теперь функцию распределения случайной величины и рассмотрим ее поведение на графике (рис. 4.7).
Рис. 4.7 Функция распределения дискретной случайной величины При значение
равно нулю, так как случайная величина X не может принимать значения меньше 0. При
В интервале от 0 до не изменяется, поскольку случайная величина X не принимает значений в этом диапазоне.
Рассмотрим интервал . Событие
для этого интервала представляет собой сумму двух событий: X — 0 и X — 1, и поскольку эти события несовместны, то по теореме сложения вероятностей (4.2)
Аналогично для интервала +
, для интервала
и т. д.
Таким образом, функция распределения остается постоянной на интервалах между значениями
которые может принимать случайная величина X. И только в этих точках
она скачком меняет свое значение на величину, равную вероятности
, т. е. функция распределения дискретной случайной величины является ступенчатой функцией. Это свойство является общим для всех дискретных случайных величин.
Если известна функция распределения, легко найти вероятность показания случайной величины в заданный интервал:
т. e. вероятность того, что случайная величина X окажется меньше или равной но больше
определяется как разность значений функции распределения в точках
Например, нужно найти для рассматриваемого примера вероятность того, что баскетболист в серии из 10 штрафных бросков наберет число очков меньше 8, но больше 3. По формуле (4.13) получаем:
Перейдем теперь к непрерывным случайным величинам. Как было сказано ранее, вероятность принятия непрерывной случайной величиной какого-либо конкретного значения равна 0. Следовательно, функция распределения не может иметь скачков, как для дискретной случайной величины. Функция распределения непрерывной случайной величины будет гладкой (непрерывной) функцией (рис. 4.8).
Для непрерывной случайной величины важную роль играет вероятность попадания ее в заданный интервал, которая по известной функции распределения находится как В этом выражении совершенно не обязательно записывать интервал таким образом. Можно было бы записать
при этом вероятность попадания случайной величины в интервал не изменится. Это связано с тем, что, как уже отмечалось, функция распределения случайной непрерывной величины не имеет скачков ни при каких значениях х.
Функция распределения представляет собой теоретический аналог полигона накопленных частот, рассмотренного в разделе 2.3.
Плотность распределения вероятностей
Для непрерывных случайных величин вводится понятие «плотность распределения вероятное-т е й», или «плотность вероятностей», играющее исключительно важную роль при их описании.
Плотность вероятностей — это производная от функции распределения непрерывной случайной величины, т. е.
Более подробно при рассмотрении конкретных непрерывных распределений об этой функции рассказано в разделе 4.9. Вид плотности вероятностей показан на рис. 4.9.
Рис. 4.9. Вид плотности распределения вероятностей Вероятность попадания непрерывной случайной величины в интервал между значениями Х и х2 пропорциональная площади под кривой плотности вероятностей, заключенной между точками Эта вероятность математически записывается в виде интеграла от
в пределах
:
Плотность вероятностей является теоретическим аналогом гистограммы, рассмотренной в разделе 2.3 гл. 2.
Числовые характеристики случайных величин
Распределение случайной величины, заданное в виде функции распределения или плотности вероятностей, полностью ее характеризует. Однако такая исчерпывающая характеристика случайной величины сложна и далеко не всегда необходима. Для решения многих практических задач не нужно знать распределение случайной величины, а достаточно иметь лишь некоторые обобщающие числовые характеристики этого распределения.
Математическое ожидание
Для более наглядного определения математического ожидания (среднего значения) случайной величины рассмотрим подход к этому понятию на конкретном примере.
Пусть имеется дискретная случайная величина X с возможными значениями и вероятностями этих значений
В качестве X рассмотрим уже знакомую случайную величину — число попаданий в серии из 10 штрафных бросков в баскетболе. Если баскетболист с достаточными для отдыха промежутками времени, чтобы условия испытания не изменялись, выполняет большое число (n) таких серий из 10 бросков, то каждое из значений
(попал 0; 1; …. 10 раз) будет наблюдаться некоторое число раз. Обозначим эти числа через
Очевидно, что сумма
Таким образом, имеем n наблюдений случайной величины X, т. е. выборку объема n. Определим по формуле (3.2) выборочное среднее арифметическое:
Здесь индекс n при x обозначает, что среднее арифметическое вычислено по п наблюдениям.
Теперь представим, что испытание, состоящее в серии из 10 бросков, повторяется неограниченное число раз. Здесь, абстрагируясь от физической реализуемости такого эксперимента, будем считать, что наблюдению доступна вся теоретически бесконечная генеральная совокупность значений случайной величины X.
Согласно первоначальному определению вероятности, данному в разделе 4.2.2, относительные частоты событий стремятся к их вероятностям при неограниченном повторении испытания.
Поэтому в пределе при
Таким образом, выборочное среднее арифметическое случайной величины X стремится при неограниченном повторении испытания (при неограниченном увеличении объема выборки) к некоторому постоянному числу, так как в последней сумме — постоянные числа. Это число носит название математического ожидания (среднего значения) случайной величины.
Математическое ожидание обозначает как М (X) или
Математическое ожидание дискретной случайной величины равно сумме всех ее возможных значений, умноженных на вероятности этих значений:
В этой записи означает, что суммирование производится по всем возможным i.
Только что рассмотренный пример показывает, что математическое ожидание — абстрактное понятие. Оно является теоретическим аналогом выборочного среднего арифметического.
Математическое ожидание равно среднему значению генеральной совокупности.
Для непрерывных случайных величин математическое ожидание определяется с помощью плотности вероятностей по формуле:
Дисперсия и стандартное отклонение
Точно так же, как математическое ожидание, являющееся теоретическим аналогом среднего арифметического, можно ввести теоретические аналоги всех числовых характеристик выборки, рассмотренных в гл. 3. Для этого нужно в соответствующих формулах для выборочных характеристик заменить все средние арифметические на математические ожидания.
Дисперсией случайной величины X называется математическое ожидание квадрата отклонений случайной величины от ее математического ожидания (сравните с определением п. 3.4.2). Дисперсия обозначается как
Для дискретных случайных величин
т. е. дисперсия дискретной случайной величины равна сумме квадратов отклонений отдельных значений случайной величины от ее математического ожидания, умноженных на вероятности этих значений.
Для непрерывных случайных величин
Положительный корень квадратный из дисперсии называется средним квадратическим (стандартным) отклонением случайной величины.
Эта величина обозначается, как ах
Дисперсия и стандартное отклонение характеризуют изменчивость (вариативность) случайной величины. Чем сильнее случайная величина отклоняется от своего математического ожидания, тем больше величины и
Последнюю
использовать удобнее, так как его размерность совпадает с размерностью случайной величины (например, см. с, кг и др.).
Пример 4.6
Определим в качестве примера математическое ожидание и стандартное отклонение случайной величины X, представляющей собой число попаданий в серии из 10 штрафных бросков в баскетболе при вероятности попадания с одного броска р — 0,5.
Как мы уже знаем, наша случайная величина имеет биномиальное распределение (4.12). Если подставить значения биномиальных вероятностей (4.12) в формулы (4.16) и (4.18), то после соответствующих преобразований, которые здесь не приводятся, получим:
В этих выражениях п — число повторений испытания в серии испытаний, т. е. в этом примере число бросков в серии
Моменты
Математическое ожидание и дисперсия представляют собой частные случаи общих числовых характеристик случайной величины, называемых моментами.
Ниже кратко рассматриваются лишь так называемые центральные моменты случайной величины.
K-м центральным моментом случайной величины X называется математическое ожидание k-й степени отклонения случайной величины от ее математического ожидания: В частности, при k = 2 второй центральный момент случайной величины есть дисперсия.
На практике часто используются также третий и четвертый центральные моменты, позволяющие судить о симметричности и остроте вершины кривой распределения случайной величины.
Если = 0, то распределение симметрично относительно математического ожидания, если
>0, то преобладают положительные отклонения от математического ожидания, если
<0 — отрицательные. Для удобства применяется так называемый коэффициент асимметрии, который является безразмерной величиной и определяется как
Об остроте вершины кривой распределения судят по коэффициенту эксцесса:
Если
>0, то распределение имеет острый пик, если
<0 (минимальное значение
= — 2), то распределение имеет плосковершинную форму по сравнению с рассмотренным ниже нормальным распределением, для которого
= 0.
Нормальное распределение
Большинство экспериментальных исследований, в том числе и в области спорта, связано с измерениями, результаты которых могут принимать практически любые значения в заданном интервале и, как уже было отмечено, описываются моделью непрерывных случайных величин. Поэтому в дальнейшем будут рассматриваться в основном непрерывные случайные величины и связанные с ними непрерывные распределения.
Одним из непрерывных распределений, имеющим основополагающую роль в математической статистике, является нормальное, или гауссово*, распределение.
Нормальное распределение является самым важным в статистике. Это объясняется целым рядом причин.
1. Прежде всего, многие экспериментальные наблюдения можно успешно описать с помощью нормального распределения. Следует сразу же отметить, что не существует распределений эмпирических данных, которые были бы в точности нормальными, поскольку (как будет показано ниже) нормально распределенная случайная величина находится в пределах от — до
, чего никогда не бывает на практике. Однако нормальное распределение очень часто хорошо подходит как приближение.
Проводятся ли измерения роста, силы мышц, спортивного результата в беге, прыжках, метаниях, ряда физиологических параметров — везде на результаты оказывает влияние очень большое число случайных факторов (естественные причины и ошибки измерения). Причем, как правило, действие каждого из этих факторов незначительно. Опыт показывает, что результаты именно в таких случаях будут распределены приближенно нормально.
2. Нормальное распределение хорошо подходит в качестве аппроксимации (приближенного описания) других распределений (например, биномиального).
3. Многие распределения, связанные со случайной выборкой, при увеличении объема последней переходят в нормальное.
4. Нормальное распределение обладает рядом благоприятных математических свойств, во многом обеспечивших его широкое применение в статистике.
В то же время следует отметить, что в природе встречается много экспериментальных распределений, для описания которых модель нормального распределения малопригодна. Для этого в математической статистике разработан ряд методов, некоторые из которых приводятся в следующих лекциях.
Плотность вероятностей нормально распределенной случайной величины записывается следующим образом:
График плотности (нормальная кривая) представлен на рис. 4.10.
Укажем основные свойства нормального распределения.
1. Нормальная кривая имеет колоколообразную форму, симметричную относительно точки х —, с точками перегиба, абсциссы которых отстоят от
2. Для нормального распределения математическое ожидание , дисперсия
и стандартное отклонение равно
3. Как видно из выражения (4.23), нормальное распределение полностью определяется двумя параметрами: р и 0— математическим ожиданием и стандартным отклонением.
График плотности вероятности нормального распределения показывает, что для нормально распределенной случайной величины вероятность отклонения от среднего значения быстро уменьшается с ростом величины отклонения.
4. Медиана и мода нормального распределения совпадают и равны математическому ожиданию р.
5. Коэффициенты асимметрии и эксцесса нормального распределения равны нулю
Последнее свойство (5) используется для проверки предположения о нормальности распределения генеральной совокупности (гл. 6).
Нормированное нормальное распределение
Формула (4.23) описывает целое семейство нормальных кривых, зависящих, как было сказано выше, от двух параметров — которые могут принимать любые значения, поэтому возможно бесконечно много нормально распределенных совокупностей.
Чтобы избежать неудобств, связанных с расчетами для каждого конкретного случая по достаточно сложной формуле (4.23), используют так называемое нормированное (или’стандартное) нормальное распределение, для которого составлены подробные таблицы.
Нормированное нормальное распределение имеет параметры Это распределение получается, если пронормировать нормально распределенную величину X по формуле:
Плотность распределения вероятностей нормированного нормального распределения записывается в виде:
На кривой нормированного нормального распределения (рис. 4.11) указаны в процентах доли площадей, соответствующих отмеченным значениям нормированного отклонения и, по отношению общей площади под кривой, равной 1 (100%). Эти площади определяют вероятности попадания случайной величины в соответствующие интервалы.
Таблица значений — ординат нормальной кривой приведена в Приложении (табл. 2). Значения
для некоторых характерных нормированных отклонений представлены в табл. 4.1.
Вероятность попадания в заданный интервал
Очень часто исследователя интересует вопрос: какова вероятность того, что изучаемый признак генеральной совокупности находится в заданных границах (например, вероятность того, что результат в беге на 100 м для группы испытуемых окажется в пределах 11,5—12,5 с)? Если предполагается нормальное распределение признака в генеральной совокупности, то получить ответ на этот вопрос очень просто. Как говорилось ранее, вероятность попадания нормально распределенной случайной величины в заданный интервал можно определить по функции распределения:
Если использовать функцию нормированного нормального распределения, эту вероятность можно записать следующим образом:
1),
где Ф — принятое обозначение для функции нормированного нормального распределения; —параметры исходного распределения.
Функция нормированного нормального распределения имеет следующий вид:
Интеграл, входящий в это выражение, не выражается в элементарных функциях, поэтому для вычисления функции Ф(и) используют вспомогательную функцию — функцию Лапласа (интеграл вероятностей):
В Приложении приведена табл. 1 удвоенных значений функции Лапласа
Чтобы найти вероятность попадания нормально распределенной случайной величины в заданный интервал с помощью функции Лапласа, используется следующая формула:
Функция Лапласа является нечетной, т. е. =
Часто представляет интерес вероятность попадания в симметричный относительно среднего значения р, интервал. При этом
Учитывая нечетность функции Лапласа, получаем:
Отсюда ясен смысл того, что в табл. 1 Приложения приведены удвоенные значения функции Лапласа.
В табл. 4.2 приведены полученные по формуле (4.28) вероятности того, что нормально распределенная случайная величина отклонится от своего среднего значения не более, чем на
Таблица 4.2 Вероятности попадания нормально распределенной случайной величины в заданный интервал
Из табл. 4.2 следует, что
Это выражение известно в статистике как «правило трех сигм». Оно означает, что с вероятностью 0,9973 (практически с единичной) нормально распределенная случайная величина окажется в пределах от среднего значения. Иначе говоря, отклонения от среднего больше
можно ожидать примерно в I случае из 370 испытаний.
Некоторые специальные непрерывные распределения
Нормальное распределение широко применяется как математическая модель для описания экспериментальных данных. В этом разделе будут рассмотрены три распределения, которые играют очень важную роль при обработке результатов, связанных со случайной выборкой объема n, и составляют основу применения критериев значимости и проверки статистических гипотез. Примеры использования этих распределений приводятся в гл. б, посвященной указанным статистическим методам.
X распределение
Если независимые случайные величины, каждая из которых имеет нормированное нормальное распределение с параметрами
то сумма квадратов этих величин имеет так называемое
(хи-квадрат)-распределение.
Его плотность вероятностей представлена на рис. 4.12 и зависит от единственного параметра — числа степеней свободы V.
Кривая -распределения имеет положительную асимметрию. С ростом числа степеней свободы v она становится все более симметричной и при
переходит в нормальное.
Таблицы -распределения приводятся в табл. 5 Приложения. В этой таблице содержатся значения х, соответствующие вероятностям Р— 1 — а, при а, равном 0,05; 0,01 и 0,001 для различного числа степеней свободы v.
t-распределение Стьюдента
Вторым из широко используемых специальных распределений является t-распределение Стьюдента, или просто t-распределение. Это распределение случайной величины:
где U — случайная величина, имеющая нормированное нормальное распределение; V — случайная величина с распределением с v степенями свободы, t-распределение применяется при проверке статистических гипотез при малом объеме выборки. Эти вопросы рассмотрены в гл. 6. Форма t-распределения полностью определяется одним параметром — числом степеней свободы v.
Вид кривой плотности t-распределения показан на рис. 4.13. /-распределение симметрично при любом v и
при переходит в нормальное с параметрами
и
F-распределение
Если случайные величины U и V независимы и каждая из них распределена как с
степенями свободы соответственно, то величина
подчиняется так называемому F-распределению, которое зависит от двух параметров —
называемых числами степеней свободы. F-распределение применяется в основном в задачах, связанных с дисперсиями.
Оценка генеральных параметров
Материал, содержащийся в предыдущих лекциях, можно рассматривать как минимальный набор сведений, необходимых для использования основных статистических методов, объединенных в теории статистических выводов.
Перейдем теперь к рассмотрению этих методов. Для этого необходимо определить их место в рамках единого подхода к решению конкретных задач статистических исследований в области спорта.
Основная задача, решаемая с помощью методов математической статистики, — получение информации о закономерностях изменения изучаемого признака для большой совокупности объектов исследования, объединенных по этому признаку. В терминах математической статистики это означает, что делаются выводы о свойствах генеральной совокупности.
Для описания генеральной совокупности используются математические модели теории вероятностей. Исчерпывающую информацию о генеральной совокупности дает распределение вероятностей. Чаще всего используется модель нормально распределенной генеральной совокупности. И в этом случае распределение полностью определено всего двумя параметрами:
- средним значением (математическим ожиданием) и стандартным отклонением.
Следовательно, чтобы полностью описать нормальную генеральную совокупность, нужно знать значения двух генеральных параметров: среднего значения и стандартного отклонения. Так, если интерес вызывают спортивные результаты, то это средний результат всех спортсменов данной категории и стандартное отклонение результата. Эти параметры неизвестны и предположительно находятся в каких-то пределах. Единственное, что можно сделать, чтобы их определить — это провести эксперимент. Эксперимент для всей генеральной совокупности нереализуем или неоправдан, поэтому применяется выборочный метод.
На основании данных, полученных по выборке, делается вывод относительно всей генеральной совокупности. Используемые для этого методы теории статистических выводов обычно подразделяются на два класса: оценка параметров и проверка гипотез.
Задача оценки параметров состоит в получении наилучших в определенном смысле оценок параметров распределения генеральной совокупности на основании выборочных данных.
Проверка гипотез охватывает методы использования выборочных данных для проверки предположений относительно распределения и параметров распределения генеральной совокупности, которые делаются до получения выборочных данных.
В данной лекции будут рассмотрены основные положения теории оценок.
Случайная выборка из генеральной совокупности
Чтобы по выборке можно было делать выводы о свойствах всей генеральной совокупности, она должна быть представительной (репрезентативной). Это обеспечивается в тех ситуациях, когда выборка является случайной. Модель случайной выборки предъявляет к ней следующие требования: 1) каждый из объектов, составляющих генеральную совокупность, должен иметь одинаковую вероятность быть представленным в выборке; 2) все п измерений, образующих выборку, должны быть независимыми, т. е. результаты каждого измерения не должны зависеть от предыдущих измерений.
Существует два основных метода отбора объектов из генеральной совокупности в выборку: повторный и бес-повторный.
При повторном отборе каждый объект после измерения значения признака возвращается в генеральную совокупность. При этом состояние генеральной совокупности перед каждым новым измерением восстанавливается и требование независимости всегда выполняется.
При бесповторном отборе после измерения объект не возвращается в генеральную совокупность. В этом случае соотношение значений признака в оставшейся части генеральной совокупности меняется, и, следовательно, проводимые измерения не являются независимыми, т. е. бесповоротный отбор не является случайным. На практике бесповоротный отбор используется чаще. Когда проводится измерение каких-то признаков, относящихся к спортсменам, выборка составляется таким образом, что после того, как очередной спортсмен принял участие в измерениях, он уже не участвует в следующих измерениях.
Но, как правило, можно считать, что объем генеральной совокупности настолько велик, что при исключении из нее относительно малого числа единиц, составляющих выборку, состояние генеральной совокупности практически не меняется. При бесконечной генеральной совокупности различие между повторным и бесповторным отбором исчезает.
На практике используется несколько способов получении случайных выборок.
1. Истинно случайной будет выборка, полученная способом жеребьевки. Если, например, нужно отобрать группу в 20 человек из генеральной совокупности, включающей 500 человек, то можно заготовить карточки, из которых 20 определенным образом пометить, а остальные оставить пустыми. Затем всем предлагается вытянуть карточку, и таким образом получается необходимая выборка.
Организационно проще случайная выборка получается методом случайных чисел. Суть этого метода заключается в использовании таблицы случайных чисел. Последние располагаются в таблице в случайном порядке, и вероятности появления цифр от 0 до 9 в каждом разряде чисел одинаковы. Фрагмент таблицы случайных чисел представлен в табл. 5.1. Более подробные таблицы можно найти в [3, 4, 7, 13].
Все объекты генеральной совокупности нумеруются. Если объектов 500, то им присваиваются номера от 001 до 500. Затем в таблице случайных чисел произвольным образом выбирается любое число. Например, первое число второго столбца в табл. 5.1 33 834. Это число пятиразрядное, а нам нужны трехразрядные номера, поэтому отбрасываем два любых разряда числа, например последние. Получим 338, и объект с таким номером включаем в выборку. Далее берем следующее число из таблицы, двигаясь слева направо. Поступая аналогичным образом, получаем число 542. Это число больше 500, поэтому оно пропускается. Далее двигаемся по таблице до числа меньше 500, еще не встречавшегося ранее. Это будет 344, затем 448 и т. д. до тех пор, пока не наберем нужное количество номеров. Объекты с полученными номерами включаем в выборку.
Принцип случайности выборки не исключает плановости отбора объектов в нее. При этом планируется отбор по тем признакам объектов, которые не подлежат измерению в проводимом эксперименте. Существуют следующие виды планового отбора.
2. Механический отбор. Генеральная совокупность делится на группы, число которых равно объему выборки, а затем из каждой группы случайным образом выбирается один объект. В других случаях отбирается каждый 10-й, каждый 100-й и т. д. экземпляр генеральной совокупности или ее представительной части. -Например, в группу включается каждый 10-й юный спортсмен ДЮСШ.
3. Типический отбор. Генеральная совокупность делится на типические участки, например по районному принципу, и в каждой из полученных групп случайным образом отбирается одинаковое число объектов.
4. Серийный отбор. Генеральная совокупность делится на группы, называемые сериями, а затем из общего числа серий отбирается нужное число для сплошного исследования. Например, предполагается получить данные о физическом развитии младших школьников города. Если имеется 50 начальных классов средних школ, то при планируемом обследовании шести классов эти классы отбираются случайным образом.
При проведении выборочных исследований предполагается, что выборка является однородной. Это означает, что она получена из одной генеральной совокупности, т. е. в исходной совокупности отсутствуют объекты, резко выделяющиеся по значениям изучаемого признака. Предположение об однородности выборки на практике обычно основывается на предварительном изучении условий эксперимента. Так, обычно есть уверенность в том, что полученные выборочные данные представляют собой результаты измерений для спортсменов одного возраста, квалификации, спортивной специализации и т, п.
Точечные оценки
Под термином «о ц е н к а» в теории оценок понимаются как сами значения параметров генеральной совокупности, полученные по выборке, так и процесс получения этих значений, т. е. правило, по которому они получены.
Определения и требования к оценкам
Оценки подразделяются на два класса: точечные и интервальные.
Точечные оценки представляют собой определенные значения параметров генеральной совокупности, полученные по выборочным данным. Эти значения должны быть максимально близки к значениям соответствующих параметров генеральной совокупности, которые являются истинными значениями оцениваемых параметров.
При формировании интервальных оценок определяют границы интервалов, между которыми с большой вероятностью находятся истинные значения параметров.
Начнем с точечных оценок и рассмотрим оценку произвольного параметра (среднего, дисперсии или какого-то другого) генеральной совокупности, который обозначим . Оценивая параметр
по выборке, находим такую величину
, которую принимаем за точечную оценку параметра
. Естественно, при этом стремимся, чтобы оценка была в определенном смысле наилучшей, поэтому к ней предъявляется ряд требований:
1. Состоятельность. Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки
она стремится к истинному значению параметра
.
В математической статистике показывается, что состоятельной оценкой генерального среднего значения является выборочное среднее арифметическое х, а состоятельной оценкой генеральной дисперсии
— выборочная дисперсия
. Методы вычисления этих выборочных характеристик были рассмотрены в гл. 3.
2. Несмещенность. Оценка называется несмещенной, если она не содержит систематической ошибки, т. е. среднее значение оценки, определенное по многократно повторенной выборке объема n из одной и той же генеральной совокупности, стремится к истинному значению соответствующего генерального параметра.
Выборочное среднее арифметическое является несмещенной оценкой генерального среднего
.
Несмещенной оценкой генеральной дисперсии является выборочная дисперсия, вычисляемая по формуле:
Замечание 1
При определении выборочной дисперсии как среднего квадрата отклонений значений признака от среднего арифметического была приведена ее формула:
Было отмечено, что эта формула редко используется, а вместо нее применяется выражение
Теперь поясним смысл такого изменения формулы.
Одним из свойств выборочного среднего арифметического является то, что сумма квадратов отклонений значений признака от среднего арифметического меньше, чем сумма квадратов отклонений от любой другой величины (в том числе и от генерального среднего , т. е.
для любой выборки. Поэтому вычисление оценки дисперсии по формуле
будет содержать систематическую ошибку, и такая оценка будет смещенной.
Можно показать, что если использовать оценку то она будет несмещенной, т. е. при неограниченном повторении выборки из генеральной совокупности и усреднении выборочной дисперсии, полученной на основании этой формулы, по всем выборкам получается истинное значение генеральной дисперсии.
3. Эффективность. Несмещенная оценка является эффективной, если она имеет наименьшую дисперсию по сравнению с другими несмещенными оценками того же параметра генеральной совокупности.
Это надо понимать так: полученные по выборке оценки — случайные величины, так как случайны сами выборочные значения. Поэтому можно говорить о математическом ожидании и дисперсии оценок
Эффективность этих оценок означает, что их дисперсии
меньше дисперсий любых других несмещенных оценок среднего значения и дисперсии генеральной совокупности.
Итак, наилучшими в указанном смысле оценками генерального среднего значения и генеральной дисперсии являются выборочные характеристики:
Стандартная ошибка среднего арифметического
Оценки полученные по выборке, как правило, не совпадают с истинными значениями параметров
генеральной совокупности. Экспериментально проверить это утверждение невозможно, поскольку не известны истинные значения этих параметров. Но если брать повторные выборки нз одной и той же генеральной совокупности с параметрами р, и с2 и каждый раз вычислять их оценки
то окажется, что эти оценки для разных выборок не совпадают, хотя все это из одних и тех же генеральных параметров.
Отклонения оценок генеральных параметров от истинных значений этих параметров называются статистическими ошибками, или ошибками репрезентативности. Их происхождение не имеет ничего общего с ошибками измерения, а возникают они только потому, что не все объекты генеральной совокупности представлены в выборке.
Величины статистических ошибок оценивают по среднему квадратическому (стандартному) отклонению выборочных характеристик. Здесь рассматривается только стандартное отклонение выборочного среднего арифметического.
Если взять очень много независимых выборок объема n из одной и той же генеральной совокупности и определить для каждой из них среднее арифметическое, то окажется, что полученные средние арифметические варьируют вокруг своего среднего значения (равного в —
раз меньше, чем отдельные варианты выборки. Следовательно, стандартное отклонение выборочного среднего арифметического будет равно
где
— стандартное отклонение генеральной совокупности.
В качестве оценки стандартного отклонения выборочного среднего используется величина называемая стандартной ошибкой среднего арифметического. В формуле (5.1) S — выборочное стандартное отклонение
Величина Si показывает, какая ошибка в среднем допускается, если использовать вместо генерального среднего его выборочную оценку
Поэтому вычисленное среднее арифметическое часто указывают в виде
чтобы оценить точность оценки
Из формулы (5.1) видно, как зависит стандартная ошибка от объема выборки n: с увеличением объема выборки п стандартная ошибка
уменьшается пропорционально корню квадратному из n.
Пример 5.1
Найдем стандартную ошибку среднего арифметического результатов в беге на 100 м для данных примера 3.4. Рассчитанные в примере_3.4 значения выборочных характеристик составляют: =15,4 с и S =
0,94 (с). Объем выборки n = 50, отсюда стандартная ошибка среднего арифметического
0,13 (с).
Замечание 2
Теперь можно вернуться к вопросу, который был оставлен открытым при вычислении выборочных характеристик в гл. 3: с такой точностью нужно вычислять выборочные характеристики?
Как мы только что убедились, при ограниченном объеме выборки п истинное значение генерального среднего р, не может быть определено сколь угодно точно, поэтому при вычислении оставлять большое число значащих цифр не имеет смысла. Существует эмпирическое правило, согласно которому в окончательном результате положение последней значащей цифры должно соответствовать положению первой значащей цифры в величине
Чтобы избежать накопления ошибок, связанных с округлением, промежуточные результаты нужно вычислять с точностью на один порядок больше, чем точность окончательных результатов.
Для рассмотренного выше примера = 0,13/3 = = 0,04 (с). Следовательно, значение
надо было бы вычислять с точностью до сотых долей секунды, если, конечно, позволяет точность измерения исходных данных.
В этом примере значения признака измерены с точностью до десятых долей секунды, поэтому в более точном вычислении и его стандартной ошибки
нет смысла. Окончательный результат следует проводить в виде
Интервальные оценки
По известной величине выборочной характеристики или S и др.) можно определить интервал, в котором с той или иной вероятностью определяется значение параметра генеральной совокупности, оцениваемого по этой выборочной характеристике.
Вероятности, признанные достаточными для того, чтобы уверенно судить о генеральных параметрах на основании выборочных характеристик, называются доверительными.
Обычно в качестве доверительных вероятностей выбирают значения 0,95, 0,99 или 0,999 (их принято выражать в процентах). Перечисленным значениям соответствуют 95, 99 и 99,9 %. Выбор той или иной доверительной вероятности производится исследователем исходя из практических соображений о той ответственности, с какой делаются выводы о генеральных параметрах.
Замечание 3
Как правило, в научных исследованиях в области спорта считается достаточной доверительная вероятность 0,95 (95 %). В некоторых случаях, когда уточняются результаты предыдущих исследований или когда выводы, сделанные в данном исследовании, связаны с большой ответственностью (например, предлагается в корне пересмотреть программу тренировок или рацион питания сборной команды), применяются более высокие уровни доверительной вероятности: 99 или 99,9%.
Интервал, в котором с заданной доверительной вероятностью находится оцениваемый генеральный параметр, называется доверительным интервалом.
В соответствии с доверительными вероятностями на практике используются 95-, 99-, 99,9-процентные доверительные интервалы.
В литературе по математической статистике обычно говорят о 100 (1 —а)-процентном доверительном интервале, где (1 — а) — доверительная вероятность, а а — некоторое малое число (а — 0,05; 0,01; 0,001), задающее вероятность того, что оцениваемый генеральный параметр выходит за границы доверительного интервала.
Теперь рассмотрим формирование доверительного интервала для среднего (математического ожидания) нормально распределенной генеральной совокупности. Пронормируем значение среднего арифметического
найденного по выборке объема n из этой генеральной совокупности, по формуле:
где
— оцениваемый параметр — среднее значение генеральной совокупности;
— стандартная ошибка выборочного среднего арифметического.
Величина t имеет t-распределение Стьюдента (определенное в гл. 4) с v = n — 1 степенями свободы.
Необходимо определить доверительный интервал, в котором с доверительной вероятностью 100(1 —а) % находится истинное значение оцениваемого параметра ц. Для этого задается значение а (например, 0,05). Доверительная вероятность будет соответствовать площади под кривой t-распределения Стьюдента, заключенной между точками — (рис. 5.1). Следовательно, доверительный интервал можно записать как
Преобразуем это выражение к виду
Это и есть стандартная форма записи доверительного интервала.
Учитывая формулу (5.1) приходим к окончательному выражению:
т. е. истинное значение с вероятностью 100 (1 — а) % лежит в границах
Значения
для стандартных значений а (0,05, 0,01 и 0,001) и различных значений параметра v t-распределения (v = n — 1) приведены в табл. 4 Приложения.
Чтобы найти границы доверительного интервала для среднего значения генеральной совокупности, действуем в следующем порядке:
- по полученной выборке объема n вычисляем среднее арифметическое
и стандартное отклонение S. Методы вычислений рассмотрены в гл. 3;
- задаемся доверительной вероятностью 1 — а (например, 0,95) исходя из целей исследования;
- по таблице t-распределения Стьюдента находим граничные значения
В силу симметричности t-распределения достаточно знать только положительное значение
. Например, если объем выборки п — 12, то число степеней свободы t-распределения v = 12— 1 = 11, и по табл. 4 Приложения определяем для а = 0,05:
= 2,20;
- находим границы доверительного интервала по формуле (5.3). Для а= 0,05 и n = 12:
Как было отмечено в гл. 4, при больших объемах выборки (практически при n > 30) t-распределение Стьюдента переходит в нормальное. Поэтому для определения границ доверительного интервала для при больших объемах выборки можно пользоваться таблицами нормированного нормального распределения (табл. 1 Приложения).
Доверительный интервал для при n > 30 записывается в следующем виде:
где ua — процентные точки нормированного нормального распределения, определяемые по табл. 1 Приложения.
Для стандартных доверительных вероятностей (95, 99, 99,9%) значения приведены в таблице 5.2.
Чтобы найти доверительный интервал для среднего значения генеральной совокупности при больших объемах выборки (n >30), поступаем следующим образом:
- По выборочным данным находим среднее арифметическое
и стандартное отклонение S, как показано в гл. 3.
- Задаемся доверительной вероятностью I—а (например, 0,95).
- По табл. 5.2 находим значение
соответствующее заданной доверительной вероятности
= 1,96).
- Определяем границы доверительного интервала по формуле (5.4). Для а = 0,05 получаем:
Как видно из сравнения найденного доверительного интервала с доверительным интервалом, полученный выше по t-распределению, при малых объемах выборки границы первого интервала шире 1,96). Это понят но из простых физических соображений: при малом объеме выборки получается меньше ин-форгиации о свойствах генеральной совокупности.
Пример 5.2
Определим границы 95 %-ного доверительного интервала для среднего результата в беге на 100 м по данным обследования группы из 50 школьников, приведенным в табл. 2.1.
Объем выборки n= 50, т. е. для определения доверительного интервала можно использовать рекомендации для большого объема выборки. Действуем в указанном выше порядке:
- Среднее арифметическое и стандартное отклонение для рассматриваемого примера вычислены в примере 3:4:
— 15,4 с, S = 0,94 с.
- Задаемся доверительной вероятностью 95%.
- Из табл. 5.2 находим
— 1,96.
- По формуле (5.4) определяем границы доверительного интервала:
Таким образом, истинное значение среднего времени на дистанции 100 м для школьников этой группы находится в интервале (15,1 с, 15,7 с) с вероятностью 0,95 (95%).
Сделаем еще одно замечание по поводу доверительных интервалов.
Среднее значение р генеральной совокупности является хотя и неизвестным, но фиксированным параметром, а границы доверительного интервала, полученные по случайной выборке объема n, будут также случайными величинами. Когда говорится о 95-процентной доверительной вероятности, это означает, что примерно в 95 % случаев фиксированное, но неизвестное значение окажется в границах доверительного интервала.
Образная трактовка доверительных интервалов приведена в книге «Статистика и планирование эксперимента в технике и науке»*. «Доверительный интервал и связанные с ним понятия похожи на то, с чем мы сталкиваемся при игре с набрасыванием подковы на кол. Кол здесь играет роль оцениваемого параметра (его положение никогда не изменяется)… Подкова выступает в роли доверительного интервала. Если при 100 набрасываниях подковы удается в среднем 90 раз набросить ее на кол, то имеется 90 %-ная гарантия (или уровень доверия) набросить подкову на кол. Доверительный интервал, подобно подкове, меняет свое положение. При любом броске (или при построении некоторой интервальной оценки) кол (или параметр) может как попасть внутрь подковы (интервала), так и оказаться вне ее. Таким образом, делается вероятностное утверждение относительно переменных величин, характеризующих положение подковы».
Оценку параметра найденную в форме доверительного интервала, часто записывают в виде
. Чтобы избежать неоднозначности в толковании результатов (перепутывания с записью результата как
запись доверительного интервала необходимо сопровождать пояснением. Например 95 %-ный доверительный интервал для среднего результата (15,4 ±0,3 с).
Определение необходимого объема выборки для получения оценок заданной точности
Обычно исследователя интересует вопрос: какой минимальный объем выборки необходим для того, чтобы оценка (чаще всего выборочное среднее арифметическое отличалась от истинного значения среднего значения генеральной совокупности не более чем на заданную величину?
Ответить на этот вопрос можно, если ввести доверительную вероятность и выбрать объем выборки n таким образом, чтобы доверительный интервал имел заданный размер.
Если генеральная совокупность предполагается нормально распределенной и ее дисперсия известна, то доверительный интервал для среднего значения р записывается следующим образом:
где «а для стандартных доверительных вероятностей определены в табл. 5.2.
Пусть требуется, чтобы выборочное среднее отличалось от генерального
не более чем на заданную величину d. Это означает, что половина ширины доверительного интервала должна быть равна d, т. е. половика от
должна равняться d:
Отсюда требуемый объем выборки определяется следующим образом:
Истинное значение параметра о генеральной совокупности обычно неизвестно, но при больших объемах выборки можно использовать его выборочную оценку S. Тогда
В качестве примера найдем минимальный объем выборки, необходимый для того, чтобы выборочное среднее значение результата в беге на 100 м, определяемое для группы школьников, отличалось от истинного значения среднего результата не более чем на d = 0,1 с.
По результатам выборочного исследования (пример 5.2) выборочное стандартное отклонение, определенное при n = 50, составляет 0,94 с. Задаемся доверительной вероятностью 95% — 1,96) и по формуле (5.6) находим
Таким образом, при объеме выборки n — 339 существует 95 %-ная вероятность того, что выборочное среднее арифметическое будет отличаться от генерального среднего не более чем на 0,1 с.
Критерии значимости и проверка гипотез
В этой лекции рассматривается группа статистических методов, которые получили наибольшее распространение в статистических исследованиях, связанных с практикой спорта. Эти методы применяются всегда, когда предстоит проверить какие-то теоретические предположения, связанные с эффективностью мероприятий, направленных на совершенствование тренировочного процесса. Исследователь выдвигает предположения исходя из анализа конкретного явления с позиций спортивной педагогики, физиологии, медицины, психологии или другой области знаний, представителем которой он является. Затем справедливость предположений проверяется на основании данных соответствующего эксперимента, условия, которого контролируются.
Нулевая гипотеза (нуль-гипотеза) и альтернатива (альтернативная гипотеза)
Статистической гипотезой (или просто гипотезой) называется утверждение о распределении генеральной совокупности, соответствующее некоторым представлениям об изучаемом явлении. В частном случае это может быть утверждение о значениях параметров нормально распределенной генеральной совокупности.
Предположим, что в эксперименте участвуют две группы юных спортсменов — прыгунов в высоту. Одна из них (контрольная) тренируется по традиционной программе, а для второй (экспериментальная) используется новый комплекс специальных упражнений. Действенность нового комплекса оценивается по различию результатов, показанных в этих группах после определенного тренировочного цикла. По полученным данным необходимо проверить следующие утверждения:
- 1. Среднее значение результатов не изменилось, т. е.
Здесь
— средние значения соответствующих генеральных совокупностей (результатов всех прыгунов данного класса, которые могли бы тренироваться по традиционной
и новой
программам).
- Вариативность результатов возросла: Z
Здесь
— так же, как и в п. 1, значения соответствующих генеральных параметров.
- Средний результат возрос на 3 см:
Это три различные статистические гипотезы. Конечно, возможные утверждения не ограничиваются приведенным списком. Гипотезы предстоит проверить с помощью какого-то метода — критерия.
Статистические гипотезы обычно рассматривают две генеральные совокупности, одна из которых может представлять собой теоретическую модель (например, нормальное распределение), а о второй судят по выборке из нее. В других случаях обе генеральные совокупности представлены выборками.
При проверке статистических гипотез принят следующий подход. Считается, что получение в результате эксперимента любых новых данных об изучаемом явлении, не согласующихся с данными, имеющимися до проведения эксперимента,— маловероятное событие. В то же время, если взять две выборки, представляющие собой результаты измерения одного и того же признака, и сравнить между собой их характеристики (среднее арифметическое, стандартное отклонение и др.), то окажется, что они практически всегда различаются. Это различие можно рассматривать как обусловленное только действием случайностей. Поэтому первоначально гипотезу всегда можно сформулировать таким образом: между двумя генеральными совокупностями нет ожидаемого различия. Такая гипотеза называется нулевой гипотезой, или нуль-гипотезой. Обратное ей утверждение о том, что в действительности между генеральными совокупностями есть различие, называется альтернативной гипотезой, или альтернативой.
Итак, вначале выдвигается нулевая гипотеза о том, что различие между генеральными совокупностями равно нулю. Затем получают выборку или несколько выборок, и если выборочные данные не противоречат нулевой гипотезе, т. е. различие можно объяснить только случайностью выборки, то нулевая гипотеза сохраняется (принимается). Если же полученные результаты не удается объяснить только действием случайных факторов, то нулевая гипотеза отвергается, а принимается альтернативная гипотеза.
Нулевую гипотезу принято обозначать, как а альтернативную —
Пусть, например, оценивается эффективность нового комплекса упражнений для юных спортсменов — прыгунов в высоту по среднему значению спортивного результата в контрольной и экспериментальной группах. Тогда нулевую гипотезу можно сформулировать так: среднее значение результатов не изменилось, т. е.
Для краткости это записывается так:
:
Если заранее нельзя сказать, к чему приведет новый комплекс упражнений — к увеличению или уменьшению результатов, то альтернативная гипотеза будет состоять в том, что средние значения генеральных совокупностей неодинаковы:
Ошибки при проверке гипотез
Ошибки, допускаемые при проверке гипотез, удобно разделить на два типа: L) отклонение гипотезы когда она верна, — ошибка первого рода; 2) принятие гипотезы
когда в действительности верна какая-то другая гипотеза, — ошибка второго рода.
Вероятность ошибки первого рода обозначается а. Величина а называется уровнем значимости критерия, по которому проверяется справедливость гипотезы Но.
Вероятность ошибки второго рода обозначается Ее величина зависит от альтернативной гипотезы
Рассмотрим для приведенного выше примера следующие две ситуации: 1) в действительности средний результат возрос на 3 см, 2) средний результат увеличился на 30 см. Ясно, что для одних и тех же условий эксперимента и одинакового уровня значимости а вероятность ошибки второго рода
(принять гипотезу об отсутствии различия) для второй из альтернатив будет меньше.
Вероятности а и удобно представить, как это сделано в табл. 6.1.
Наглядным способом интерпретации ошибок является их графическое представление.
Предположим, что проверяется гипотеза о равенстве среднего значении генеральной совокупности заданной величине
(известной, например, из предыдущих экспериментов).
Для этого берется выборка объема b, находится ее среднее арифметическое и по его величине судят о справедливости гипотезы
.
Распределение среднего арифметического при условии, что верна гипотеза
, будет
Это распределение чисто качественно представлено на рис. 6.1.
Распределение среднего арифметического х при условии, что верна альтернативная гипотеза будет уже другим —
Будем считать, что гипотеза отвергается, если выборочное среднее арифметическое
окажется больше некоторого значения К, т. е.
как показано на рис. 6.1.
Область непринятия гипотезы называется критической областью критерия. Она показана на рис. 6.1 наклонной штриховкой. Уровень значимости будет соответствовать площади критической области.
Вероятность ошибки второго рода будет равна площади под кривой распределения
показанной на рис. 6.1. вертикальной штриховкой.
Величина 1— называется мощностью критерия.
Следует особо подчеркнуть, что любая гипотеза должка формулироваться, а уровень значимости а задаваться исследователем всегда до получения экспериментальных данных, по которым эта гипотеза будет проверяться.
При выборе уровня значимости а исследователь исходит из практических соображений, отвечая на вопрос: какую вероятность ошибки он считает допустимой для его конкретной задачи?
Обычно считают достаточным а =0,05 (5%), иногда а =0,01, редко а= 0,001. Здесь можно руководствоваться соображениями, изложенными в замечании 3 гл. 5 при выборе доверительной вероятности.
Между стандартными статистическими критериями и стандартными доверительными интервалами существует тесная связь: если принимается гипотеза о том, что значение параметра (р,, с?) нормально распределенной генеральной совокупности равно фиксированному значению (ро, ао) с уровнем значимости а, то это эквивалентно заданию 100 (1—а%-ного доверительного интервала для данного параметра нормального распределения. Поэтому оба подхода — доверительные интервалы и критерии значимости — в данном случае равноценны. Преимущество доверительных интервалов в том, что они дают представление об истинном значении параметра генеральной совокупности, а недостаток в том, что их трудно построить в более сложных случаях, например при анализе дисперсий (стандартных отклонений).
Критерии значимости
В рассмотренном выше примере (см. п. 6.2.2) при проверке гипотезы об отсутствии различия среднего результата спортсменов в контрольной и экспериментальной группах можно было бы поступить следующим образом:
вычислить средние арифметические результаты в группах после этапа тренировки и сравнить их между собой. Если окажется, что различие средних арифметических больше, например, 5 см, то можно утверждать, что новый комплекс упражнений оказался эффективным. Но при этом неизвестно, какие ошибки допускаются при таком утверждении, поэтому невозможно точно доказать наличие или отсутствие различий.
Методы, которые для каждой выборки формально точно определяются, удовлетворяют выборочные данные нулевой гипотезы или нет, называются критериями значимости.
Процедура проверки гипотез обычно сводится к тому, что по выборочным данным вычисляется значение некоторой величины, называемой статистикой критерия, или просто критерием, который имеет известное стандартное распределение (нормальное, t-распределение Стьюдента и т. п.), поэтому вычислительная работа упрощается. Найденное значение критерия сравнивается с критическим (граничным) значением крите-терия, взятым из соответствующих таблиц, и по результатам сравнения делается вывод: принять гипотезу или отвергнуть.
Если вычисленное по выборке значение критерия не превосходит граничного значения, то гипотеза принимается на заданном уровне значимости а. В этом случае наблюдаемое по экспериментальным данным различие генеральных совокупностей можно объяснить только случайностью выборки. Однако принятие гипотезы Но совсем не означает доказательства равенства параметров генеральных совокупностей. Просто имеющийся в распоряжении статистический материал не дает оснований для отклонения гипотезы о том, что эти параметры одинаковы. Возможно, появится другой экспериментальный материал, на основании которого эта гипотеза будет отклонена.
Когда вычисленное значение критерия оказывается больше граничного (критического) значения при заданном уровне значимости а, то наблюдаемое различие генеральных совокупностей уже нельзя объяснить только случайностями. В этом случае гипотеза отклоняется в пользу гипотезы
при данном уровне значимости а, и говорят, что наблюдаемое различие значимо (статистически значимо) на уровне значимости а.
Следует подчеркнуть разницу между статистической значимостью и практической значимостью. Заключение о практической значимости всегда делается человеком, изучающим данное явление. И здесь истинным критерием является опыт и интуиция исследователя, а статистические критерии значимости — лишь формально точный инструмент, используемый в исследовании. Чем больше исследователь знает об изучаемом явлении, тем точнее будет сформулированная им гипотеза и тем точнее будут выводы, сделанные с помощью критериев значимости.
Замечание 1
Ранее уже подчеркивалось, что уровень значимости ос должен выбираться исследователем до получения экспериментальных данных, по которым будет проверяться гипотеза. Но часто с предварительным выбором возникают затруднения. Обычно говорят, что для научных исследований (в том числе и в спорте) достаточен уровень значимости а = 0,05, но если выводы, которые предстоит сделать по результатам проверки гипотез, связаны с большой ответственностью, то рекомендуется выбирать а = 0,01 или а =0,001.
Как установить ответственность в трактовке результатов эксперимента и тот риск, который связан с выбором уровня значимости а? Чтобы не давать прямых ответов на эти непростые вопросы, часто поступают следующим образом: уровень значимости до эксперимента точно не устанавливается, а по экспериментальным данным вычисляется вероятность Р того, что критерий (статистика критерия) выйдет за пределы значения, рассчитанного по выборке. Таким образом, Р — это экспериментальный уровень значимости. Точное значение Р обычно не указывают, а окончательные результаты приводят в следующем виде: 1) если вычисленное значение критерия не превосходит критического значения на уровне значимости а =0,05, то различие считается статистически незначимым; 2) если вычисленное по выборке значение критерия превышает критические значения при а=0,05, а=0,01 или а= 0,001, то записывают Р<0,05, Р<0,01 или Р<0,001. Это означает, что наблюдаемые различия статистически значимы на уровнях значимости 0,05, 0,01 или 0,001.
Критерии значимости подразделяются на три типа:
- Критерии значимости, которые служат для проверки гипотез о параметрах распределений генеральной совокупности (чаще всего нормального распределения). Эти критерии называются параметрическими.
- Критерии, которые для проверки гипотез не используют предположений о распределении генеральной совокупности. Эти критерии не требуют знания параметров распределений, поэтому называются непараметрически м и.
- Особую группу критериев составляют критерии согласия, служащие для проверки гипотез о согласии распределения генеральной совокупности, из которой получена выборка, с ранее принятой теоретической моделью (чаще всего нормальным распределением).
Односторонние и двусторонние критерии
Остановимся на одном важном обстоятельстве, которое часто не учитывается в спортивных приложениях математической статистики. Если цель исследования в том, чтобы выявить различие параметров двух генеральных совокупностей, которые соответствуют различным естественным условиям (условия тренировки, возраст испытуемых и т.п.), то часто неизвестно, какой из этих параметров будет больше, а какой меньше. Например, если интересуются вариативностью результатов в контрольной и экспериментальной группах, то, как правило, нет уверенности в знаке различия дисперсий или стандартных отклонений результатов, по которым оценивается вариативность. В этом случае нулевая гипотеза состоит в том, что дисперсии равны между собой а цель исследования — доказать обратное
т. е. наличие различия между дисперсиями. При этом допускается, что различие может быть любого знака. Такие гипотезы называются двусторонними.
Но иногда задача состоит в том, чтобы доказать увеличение или уменьшение параметра; например, средний результат в экспериментальной группе выше, чем в контрольной. При этом уже не допускается, что различие может быть другого знака. Тогда альтернативная гипотеза (или
а обратное ей утверждение
Такие гипотезы называются односторонними.
Критерии значимости, служащие для проверки двусторонних гипотез, называются двусторонними, а для односторонних — односторонними.
Возникает вопрос о том, какой из критериев следует выбирать в том или ином случае. Ответ на этот вопрос находится за пределами формальных статистических методов и полностью зависит от целей исследования. Ни в коем случае нельзя выбирать тот или иной критерий после проведения эксперимента на основе анализа экспериментальных данных, поскольку это может привести к неверным выводам. Если до проведения эксперимента допускается, что различие сравниваемых параметров может быть как положительным, так и отрицательным, то следует использовать двусторонний критерий. Если же есть дополнительная информация, например, из предшествующих экспериментов, на основании которой можно сделать предположение, что один из параметров больше или меньше другого, то используется односторонний критерий. Когда имеются основания дли применения одностороннего критерия, его следует предпочесть двустороннему, потому что односторонний критерий полнее использует информацию об изучаемом явлении и поэтому чаще дает правильные результаты.
Например, необходимо доказать различие средних значений генеральных совокупностей (средних значений спортивного результата) при двух различных методиках тренировки по результатам в контрольной и экспериментальной группах. Если есть данные, что экспериментальная группа покажет в среднем лучший результат, то нужно выдвинуть нулевую гипотезу против двусторонней альтернативы
Различие доказывается по разности средних арифметических результатов в контрольной и экспериментальной группах
Распределение разности
при условии, что верна нулевая гипотеза
схематично представлено на рис. 6.2, а.
Решение об отклонении гипотезы принимается в том случае, если разность
выходит за пределы некоторого значения
(допустимы отклонения в обе
Рис. 6.2. Уровни значимости при двустороннем (а) и одностороннем (б) критериях стороны от нуля). Ошибка, которая при этом допускается, равна, как известно, уровню значимости а. Но поскольку отклонения возможны в обе стороны, то при симметричном распределении вероятности отклонении, больших и меньших
будут одинаковы и составят а/ 2.
Нели предположить, что в экспериментальной группе будут показаны в среднем более высокие результаты, то можно выдвинуть одностороннюю альтернативу В этом случае при той же нулевой гипотезе
распределение разности
будет таким же, как и для двустороннего критерия (см. рис. 6.2, б).
теперь представляют интерес только положительные значения разности
Решение об отклонении
принимается, когда
окажется больше некоторого
При том же уровне значимости а
будет всегда меньше
поэтому нулевая гипотеза будет при одностороннем критерии отклоняться чаще.
Таким образом, двусторонние критерии оказываются более консервативными, чем односторонние.
Критерии, основанные на нормальном распределении
Если необходимо проверить гипотезу о том, что две независимые выборки получены из генеральных совокупностей X и У с одинаковыми дисперсиями то можно использовать
-критерий Фишера.
Сравнение двух выборочных дисперсий из нормальных совокупностей
Условия применения F-критерия: обе выборки независимы и получены из нормально распределенных генеральных совокупностей с параметрами
Известно, что это двусторонняя гипотеза, поэтому следует применять двусторонний критерий. Если же предположить, что одна из генеральных совокупностей имеет большую дисперсию (обозначим ее чем другая
то можно сформулировать одностороннюю гипотезу
и тогда применяется односторонний F-крите-рий.
Уровень значимости критерия задается а.
Порядок применения F-критерия следующий:
1. Принимается предположение о нормальности распределения генеральных совокупностей, формулируется гипотеза и альтернатива, назначается уровень значимости а, как указано выше.
2. Получают две независимые выборки из совокупностей X и У объемом у соответственно.
3. Рассчитываются значения выборочных дисперсий (методы расчета рассмотрены в гл. 3). Большую из дисперсий
обозначают
, меньшую
4. Вычисляется значение F-критерия по формуле:
5. Сравнивается вычисленное значение F с критическим значением F-критерия при заданном уровне значимости а и числе степеней свободы 1. Критические значения
при уровнях значимости а, равных 0,05, 0,01, 0,001.
Отметим, что в табл. 3 Приложения приведены критические значения одностороннего F-критерия. Поэтому если цель исследования доказать, что одна дисперсия больше другой то критические значения берутся непосредственно из этой таблицы. Если же применяется двусторонний критерий
, то критические значения, взятые из табл. 3 Приложения, соответствуют удвоенным уровням значимости: 0,01, 0,02 и 0,002.
6. Делается вывод: если вычисленное значение F-критерия больше или равно критическому, то дисперсии различаются значимо на заданном уровне значимости. В противном случае нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.
Пример 6.1
Одна группа школьников шестых классов взята из обычной школы, а другая
— из школы со специальной спортивной подготовкой. В обеих группах измерены результаты в беге на 100 м. Предстоит проверить утверждение о том, что по вариативности результатов школьники при обеих системах подготовки не отличаются.
Действуем в порядке, указанном выше.
1. Гипотеза . Альтернатива
, т. е. используем двусторонний критерий, поскольку заранее не уверены в том, что какая-либо из генеральных дисперсий больше другой.
Задаемся уровнем значимости а = 0,02 (такой «нестандартный» уровень значимости выбран из желания воспользоваться данными табл. 3 Приложения). Критические значения для двустороннего F-критерия содержатся в [8].
Принимаем предположение о нормальности распределения обеих генеральных совокупностей. Вопросы, связанные с тем, чем можно обосновать такое предположение, рассмотрены ниже в п. 6.4.
2—3. Пусть рассчитанные выборочные стандартные отклонения результатов составили: Обозначаем
4. Вычисляем значение F-критерия по формуле (6.1):
5. Из табл. 3 Приложения при а= 0,02;
находим
6. Вывод: посколькуто на уровне значимости а= 0,02 различие дисперсий статистически незначимо, т. е. можно считать, что школьники при обеих системах подготовки не отличаются по признаку вариативности результатов.
Хотя наблюдаемое в эксперименте различие выборочных стандартных отклонений и кажется большим, но имеющиеся статистические данные не дают оснований для отклонения гипотезы о том, что для генеральных совокупностей (всех школьников шестых классов обычных школ и школ со спортивной подготовкой) дисперсии (а значит, и стандартное отклонение) различаются на уровне значимости 0,02.
Следует отметить, что F-критерий очень чувствителен к отклонениям от нормальности распределения генеральной совокупности. Если предположение о нормальном распределении не может быть принято (см. п.п. 6.4), то F-критерий применять не следует. В этом случае используются непараметрические методы, рассмотренные в [3, 4).
F-критерий используется для малых и средних объемов выборки (n < 100). Для больших объемов выборки (n > 100) при проверке гипотезы о равенстве дисперсий применяется «-критерий. В этом случае вычисляется величина
и сравнивается с критическими значениями взятыми из таблиц нормированного нормального распределения (табл. 1 Приложения). Для стандартных уровней значимости значения
приведены в табл. 6.2 (см. п. 6,3.2).
Сравнение выборочного среднего арифметического со средним значением генеральной совокупности
Рассмотрим, как с помощью статистических критериев решить вопрос: значимо ли отличие выборочного среднего значения от среднего значения генеральной совокупности, из которой предположительно взята выборка, или наблюдаемое различие является случайным? Такая постановка вопроса типична для выборочного контроля качества продукции в промышленности, но и в спортивных исследованиях такой вопрос часто возникает, когда предстоит решить, значимо ли отличается среднее значение признака, полученное по выборке, от среднего значения, известного по результатам многочисленных предыдущих экспериментов.
Применяемый для этих целей t-критерий Стьюдента также основан на предположении о нормальности распределения генеральной совокупности, но результаты проверки гипотез удовлетворяют по точности и при небольших отклонениях от нормальности распределения (см. п. 6.4).
Условия применения t-критерия: выборка получена из генеральной совокупности, имеющей приближенно нормальное распределение с параметрами
Гипотеза — среднее значение р, генеральной совокупности, из которой получена выборка, равно заданному значению
(известному, например, из предыдущих экспериментов).
Альтернатива (двусторонний критерий применяется тогда, когда допускаются отклонения в обе стороны от
).
Уровень значимости: а.
Порядок применения T-критерия:
1. Принимается предположение о нормальности, формулируются гипотезы задается уровень значимости а.
2. Получают выборку объема n.
3. Вычисляется выборочное среднее арифметическое и выборочное стандартное отклонение
методами, изложенными в гл. 3.
4. Определяется значение t-критерия по формуле: Здесь |.| означает абсолютную величину разности
—
(без учета знака).
Величина t имеет при справедливости гипотезы t-распределение Стьюдента (определенное в гл. 4) с v = n — 1 степенями свободы.
5. По табл. 4 Приложения находится критическое значение t-критерия при уровне значимости а и числе степеней свободы v = n — 1. Табл. 4 Приложения содержит критические значения для двустороннего критерия.
6. Делается вывод: если то выборочное среднее значимо отличается от
на уровне значимости а, и в этой ситуации отклоняется гипотеза
т. е. считается, что выборка взята из другой генеральной совокупности, для которой
Если
, то на заданном уровне различие незначимо и сохраняется гипотеза
Пример 6.2
Цель исследования — проверить на основании результатов соревнований по спринтерскому бегу известное утверждение о том, что среднее различие между показаниями ручного и электронного хронометража составляет 0,25 с. На соревнованиях результаты фиксировались одновременно системой электронного хронометража и бригадой судей-хронометристов. Допустим, что есть результаты 30 спринтеров, пришедших на финиш первыми в своих забегах (для них, как правило, обеспечена наивысшая точность ручного хронометража, поскольку их результаты фиксируются несколькими хронометристами).
Используем t-критерий и действуем в указанном выше порядке.
1. Предполагаем, что распределение результатов в спринте приближенно нормальное (можно отметить, что справедливость этого предположения подтверждена исследованиями, проведенными в лаборатории спортивной радиоэлектроники ЛЭТИ им. В. И. Ульянова (Ленина) на большом статистическом материале).
Гипотеза
Альтернатива
Уровень значимости а= 0,01 (задается такой малый уровень значимости, поскольку цель — уточнить результаты, являющиеся общепринятыми).
2. Мы получили выборку объема n — 30 (разности
30 результатов по ручному и электронному хронометражу).
3. Допустим, например, что вычисленные выборочные характеристики оказались равными: х = 0,48 с, S = 0,39 с.
4. Вычисляем значение t-критерия по формуле (6.2):
5. По табл. 4 Приложения при а = 0,01 и v = 30 — 1 = 29 находим критическое значение /-критерия: /о,о! = 2,756.
6. Вывод. Поскольку то на уровне значимости 0,01 мы отклоняем гипотезу
т. е. среднее значение различий показаний ручного и электронного хронометража статистически значимо отличается от известного значения 0,25 с (вероятность ошибки Р<0,01).
Значит ли это, что значение 0,25 с вообще неверно? Конечно, нет. Основываясь только на полученных результатах, мы не должны даже подозревать этого. Скорее всего наши данные получены из какой-то менее обширной генеральной совокупности, в которой среднее значение отличается от 0,25 с. чтобы уверенно ответить на поставленный нами основной вопрос, мы должны провести многочисленные повторные эксперименты с целью получить значительно больший статистический материал и исключить влияние на результат многих важных факторов, не учтенных в эксперименте (квалификация судей, их эмоциональное состояние, состояние зоны финиша, освещенность и т. п.).
При больших объемах выборки как указано в гл. 4, t-распределение переходит в нормированное нормальное распределение, поэтому при проверке гипотезы вместо t-критерия можно использовать «-критерий, основанный на нормированном нормальном распределении статистики критерия.
В этом случае вычисляют величину
и сравнивают ее с критическими значениями иа нормированного нормального распределения. Для стандартных уровней значимости значения иа приведены в табл. 6.2.
= 2,756, их различие при n — 30 уже незначительно, но при n <30 это различие существенно, поэтому при малых выборках и используется t-критерий.
Сравнение двух выборочных средних значений для независимых выборок
В этом разделе рассматривается очень важный для практики спорта критерий математической статистики, позволяющий получить ответ на вопрос: значимо ли различаются средние значения, полученные по двум независимым выборкам (например, по результатам в контрольной и экспериментальной группах)? Здесь также применяется t-критерий Стьюдента, основанный на предположении, что выборки получены из генеральных совокупностей, имеющих приближенно нормальное распределение. Кроме того, применение t-критерия отличается при различных предположениях относительно дисперсий этих генеральных совокупностей. В математической статистике обычно рассматриваются случаи известных и неизвестных генеральных дисперсий, но, поскольку на практике генеральные дисперсии, как правило, неизвестны, здесь описывается только случай неизвестных дисперсий. При этом возможны следующие варианты предположений: 1) обе дисперсии неизвестны, но предполагается, что они равны между собой; 2) обе дисперсии неизвестны, и предположение о их равенстве не делается.
Как выбрать подходящий вариант? Конечно, если нет уверенности в равенстве дисперсий, нужно использовать второй вариант, потому что в этом случае требуется меньше знаний о распределении генеральных совокупностей, но всегда платой за это является меньшая точность выводов.
Поэтому обычно поступают следующим образом: вначале по имеющимся выборочным данным проверяют гипотезу о равенстве дисперсий, используя F-критерий, а затем уже выбирают тот или иной вариант t-критерия. Строго говоря, это некорректно с точки зрения математической статистики, поскольку, как уже неоднократно подчеркивалось, критерий должен выбираться до получения экспериментальных данных, и правильнее было бы выбрать предположение о равенстве или неравенстве дисперсий по другим, предварительно полученным экспериментальным данным.
При описанном выше подходе t-критерий применяется следующим образом.
Условия применения: обе выборки независимы и получены из генеральных совокупностей X и Y, имеющих нормальное распределение с параметрами
Гипотеза
Альтернатива в зависимости от того, что требуется доказать: простое различие средних значений или то, что одно из них больше другого.
Уровень значимости: а.
Порядок применения:
1. Принимается предположение о нормальности, формулируются гипотеза и альтернатива
задается уровень значимости а.
2. Получают две независимые выборки из совокупностей X и Y объемом
3. Вычисляются выборочные характеристики методами, рассмотренными в гл. 3.
4. Используется F-критерий для проверки гипотезы о равенстве генеральных дисперсий, как показано в разделе 6.3.1.
5. По результатам применения F-критерия принимается или не принимается предположение о равенстве дисперсий.
6. Вычисляются значение t-критерия и число степеней свободы v. Применяемые для этого формулы приведены в табл. 6.3, они различаются в зависимости от предположения о дисперсиях и соотношения между объемами выборок
7. Из табл. 4 Приложения находится критическое значение t-критерия при заданном уровне значимости а и числе степеней свободы v.
8. Делается вывод: если то выборочные средние значимо различаются на уровне значимости а (вероятность ошибки
В противном случае различие статистически незначимо.
Пример 6.3
Две группы юных баскетболистов, занимающихся на базе одной ДЮСШ, в течение годичного цикла тренировки занимались но разным программам специальной подготовки (традиционной и новой). Эффективность новой программы оценивалась по уровню общефизической подготовки в конце цикла, и одним из контрольных упражнений был бег на 100 м. Численность групп одинакова и составляет n — 10.
Результаты на дистанции 100 м (в с):
Используем t-критерий Стьюдента в указанной выше последовательности:
1. Принимаем предположение о нормальности распределения генеральных совокупностей, из которых получены результаты.
Гипотеза
Альтернатива (берется двусторонний критерий, если нет оснований предполагать, что новая программа специальной подготовки приведет к улучшению результатов на 100 м).
Выбираем уровень значимости а — 0,05.
2. Получаем две выборки, независимость которых обеспечивается планированием эксперимента (результаты, показанные в одной группе, не зависят от результатов другой).
3. Рассчитываем выборочные характеристики по формулам (3.1) и (3.11) гл. 3. Расчеты дают:
4. Применяем F-критерий для проверки гипотезы о равенстве дисперсий. Выбираем уровень значимости двустороннегоF-критерия: а ~ 0,02.
поэтому обозначим
Значение ^-критерия выводим по формуле (6.1):
Критическое значение
двустороннего F-критерия находим из табл. 3 Приложения
5. Поскольку принимаем предположение о равенстве генеральных дисперсий
6. Вычисляем значение t-критерия: нашему случаю соответствует формула (1) из табл. 6.3. Поэтому 7. Из табл. 4 Приложения находим критическое значение t-критерия при a= 0,05 и v = 18:
8. Вывод: поскольку
то на уровне значимости 0,05 принимаем гипотезу
Нет оснований для заключения о том, что новая программа но изучаемому признаку (бег на 100 м) эффективнее традиционной.
Примечание. Если бы до проведения эксперимента было принято предположение, что новая программа обеспечивает прирост результатов в беге на 100 м, и нужно было бы доказать это, мы выдвинули бы одностороннюю альтернативу В этом случае следует применять односторонний t-критерий.
Последовательность действий точно такая же, за исключением того, что на этапе 7 при использовании табл. 4 Приложения нужно иметь в виду, что в ней содержатся критические значения двустороннего критерия. В случае одностороннего критерия данные табл. 4 соответствуют удвоенным уровням значимости. Таким образом, если для одностороннего критерия устанавливается уровень значимости а = 0,05, то в табл. 4 Приложения находим значение для а = 0,1.
Для этого примера имеем
Теперь уже результат проверки гипотезы будет противоположным. Поскольку то делаем вывод о статистически значимом различии средних значений в беге на 100 м.
В этом нет никакого противоречия или доказательства несостоятельности статистических методов. Просто в первом случае, используя двустороннюю гипотезу, мы допускали и отрицательный эффект новой программы. В такой ситуации выводы должны быть более осторожными, чем в случае односторонней гипотезы, когда имеется дополнительная информация, позволяющая сделaть предположeние о положительном эффекте новой программы, что, естественно, дает возможность сделать более точный вывод. Правда, следует отметить, что превышение критического значения в рассмотренном примере столь незначительно, что в достоверности вывода о наличии положительного эффекта можно усомниться. В такой ситуации следует провести дополнительные исследования.
Сравнение двух выборочных средних значений для связанных выборок
Существует много практических задач, в которых две сравниваемые выборки взаимосвязаны в силу особенностей организации эксперимента или просто потому, что этой взаимосвязи нельзя избежать.
В практике медицинских, биологических и педагогических исследований часто используются так называемые парные сравнения. Один из методов таких сравнений заключается в том, что измерения проводятся для одной и той же группы испытуемых до и после применения интересующих исследователя воздействий. Результаты парных сравнений всегда точнее, чем сравнения на независимых группах, и объясняется это тем, что разброс результатов внутри группы испытуемых всегда больше, чем разброс разностей результатов, полученных при повторных измерениях для одних и тех же индивидуумов. Это можно пояснить на следующем простом примере. Допустим, необходимо но частоте сердечных сокращений (ЧСС) установить влияние на спортсменов какого-то вида тренировочной нагрузки. Конечно, можно было бы провести такой эксперимент на двух независимых однородных группах: в одной из них определить среднее значение ЧСС в покое, а в другой после тренировочной нагрузки. и без точных математических доказательств ясно, что выводы будут точнее, если измерения ЧСС провести у одних и тех же спортсменов до и после тренировочной нагрузки. Поэтому парные сравнения всегда выгодно использовать, конечно, если удается организовать эксперимент так, что будет устранено влияние мешающих факторов {усталость, эффект обучения и т. п.).
При парных сравнениях нельзя использовать рассмотренные выше методы для независимых выборок, поскольку это приведет к большим ошибкам.
Для сравнения средних значений здесь используется модификация t-критерия для связанных выборок. Особенность его в том, что гипотеза формулируется в отношении разностей сопряженных пар наблюдений.
Условия применения: — разность связанных пар результатов измерения. Делается предположение о нормальном распределении этих разностей в генеральной совокупности с параметрами
Гипотеза
Альтернатива (для двустороннего критерия) . Можно сформулировать и одностороннюю альтернативу, например,
Уровень значимости: а.
Порядок применения:
1. Делается предположение о нормальном распределении разностей dформулируется гипотеза
и альтернатива
выбирается уровень значимости а.
2. Получают две выборки объема n, представляющие собой ряды связанных пар наблюдений.
3. Вычисляются среднее арифметическое и выборочное стандартное отклонение
по формулам гл. 3.
4. Определяется значение t-критерия: 5. Из табл. 4 Приложения находятся критические значения
-критерия при уровне значимости а и числе степеней свободы
6. Делается вывод: если то наблюдаемое различие значимо на уровне значимости а (Р < а), в противном случае различие статистически незначимо.
Пример 6.4
Группа школьников (n = 10) в течение летних каникул находилась в спортивном лагере. До и после сезона у них измерили жизненную емкость легких (ЖЕЛ). По результатам измерений нужно определить, значимо ли изменился этот показатель под влиянием интенсивных физических упражнений.
До эксперимента
3400 3600 3000 3500 2900 3100 3200 3400 3200 3400
После эксперимента
3800 3700 3300 3600 3100 3200 3200 3300 3500 3600
Действуем в указанном выше порядке:
1. Принимаем предположение о нормальности распределения разностей
Г ипотеза
Альтернатива
Выбираем уровень значимости: а = 0,05.
2. Имеем две связанные выборки объема n =10.
3. Вычисляем выборочные характеристики: значения разностей: 400 100 300 100 200 100 0— 100 300 200,
4. Значение t-критерия, определяемое по формуле (6.3), равно 5. Из табл. 4 Приложения для а = 0,05 и v = 9 находим
= 2,262.
6. Вывод: поскольку наблюдаемое различие по показателю ЖЕЛ является статистически значимым на уровне значимости 0,05 (вероятность ошибки Р < 0,05).
При больших выборках (для п) вместо t-критерия можно использовать u-критерий. В этом случае вычисленное значение t сравнивается с критическим значением
нормированного нормального распределения (см. табл. 6.2).
Критерии согласия
Все рассмотренные выше критерии значимости являются оптимальными, т. е. обеспечивают наивысшую достоверность статистических выводов только в тех случаях, когда выборки получены из нормально распределенной генеральной совокупности. При отклонениях от нормального распределения точность оптимальных критериев существенно падает, поэтому, чтобы уверенно применять оптимальные критерии, необходимо проверить предположение о нормальном распределении генеральной совокупности. Для этого используются критерии согласия. Здесь нулевая гипотеза представляет собой утверждение о том, что распределение генеральной совокупности, из которой получена выборка, не отличается от нормального. Существует несколько разновидностей критериев согласия. Рассмотрим те из них, которые получили наибольшее распространение на практике.
Предварительная проверка соответствия нормальному распределению
Критерии согласия требуют достаточно большой вычислительной работы, поэтому целесообразно перед тем, как их использовать, проверить с помощью более простых методов соответствие имеющихся экспериментальных данных нормальному распределению. Эти методы, естественно, обладают меньшей мощностью и позволяют установить только значительные расхождения с нормальным распределением, но если такие расхождения будут установлены, то необходимость в применении более точных, но более сложных критериев, как правило, отпадает.
Для предварительной проверки эмпирического распределения на нормальность можно использовать основные свойства нормального распределения, изложенные в гл. 4. При этом эмпирическое распределение представляется в виде вариационного ряда или гистограммы (см. гл. 2). Если в качестве параметров и о нормального распределения принять их выборочные оценки
и S, то для проверки можно использовать следующие свойства нормального распределения: 1) практически все отклонения от среднего значения (99,7 %) должны быть меньше ±3S; 2) примерно 2/3 всех отклонений (68,3 %) должны быть меньше ±S; 3) половина всех отклонений от среднего значения должна быть меньше
4) можно использовать такое свойство нормального распределения, что его коэффициенты асимметрии
и эксцесса
равны нулю.
Для проверки по этому свойству необходимо вычислить выборочные оценки этих параметров по формулам: где
— частоты интервалов группировки; k — число интервалов группировки; S — выборочное стандартное отклонение.
Значения коэффициентов As и Ех сравниваются с критическими значениями на уровне значимости а, и если критические значения превышены, то делается вывод о том, что распределение генеральной совокупности, из которой получена выборка, не согласуется с нормальным. В противном случае модель нормального распределения может быть принята. Таблица критических значений содержится в [7, 8,14]. Здесь не будем подробно останавливаться на этих приближенных критериях. Отметим лишь еще раз, что они могут использоваться только совместно с более точными критериями, рассмотренными ниже.
Критерий согласия x2 (хи-квадрат)
Критерий согласия разработан лучше других критериев и чаще других используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам нормального распределения.
Условия применения: объем выборки выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.
Гипотеза ) — плотность распределения
генеральной совокупности, из которой взята выборка, соответствует теоретической модели
нормального распределения.
Альтернатива
Уровень значимости: а.
Порядок применения:
1. Формулируется гипотеза, выбирается уровень значимости а.
2. Получается выборка объема независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда, как показано в гл. 2.
3. Рассчитываются выборочные характеристики и S (методы расчета изложены в гл. 3). Их используют в качестве генеральных параметров
и а
нормального распределения, с которым предстоит сравнить эмпирическое распределение.
4. Вычисляются значения теоретических частот попадания в i-й интервал группировки. Для этого необходимо вероятность попадания в этот интервал, определенную по формуле (4.27), умножить на объем выборки n:
где — функции Лапласа (см. табл. 1 Приложения);
— верхняя и нижняя граниты
интервала группировки.
Если окажется, что вычисленные ожидаемые частоты п’ некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была больше или равна 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.
5. Значение -критерия рассчитывается по формуле:
где
— эмпирические частоты;
— ожидаемые (теоретические) частоты; k — число интервалов группировки после объединения.
6. Из табл. 5 Приложения находится критическое значение критерия для уровня значимости а и числа степеней свободы v = k — 3.
7. Вывод: если то эмпирическое распределение не соответствует нормальному распределению на уровне значимости а, в противном случае нет оснований отрицать это соответствие.
Пример 6.5
Воспользуемся данными табл. 2.3, где представлены результаты в беге на 100 м группы школьников (n = 50) для проверки соответствия эмпирического распределения нормальному распределению.
Исходные данные помещены в графы 2, 3 табл. 6.4 (графа 2 — границы интервалов группировки, графа 3 — эмпирические частоты интервалов). В табл. 2.3 верхние границы были уменьшены на 0,1 с для удобства подсчета частот. В табл. 6.4 верхние границы оставлены без изменений.
1. Формулируем гипотезу выбираем уровень значимости а = 0,05.
2. Получаем выборку объема n = 50, строим интервальный вариационный ряд с числом интервалов к— 7 (см. табл. 2.3).
3. Выборочные характеристики по этим данным рассчитаны в примере 3.6:
х — 15,4 с, S — 0,9 с.
4. Вычисляем значения теоретических частот по формуле (6.4) с использованием табл. 1 Приложения. Предварительно нормируем границы интервалов группировки:
Нормированные границы занесены в графу 4, а вычисленные теоретические частоты — в графу 5 табл. 6.4.
Поскольку для интервалов с номерами 1, 2, 7 теоретические частоты оказались меньше 5, объединяем интервалы 1 и 2 с 3-м, а интервал 7 с 6-м интервалами. Суммируем эмпирические и ожидаемые частоты интервалов, которые мы объединили. После объединения получилось k = 4 интервала. Таблица 6.4 5. Значение критерия
определяемое по формуле (6.5), равно:
Промежуточные расчеты отражены в графах 6 и 7 табл. 6.4.
6. Из табл. 5 Приложения находим для уровня значимости а = 0,05 и числа степеней свободы v = 4— 3= 1:
7. Вывод: поскольку считаем, что эмпирическое распределение соответствует нормальному на уровне значимости 0,05.
Критерий X (лямбда)
Другим критерием, часто используемым для проверки гипотезы о нормальности распределения, является критерий Колмогорова — Смирнова. Здесь гипотеза
формулируется по отношению к функциям распределения
— функция распределения генеральной совокупности, из которой получена выборка, a F'(x) — функция непрерывного теоретического распределения (нормального распределения).
Колмогорова — Смирнова
Условия применения: объем выборки эмпирическое распределение представлено в виде интервального вариационного ряда.
Гипотеза
Альтернатива
Уровень значимости: а.
Порядок применения:
1. Формулируется гипотеза назначается уровень значимости а.
2. Получают выборку объема независимых наблюдений, она группируется в интервальный вариационный ряд, как показано в гл. 2.
3. Вычисляются выборочные характеристики и S по формулам гл. 3.
4. Рассчитываются значения эмпирических накопленных частот как показано в гл. 2, и теоретических накопленных частот
по формуле:
где n — объем выборки; — функция Лапласа (см. табл. 1 Приложения);
— срединные значения интервалов группировки.
5. Вычисляются значения критерия
где — максимальное значение модуля (абсолютной величины) разности между эмпирическими
и теоретическими
накопленными частотами.
6. Определяется критическое значение критерия Колмогорова — Смирнова при уровне значимости а. Для стандартных уровней значимости критические значения равны:
Они соответствуют рассматриваемому варианту применения критерия Колмогорова — Смирнова, когда для вычисления теоретических накопленных частот используются выборочные характеристики и S в качестве параметров
нормального распределения.
7. Вывод: если то эмпирическое распределение не соответствует нормальному на уровне значимости а, в противном случае принимается гипотеза о согласии распределения генеральной совокупности с нормальным распределением.
Пример 6.6
Воспользуемся данными предыдущего примера (6.5) для проверки их соответствия нормальному распределению по критерию Колмогорова — Смирнова.
В табл. 6.5 в столбцах 2, 3 приведены срединные значения интервалов группировки и эмпирические накопленные частоты, взятые из табл. 2.3.
1. Формулируем гипотезу и выбираем уровень значимости а = 0,05.
2. Имеем выборку объема n — 50, сгруппированную в интервальный вариационный ряд с семью интервалами.
3. Выборочные характеристики рассчитаны в предыдущем примере:
4. Эмпирические накопленные частоты приведены в графе 3, а теоретические, рассчитанные по формуле (6.6) — в графе 5.
5. Значение критерия составляет
6. Критическое значение для а = 0,05 равно
= 0,895.
7. Вывод: поскольку мы вынуждены отклонить гипотезу о том, что выборка взята из нормально распределенной генеральной совокупности.
Оба рассмотренных критерия — Колмогорова — Смирнова применимы в одних и тех же условиях
Сравнение мощностей этих критериев для общего случая затруднительно, но из опыта известно, что критерий
Колмогорова — Смирнова является более мощным (чаще обнаруживает отклонения от нормальности), если среднее и дисперсия теоретического нормального распределения оцениваются по выборке. Рассмотренные выше примеры 6.5 и 6.6 подтверждают это: для одних и тех же данных на одинаковом уровне значимости критерий
Колмогорова — Смирнова обнаружил несоответствие нормальному распределению, а
-критерий позволяет принять гипотезу о нормальности.
Критерий W Шапиро — Уилки
Два рассмотренных выше критерия применяются при больших выборках Если объем выборки меньше, то более точные выводы дает критерий Шапиро — Уилки, позволяющий обнаружить отклонения от нормальности распределения уже при
. Ниже его применение рассматривается на конкретном примере.
Пример 6.7
Проверим на соответствие нормальному распределению данные примера 6.3 — результаты в беге на 100 м одной из групп (например, контрольной) юных баскетболистов.
Эти результаты представлены в графе 2 табл. 6.6.
Порядок применения:
1. Формулируем гипотезу о соответствии распределения генеральной совокупности, из которой получены данные, нормальному распределению. Назначим уровень значимости а = 0,05.
2. Получаем выборку объема n = 10 независимых измерений.
3. Рассчитываем значение выборочной дисперсии. Из примера 6.З: = 0,37.
Таблица 6.6
4. Ранжируем выборку, т. е. располагаем выборочные значения в возрастающем порядке, как показано в графе 2 табл. 6.6.
5. Образуем разности для чего из максимального значения
вычитаем наименьшее
затем из
вычитаем
и т. д. Если n — четное, то число разностей
k = n/2, если n— нечетное, то при этом
центральная варианта выборки в образовании разностей не участвует.
Номера разностей k приведены в графе 3, а значения разностей — в графе 4 табл. 6.6.
6. По табл. 6 Приложения находим значение коэффициентов критерия W Шапиро — Уилки, соответствующие объему выборки n = 10 и номерам разностей k. Эти значения помещены в графе 5 табл. 6.6.
7. Находим произведения Эти произведения
занесены в графу 6 табл. 6.6. . 8. Вычисляем величину 9. Рассчитываем значение критерия W по формуле:
10. Из табл. 7 Приложения находим критическое значение критерия Шапиро — Уилки для уровня значимости а = 0,05:
11. Вывод: посколькуможно говорить о соответствии эмпирических данных нормальному распределению на уровне значимости 0,05.
Заметим, что критерий W Шапиро — Уилки строится таким образом, что гипотеза принимается при
в отличие от остальных критериев, для которых гипотеза
принимается, если значение критерия меньше критического.
Непараметрические критерии
Применение рассмотренных в разделе 6.3 параметрических критериев было связано с целым рядом допущений. Например, сравнивая выборочные средние значения с помощью t-критерия, принимались следующие предположения: обе выборки являются случайными, т. е. каждая из них получена в результате независимых измерений; обе выборки получены из генеральных совокупностей, имеющих нормальное распределение; дисперсии генеральных совокупностей равны между собой.
На практике эти предположения строго никогда не выполняются, поэтому применение параметрических критериев всегда связано с опасностью ошибочных выводов, возникающей из-за нарушения принятых допущений. В последнее время в математической статистике по этой причине интенсивно разрабатываются непараметрические методы, которые строятся так, чтобы их применение зависело от возможно меньшего числа допущений.
Отметим в связи с этим еще одно важное обстоятельство. Параметрические критерии значимости применимы только для сравнения выборочных данных, представляющих собой результаты измерений, выраженные в единицах метрических шкал (метры, килограммы, секунды и т. п.). Но в спортивных исследованиях часто приходится иметь дело с данными, выраженными в шкалах наименований или порядка, например произвольная нумерация игроков футбольной команды, места, запятые спортсменами на соревнованиях и т. д. Такие данные нельзя сравнивать с помощью параметрических критериев, а непараметрические критерии могут быть успешно применены и к данным этого типа.
Если рассматривать только те случаи, когда выборки можно считать полученными ид нормально распределенных совокупностей, непараметрические критерии всегда проигрывают соответствующим параметрическим критериям, оптимальным в этих случаях, потому что применение непараметрических критериев обычно связано с потерей части информации об измеренных значениях признаков. Поэтому вводится показатель эффективности критерия (E). Он представляет собой отношение объема выборки параметрического критерия к объему выборки непараметрического критерия при одинаковой мощности критериев в условиях нормального распределения генеральной совокупности. Этим показателем и принято оценивать эффективность непараметрических критериев.
Важную группу непараметрических критериев составляют ранговые критерии. Они хорошо разработаны, и эффективность их оказывается очень высокой (для большинства из них при больших объемах выборки эффективность близка к единице). В то же время они очень просты в пользовании и не требуют сложных математических вычислений.
Ниже рассматриваются некоторые из ранговых критериев. предварительно следует познакомиться с понятием «р а н г», играющим здесь ключевую роль.
Ранги
Если расположить выборочные данные в порядке возрастания или убывания (точнее, в неубывающем или невозрастающем порядке, потому что некоторые данные могут совпадать), то получается ранжированная выборка. Порядковый номер выборочного значения в ней называется рангом этого значения.
Ранг однозначно определен порядковым номером, если в выборке нет совпадающих значений. Если же они есть, то их ранги определяются как среднее арифметическое порядковых номеров совпадающих значений. Пусть, например, получена выборка объема n — 10, которая после ранжирования выглядит следующим образом:
Значения с порядковыми номерами 3, 4, 5 и 8, 9 совпали, поэтому их ранги R определяются как
Таким образом, ранг не обязательно будет целым числом.
Для остальных, не совпадающих элементов выборки их ранги равны порядковым номерам. Ранги R, представленных выборочных значений равны:
В ранговых критериях точные значения признаков заменяются их рангами, поэтому информация о них теряется.
Рангами могут быть представлены данные, выраженные в порядковой шкале, в том числе результаты наблюдения качественных признаков, когда невозможно измерить точное численное значение признака, но можно определить очередность значений по принципу «больше— меньше» (например, места в спортивных состязаниях, результаты судейства в баллах, отметки за экзамен и т. п.).
Сравнение двух независимых выборок
К сравнению двух независимых выборок сводится очень широкий круг практических задач, которые в математической статистике часто называются задачами об эффекте обработки. Под «обработкой» здесь понимается любой процесс из конкретной области исследования, например методика или программа тренировки, тактические приемы соревновательной деятельности и др. Об эффекте обработки судят по результатам выборочных исследований. Если эксперимент организован так, что экспериментальный способ обработки сравнивается со стандартным (контрольным), то сопоставляются данные, представляющие собой две независимые выборки: одна получена из контрольной генеральной совокупности (результаты контрольной группы), а вторая — из экспериментальной (результаты экспериментальной группы).
Нулевая гипотеза — это утверждение об отсутствии эффекта обработки, а цель исследования — доказать его наличие. Когда принимается предположение о нормальном распределении обеих генеральных совокупностей, для решения этой задачи применяется t-критерий Стью-дента, который был рассмотрен в разделе 6.3. Но если предварительный анализ эмпирического распределения не позволяет принять предположение о нормальности или к такому выводу приходят в результате проверки гипотезы о нормальности распределения генеральной совокупности по стандартным критериям согласия (см. раздел 6.4), то использовать t-критерий нельзя.
Для таких случаев разработано несколько параметрических критериев. Рассмотрим один из них — критерий Вилкоксона для независимых выборок (критерий иногда называют также критерием Уайта). Это самый простой ранговый критерий.
Применение критерия Вилкоксона основано на единственном предположении: выборки получены из однотипных непрерывных распределений. При этом вид распределения генеральных совокупностей X и Y никак не оговаривается. Допущение о непрерывности распределений может быть ыриннто, когда исследуемый признак имеет большое число возможных градаций.
Гипотеза — это утверждение о том, что функции распределения обеих генеральных совокупностей одинаковы. Иначе говоря, обе выборки получены из одной и той же генеральной совокупности, и эффект обработки отсутствует.
Поясним это более подробно. Поскольку функции распределения F (х) и F {у) равны, то, следовательно, равны и характеристики положения этих распределений (среднее значение и медиана). Поэтому если эффект оценивается по различию средних арифметических двух выборок, то нулевую гипотезу можно было бы записать в виде . В этом случае критерий Вилкоксона является непараметрическbм аналогом t-критерия для независимых выборок. Но, как было отмечено в гл. 3, если эмпирическое распределение получается сильно асимметричным, то среднее арифметическое теряет свою практическую ценность (оно плохо отражает среднее значение признака), и в этих случаях более подходящей характеристикой положения является медиана
Одним из ценных свойств ранговых критериев является и то, что они могут применяться к данным, выраженным в шкале порядков или в шкале наименований. Для таких данных вычисление среднего арифметического не имеет смысла, а в качестве характеристики положения также используется Поэтому гипотезу
для непараметрических критериев обычно записывают в виде
Эта запись относится к медианам генеральных совокупностей, хотя здесь используется тот же символ Me, что и для выборочной медианы. В частном случае, когда распределение симметричное (нормальное), эта запись эквивалентна так как для симметричных распределений среднее значение и Me совпадают.
Альтернатива— (это двусторонняя альтернатива). Ее, как обычно, применяют тогда, когда нет уверенности в знаке ожидаемого различия (допускается как положительный, так и отрицательный эффект обработки). Можно сформулировать и одностороннюю альтернативу, например,
если нужно доказать, что результаты в экспериментальной группе выше, чем в контрольной.
Ниже рассматривается применение критерия Вилкок-сона на конкретном примере.
Пример 6.8
Воспользуемся данными примера 6.3, где приведены результаты в беге на 100 м контрольной и экспериментальной групп юных баскетболистов. В примере 6.3 принималось предположение о нормальном распределении совокупностей, из которых получены выборки. Здесь такого предположения не делается.
Объем выборки для контрольной группы — = 10 и для экспериментальной —
= 10.
Проверим гипотезу против двусторонней альтернативы
По-прежнему выбираем уровень значимости а = 0,05.
Порядок применения критерия Вилкоксона:
1. Объединяем обе выборки в одну. Объем объединенной выборки будет Ранжируем объединенную выборку, располагая данные в порядке возрастания, как показано в графе 1 табл. 6.7. При этом отмечаем данные, относящиеся к одной из выборок (все равно какой), например второй.
2. Находим ранги , объединенной выборки, как показано в разделе 6.5.1. Отмечаем ранги, относящиеся ко второй выборке. Они приведены в графе 3 табл. 6.7.
3. Суммируем по отдельности ранги, относящиеся к первой и второй выборкам, т. е. находим суммы:
Суммы рангов:
Контроль:
Для проверки правильности этих операций можно использовать тот факт, что сумма всех рангов
4. Меньшую из сумм рангов принимаем в качестве значения критерия W.
Для нашего примера W = — 82,5.
5. Из табл. 8 Приложения находим критическое значение критерия Вилкоксона при уровне значимости а = 0,05 и при объемах выборки
= 10 и
— 10 (в табл. 8
— меньший и больший объемы выборки из
6. Вывод: если нулевая гипотеза отбрасывается, т. е. различие считается статистически значимым на уровне значимости а. В противном случае различие статистически незначимо.
Для нашего примера поэтому на основании имеющихся данных мы не можем отклонить гипотезу
об отсутствии различия двух выборок. К такому же выводу мы пришли и в примере 6.3, используя t-критерий в предположении нормальности распределений.
Как видно из примера 6,8, применение критерия Вил-коксона основано на очень простых вычислениях сумм рангов. Это характерно для всех ранговых критериев. В то же время эффективность этого критерия довольно высока. Если он применяется для сравнения выборок из нормальных генеральных совокупностей, то при неограниченном увели-нении объема выборок эффективность его равна 0,95. Это означает, что при n = 1000 критерий Вилкоксона имеет такую же мощность (т. е. с такой же вероятностью правильно обнаруживает различие), как и оптимальный для этого случая t-критерий при пn— 950. Если же распределения несимметричны, то эффективность критерия Вилкоксона может быть и значительно больше 1.
В табл. 8 Приложения критические значения приведены только для объемов выборок
. Если
больше 10, можно приближенно использовать u-критерий. Для этого рассчитывается значение
по следующей приближенной формуле:
где — объем выборки с меньшей суммой рангов;
— объем второй выборки; n — объем объединенной выборки; W — значение критерия Вилкоксона, определяемое по указанному выше порядку.
Удобнее пользоваться выражением
Вычисленное по этой формуле значение w сравнивается с критическим значением приведенным в табл. 6.8. Если
гипотеза
отвергается, если
принимается.
Сравнение двух связанных выборок
Здесь будет рассмотрено применение непараметрических методов в тех случаях, когда требуется доказать различие двух связанных выборок, т. е. выборок, полученных при парных сравнениях (например, при повторных измерениях на одной и той же группе испытуемых спортсменов). В предположении нормальности распределения разностей результатов парных измерений используется t-критерий для связанных выборок (см. раздел G.3.4). Теперь же предположение о нормальности не делается.
Наиболее часто применяемый непараметрический критерий в таких случаях — критерий Вилкоксона для связанных выборок, являющийся непараметрическим аналогом упомянутого t-критерия.
Нулевая гипотеза в данном случае — это утверждение о том, что распределение разностей
—
связанных пар наблюдений
является симметричным относительно нуля. Вид распределения при этом не имеет значения. Это означает, что медиана распределения разностей —
и среднее значение
(если оно может быть определено) равны нулю, т. е.
Альтернатива в двустороннем случае, когда допускается как положительный, так и отрицательный эффект обработки. Можно сформулировать и одностороннюю альтернативу, например,
Ниже приводится пример использования критерия Вилкоксона.
Пример 6.9
Воспользуемся данными примера 6.4, в котором представлены результаты измерения ЖЕЛ У школьников до и после пребывания в спортивном лагере. Применим непараметрический критерий Вилкоксона для доказательства различия связанных пар наблюдений
Зададимся уровнем значимости а = 0,05.
Исходные данные х: и У( помещены в столбцах 2 и 3 табл. 6.9.
Порядок применения:
1. Отбрасываем пары с одинаковыми значениями и
и для дальнейших расчетов объем выборки сокращаем на число отброшенных пар.
В нашем примере отбрасывается пара 3200, 3200, и объем выборки будет n = 10 — 1 9.
2. Из оставшихся пар образуем разности Эти разности приведены в графе 4 табл. 6.9.
3. Находим ранги абсолютных значений разностей
как показано в разделе 6.5.1. Ранги записаны •в графе 5 табл. 6.9.
4. Отмечаем ранги, относящиеся к положительным и отрицательным значениям разностей.
В графе 5 ранги обозначены (+) и (—).
5. Находим по отдельности суммы рангов отрицательных^ положительных разностей R(—) и R(+).
6. Меньшую из сумм рангов принимаем в качестве значения критерия W. Для нашего примера 2,5.
7. Из табл. 9 Приложения находим критическое значение критерия Вилкоксоиа при уровне значимости а= 0,05 и объеме выборки n = 10:
В табл. 9 Приложения приведены критические значения двустороннего критерия Вилкоксоиа. Если используется односторонний критерий, то значения этой таблицы соответствуют удвоенным уровням значимости, т. е.
8. Вывод: если то нулевая гипотеза отбрасывается и наблюдаемое различие связанных выборок является статистически значимым на уровне значимости а. В противном случае различия статистически незначимы.
Для рассматриваемого примера поэтому различия статистически значимы на уровне значимости а = 0,05 (P <0,05).
К такому же выводу мы пришли и в примере 6.4 при использовании t-критерия для нормального распределения разностей
Если объем выборок достаточно велик можно использовать
-критерий, основанный на следующем приближенном выражении:
где W — значение критерия Вилкоксона, определяемое как указано выше.
Вычисленное по этой формуле значение и сравнивается с критическимвзятым из табл. 6.2, и если оказывается, что
гипотеза
отбрасывается, если
гипотеза
принимается.
Регрессионный и корреляционный анализ
В предыдущих лекциях были рассмотрены простейшие ситуации, когда в ходе исследования измерялись значения только одного варьирующего признака генеральной совокупности. Остальные признаки либо считались постоянными для данной совокупности, либо относились к случайным факторам, определяющим варьирование исследуемого признака. Как правило, исследования в спорте значительно сложнее и носят комплексный характер. Например, при контроле за ходом тренировочного процесса измеряется спортивный результат и одновременно может оцениваться целый ряд биомеханических, физиологических, биохимических и других параметров (скорость и ускорения общего центра масс и отдельных звеньев тела, углы в суставах, сила мышц, показатели систем дыхания и кровообращения, объем физической нагрузки и энергозатраты организма на ее выполнение и т. д.).
При этом часто возникает вопрос о взаимосвязи отдельных признаков. Например, как зависит спортивный результат от некоторых элементов техники спортивных движений? как связаны энергозатраты организма с объемом физической нагрузки определенного вида? насколько точно по результатам выполнения некоторых стандартных упражнений можно судить о потенциальных возможностях человека в конкретном виде спортивной ‘ деятельности? и т. п. Во всех этих случаях внимание исследователя привлекает зависимость между различными величинами, описывающими интересующие его признаки.
Иногда значение одной величины однозначно определяет значение другой, связанной с ней величины. В этих случаях имеет место функциональная зависимость между величинами. Например, средняя скорость на отрезке L дистанции функционально связана с временем l на этом отрезке (
= L/T), пульсовая стоимость (ПС) 1 м пути однозначно определяется скоростью
и частотой сердечных сокращений (ЧСС) на данном участке пути (ПС = ЧСС/
) и т. п.
Но чаще исследователя интересуют зависимости другого рода, когда при фиксированном значении одной величины другая величина имеет некоторую свободу и
может принимать различные значения. Так, средняя скорость на фиксированном отрезке пути будет различной для разных спортсменов, пульсовая стоимость 1 м пути при одной и той же скорости отличается для разных испытуемых.
Если в такой ситуации рассматривать одну величину как независимую (контролируемую), а вторую — как зависимую от первой, то зависимая величина ведет себя как случайная и ее можно описать некоторым вероятностным распределением. В то же время интерес вызывает то, что это распределение (или его параметры: среднее значение, стандартное отклонение) закономерно изменяется при изменении значений независимой величины. Например, среднее значение пульсовой стоимости 1 м пути для группы испытуемых будет закономерно изменяться при изменении скорости движения. В таких ситуациях говорят о стохастической (или вероятностной) зависимости между величинами.
При изучении стохастических зависимостей различают регрессию и корреляцию.
Регрессия — это зависимость среднего значения (точнее, математического ожидания) случайной величины Y от величины х. При этом принято говорить: «регрессия Y на х». Независимая величина х может быть не обязательно случайной, поэтому она обозначается здесь строчной буквой, прописные буквы используются обычно для случайных величин.
Корреляция — это зависимость между двумя случайными величинами Y и X, характеризуемая с помощью коэффициентов корреляции.
В соответствии с этим различают регрессионный и корреляционный анализы.
Регрессионный анализ устанавливает формы зависимости между случайной величиной Y и значениями одной или нескольких переменных величин, причем значения последних считаются точно заданными. Такая зависимость обычно определяется некоторой математической моделью (уравнением регрессии), содержащей несколько неизвестных параметров. Вначале на основании выборочных данных находят оценки этих параметров. Далее определяются статистические ошибки оценок или границы доверительных интервалов И проверяется соответствие (адекватность) примятой математической модели экспериментальным данным.
Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры связи используется коэффициент корреляции. Коэффициент корреляции оценивается по выборке объема n связанных пар наблюдений из совместной генеральной совокупности X и Y. Далее проверяются гипотезы или устанавливаются границы доверительного интервала для генерального коэффициента корреляции. Существует несколько типов коэффициентов корреляции, применение которых зависит от предположений о совместном распределении величин X и Y.
Теперь перейдем к более подробному рассмотрению методов регрессионного и корреляционного анализа.
Регрессионные модели
Самый важный этап регрессионного анализа — это выбор подходящей регрессионной модели, т. е. математического выражения, связывающего значения зависимой случайной величины Y и значения независимой величины х. Так же как и в рассмотренных выше статистических методах, мы относим эту абстрактную математическую модель к некоторой генеральной совокупности, в которой между значениями Y и х действительно существует зависимость, определенная выбранной моделью, и считаем, что экспериментальные данные получены именно из такой генеральной совокупности.
В простейшем случае предполагается линейная зависимость, выраженная уравнением:
Запись означает, что математическое ожидание т случайной величины Y определяется при фиксированном значении величины х.
Это уравнение задает прямую линию в прямоугольной системе координат показанную на рис. 7.1. Регрессионная прямая пересекает ось у в точке у = а, а параметр
представляет собой тангенс угла наклона (у) прямой относительно горизонтальной оси х.
Регрессия, выраженная таким уравнением, называется простой линейной регрессией, потому что она учитывает зависимость только от одной контролируемой переменной х.
Иногда не удается объяснить поведение зависимой случайной величины Y влиянием только одной независи-
мой переменной х. Тогда часто используется модель множественной линейной регрессии:
Здесь среднее значение случайной величины У определяется уже значениями k независимых переменных:
Величины могут быть любыми функциями от других величин, в том числе и друг от друга. Термин «линейная регрессия» означает линейность по отношению к параметрам
а не к переменным
Частным случаем множественной линейной регрессии является полиномиальная регрессия, выражаемая полиномом степени k:
Рассмотренные уравнения регрессии определяют функциональную зависимость среднего значения зависимой случайной величины У от независимой переменной х (или переменных
). Чтобы указать, как зависят отдельные значения
случайной величины Y от значений
величины х, нужно ввести в регрессионную модель случайные факторы, которые наряду с зависимостью от величины х влияют на значения
Для простой линейной регрессии это записывается следующим образом:
В этом выражении — случайные величины, определяющие для каждого значения
случайный характер значений
Во всех регрессионных моделях на случайные величины накладываются определенные ограничения, которые будут подробно рассмотрены ниже на примере простой линейной регрессии.
Итак, регрессионная модель описывает зависимость случайной величины Y от независимой величины х в генеральной совокупности Y. Но поскольку вся генеральная совокупность У недоступна для наблюдений, то истинное уравнение регрессии неизвестно, и любая регрессионная модель будет лишь приближением к действительности.
Как выбрать наилучщую регрессионную модель? Математическая статистика по этому поводу говорит, что выбор модели — искусство и правильность выбора целиком зависит от опыта и интуиции исследователя. Обычно при выборе модели исходят из предметного анализа явления (какую форму связи можно ожидать?), и если имеющейся информации недостаточно, то, как правило, помогает графическое представление экспериментальных данных в виде диаграммы рассеяния (этот график называют также корреляционным полем, потому что при корреляционном анализе применяется точно такое же графическое представление данных). Для каждого значения х; независимой переменной измеренные значения наносятся на график в координатах (х, у), как показано на рис. 7.2 для некоторых гипотетических данных.
Если удается «на глазок» провести прямую линию так, что все значения будут достаточно близки к ней, то можно ожидать, что модель простой линейной регрессии окажется в данном случае адекватной (согласующейся с экспериментальными данными).
Примеры регрессионных задач в спорте
Рассмотрим несколько простых примеров, цель которых — показать, почему регрессионный анализ находит широкое применение а статистических исследованиях в области спорта.
Пример 7.1
В табл. 7.1 приведены данные о мировых рекордах в прыжках с шестом за период с 1957 по 1981 г.*.
Нанесем эти данные на график (рис. 7.3), где по оси х отложим годы, а по оси у — рекордные результаты.
График демонстрирует тенденцию к возрастанию рекордных результатов по годам. Более тонкий анализ позволяет сделать предположения, что начиная с 1965 г. наблюдалось приблизительное линейное возрастание результатов, а в более ранний период зависимость имеет, по-видимому, и более сложный характер. Для первой грубой оценки общей картины можно попытаться представить зависимость в виде прямой линии (ее примерный ход намечен на графике), и тогда имеется заманчивая возможность прогнозировать рекордные результаты на какой-то период времени вперед. (Интересно нанести на этот график более свежие данные и посмотреть, как они вписываются в наш «прямолинейный» прогноз).
Рис. 7.3. График зависимости мировых рекордов в прыжках с шестом от времени установления
Спортивное прогнозирование — одна из важных областей применения регрессионного анализа в спортивных исследованиях*.
Пример 7.2
Другая важная область применения регрессионного анализа в спортивных исследованиях также связана с прогнозированием, но в несколько другом понимании этого термина. Очень часто предметом исследования является такой признак, который непосредственно измерить затруднительно или невозможно. Это особенно характерно для исследований в области спортивной физиологии, медицины, психологии. В то же время известно, что изучаемый признак связан с другими признаками, которые измеряются сравнительно просто. Тогда пытаются подобрать модель предполагаемой зависимости и по этой модели прогнозировать значения неизмеряемого зависимого признака, основываясь на значениях других, легко измеряемых признаков. Прогнозируемые таким образом значения неизмеряемых признаков называются в статистике предикторами. Здесь также используются регрессионные модели, потому что оцениваемая величина является случайной: помимо контролируемых факторов, влияние которых учитывается значениями измеряемых признаков, она зависит и от множества других случайных факторов, которые контролировать не удается.
Например, часто интересуются энергозатратами организма человека при выполнении той или иной фиксированной физической нагрузки. Известно (опять же на основании регрессионного анализа!), что энергозатраты закономерно связаны с потреблением кислорода и ЧСС. Но измерить эти показатели во время выполнения реальных тренировочных заданий тоже достаточно сложно, поэтому пытаются прогнозировать их на основании более простых измерений (например, измерений средней скорости при беге или ходьбе).
Предположим, что цель исследований состоит в оценке энергозатрат организма спортсмена при выполнении стандартной нагрузки: бег на тредбане в течение определенного времени с заданной скоростью.
Энергозатраты оцениваются по ЧСС, и далее определяется пульсовая стоимость 1 м пути (ПС — ЧСС/). В эксперименте участвует однородная по составу группа спортсменов. Средние значения ПС, вычисленные по результатам измерений для всех спортсменов группы, при различных скоростях бега в диапазоне 2,0—5,0 м/с приведены на рис. 7.4. Данные носят иллюстративный характер, но приближенно отражают истинное положение дел*.
Анализ графика (см. рис. 7.4) показывает, что в эксперименте также наблюдается некоторая закономерная связь скорости и ПС, но в этом случае зависимость является уже более сложной и не может быть описана уравнением прямой линии. Можно попытаться использовать полиномиальную модель регрессии (более подробно эти вопросы рассмотрены в специальной литературе). Если в результате регрессионного анализа окажется, что выбранная модель хорошо согласуется с экспериментальными данными, то можно использовать ее для прогнозирования энергозатрат по скорости бега, не прибегая каждый раз к достаточно сложным измерениям ЧСС.
Пример 7.3
Довольно часто интерес вызывает связь между двигательными достижениями в различных видах спортивных упражнений. Это особенно важно при подборе тестов, по результатам которых судят о возможных достижениях в том или ином виде спорта. Как правило, при этом пытаются установить просто наличие достоверной взаимосвязи между результатами теста и результатами в том упражнении, которое по общему признанию объективно отражает возможности человека в конкретном виде спорта. Это делается с помощью корреляционного анализа, но, как мы скоро увидим, чтобы корректно использовать коэффициент корреляции, также необходимо знать предполагаемую форму связи между результатами в двух видах спортивных упражнений.
Рассмотрим следующий пример. В табл. 7.2 приведены результаты, показанные группой школьников (n = 10) в беге на дистанциях 30 и 100 м.
На рис. 7.5 эти данные представлены в графической форме. Результаты в беге на 100 м при фиксированных значениях результатов в беге на 30 м
образовали на графике некоторое «облако» точек. Анализ графика показывает, что в качестве первого приближения здесь можно предположить, что в среднем результат в беге на 100 м для данной категории испытуемых линейно зависит от результатов, показанных на дистанции 30 м (т. е. принимаем модель простой линейной регрессии).
Отметим существенное отличие этого примера от двух предыдущих. В первых двух примерах независимая величина (время и скорость) не является случайной, а ее значения произвольно устанавливаются исследователем в определенном диапазоне. В последнем примере обе величины (и зависимая, и независимая) являются случайными, а их значения получаются по случайной выборке из генеральной совокупности. Исследователь по своему усмотрению вправе считать одну из этих величин зависимой, а другую — независимой.
Это две различные ситуации, рассматриваемые в регрессионном анализе. Методы его одинаковы в обоих случаях, а различие состоит в том, что в ситуациях, описываемых в первых двух примерах, нельзя оценить значимость корреляции между двумя величинами методами корреляционного анализа, рассмотренными ниже (хотя формально вычислить коэффициент корреляции можно и здесь).
Простая линейная регрессия
Из-за ограниченности объема книги мы не сможем рассмотреть многие вопросы регрессионного анализа, и для углубленного знакомства с ним следует обратиться к специальной литературе. В этом разделе излагается простейший, но очень важный для практики спорта случай — простая линейная регрессия.
Предположения регрессионного анализа
Выше было показано, что модель простой линейной регрессии, отражающая зависимость значений зависимой величины У от значений
независимой переменной х в генеральной совокупности, описывается уравнением:
В этом уравнении — неизвестные параметры уравнения регрессии,
— случайные ошибки, представляющие собой случайные отклонения значений
от линии регрессии:
Применение модели линейной регрессии основано на следующих предположениях:
1. В генеральной совокупности, из которой получены экспериментальные данные, действительно существует линейная регрессия, т. е. среднее значение зависимой случайной величины Y для любого значения независимой величины х является линейной функцией от х:
2. Нет никаких факторов, существенно влияющих на
связь между величинами У и х. Это два самых важных предположения, определяющих практическую полезность линейного регрессионного анализа.
3. В генеральной совокупности все остатки
взаимно независимы. Другими словами, требуется, чтобы все наблюдаемые (измеренные) значения
случайной величины Y были статистически независимыми при всех значениях
независимой переменной х.
Если это предположение не выполняется, то невозможно оценить точность приближенного описания экспериментально наблюдаемых зависимостей с помощью регрессии. Это предположение обычно справедливо в тех случаях, когда выборочные данные, по которым строится линия регрессии, представляют собой результаты измерения для разных индивидов. Поэтому эти результаты можно считать независимыми друг от друга.
4. В генеральной совокупности, из которой получены выборочные данные, при любом значении независимой переменной х случайные величины имеют нормальное распределение со средним значением
и одинаковыми дисперсиями
Это предположение является необходимым при проверке значимости линейной регрессии и определении границ доверительных интервалов для параметров а и
Оценка параметров уравнения регрессии
Истинное уравнение регрессии обычно неизвестно, потому что не имеется возможности наблюдать всю генеральную совокупность. Единственное, что можно сделать, чтобы построить линию регрессии, — это провести выборочное исследование и по экспериментальным данным оценить генеральные параметры а и
Пусть получена выборка объема n наблюдений
зависимой случайной величины Y, соответствующих значениям
независимой переменной х.
Оценки параметров а и которые получаются по выборочным данным, обозначаются соответственно а и b. Для определения оценок a и b чаще всего применяется метод наименьших квадратов. Суть этого метода в том, что отыскиваются такие значения а и b, которые обеспечивают минимум суммы квадратов отклонений измеренных значений
от прямой линии, задаваемой параметрами а и b, т. е.
Таким образом, по методу наименьших квадратов получаем эмпирическое уравнение некоторой прямой:
Здесь — принятое обозначение для оценки величины Y при заданном значении х.
Оценка по методу наименьших квадратов является наилучшей в том смысле, что она дает уравнение такой прямой, для которой ошибка (сумма квадратов отклонений измеренных значений у; от этой прямой) будет наименьшей по сравнению с любой другой прямой линией (в том числе и с неизвестной истинной линией регрессии). В то же время, если каждому значениюсоответствует несколько измеренных значений
то прямая, полученная по методу наименьших квадратов, обеспечивает минимум отклонений средних арифметических
при любом значении независимой переменной х, т. е. прямая наименьших квадратов является одновременно и оценкой истинной линии регрессии:
Значения а и b по методу наименьших квадратов находятся из решения системы так называемых нормальных уравнений:
Решения этой системы уравнений можно записать в следующем, удобном для расчетов виде:
где — выборочные средние арифметические
Обычно b называют коэффициентом регрессии, a — свободным членом уравнения регрессии.
Пример 7.4
Найдем значения коэффициента регрессии (b) и свободного члена уравнения регрессии (а) для данных примера 7.3, т. е. построим прямую линию, устанавливающую приближенную зависимость результатов в беге на 100 м от результатов в беге на 30 м.
1. По данным табл. 7.2 находим значения промежуточных сумм, входящих в формулу (7.4):
2. Определим значения средних арифметических:
3. По формуле (7.4) вычисляем коэффициент регрессии: 4. По формуле (7.5) находим свободный член уравнения регрессии:
Таким образом, уравнение регрессии имеет вид:
Прямая, построенная по этому уравнению, показана на рис. 7.6 вместе с исходными данными. Эта прямая является наилучшей линейной оценкой уравнения регрессии, полученной по имеющимся данным. Но это не означает, что нельзя построить оценку регрессии в виде какой-то другой зависимости (нелинейной), которая будет лучше соответствовать экспериментальным данным, чем прямая линия.
Полученное эмпирическое уравнение регрессии можно использовать для прогнозирования результатов на дистанции 100 м по результатам дистанции 30 м. Например, если в группе школьников, которая участвовала в эксперименте, будет показан результат 5,2 с на дистанции 30 м, то можно ожидать, что результат на дистанции 100 м будет:
И это будет наилучшим прогнозом, который можно сделать, используя модель линейной регрессии.
Стандартная ошибка предсказания
Мерой качества приближенного описания реальной зависимости между величинами Y и х с помощью уравнения линейной регрессии является стандартное отклонение значений от регрессионной прямой, вычисляемое по формуле:
является мерой точности предсказания значений случайной величины Y по заданным значениям величины х, поэтому
называют также стандартной ошибкой предсказания.
Пример 7.4 (продолжение)
Определим стандартную ошибку предсказания для данных примера с результатами в беге на 100 и 30 м. Для этого найдем значение промежуточной суммы входящей в формулу (7.6):
Подставив эти значения в формулу (7.6) и используя найденные ранее значения остальных составляющих формулы (7.6), получим:
Две прямые линии, отстоящие от прямой регрессии на ограничивают зону околорегрессионной прямой, в которую с вероятностью 0,683 попадают экспериментальные значения
т. е. примерно 68,3 % всех значений
оказываются в этой зоне.
Зона, определяемая стандартной ошибкой предсказания, показана на рис. 7.6 штриховыми линиями.
Проверка адекватности линейной модели
Проверка адекватности линейной модели может быть произведена с помощью стандартного F-критерия. Гипотеза в этом случае представляет собой утверждение о том, что регрессия в генеральной совокупности линейна, а альтернатива — обратное ей утверждение.
F-критерий может быть применен в том случае, если каждому значению
соответствует несколько измеренных значений
. Порядок применения критерия описан в литературе [1, 4, 8]. Здесь не будем подробно на нем останавливаться, а рассмотрим простой и наглядный графический способ проверки адекватности.
Проверка адекватности линейной модели производится по графику остатков: где
— измеренные значения величины
, соответствующие значениям
оценка
по уравнению регрессии.
Если остатки сконцентрированы в горизонтальной полосе вдоль оси абсцисс, то линейную модель можно считать адекватной. Если зона, где расположены остатки, расширяется, это означает, что нарушено предположение 4 регрессионного анализа (см. раздел 7.4.1): дисперсии неодинаковы при различных значениях
. Это требует изменения регрессионной модели. Если остатки имеют тенденцию закономерно изменяться, то нарушено предположение 2, т. е. не учтены какие-то факторы, существенно влияющие на связь между величинами Y и х. В этом случае также нужно изменить модель и ввести в нее неучтенные факторы. Предположение 4 о нормальности распределения может быть проверено с помощью стандартных критериев согласия (см. раздел 6.4), примененных к эмпирическому распределению остатков
Следует отметить, что регрессионный анализ в полном объеме достаточно сложен даже для простой линейной модели. Здесь не обойтись без помощи ЭВМ. Для универсальных ЭВМ существуют стандартные программы регрессионного анализа*.
Здесь нет возможности уделить этому внимание, поэтому рассматриваются лишь простейшие методы, при которых для расчетов вполне достаточно обычных микрокалькуляторов.
В заключение построим график остатков для примера 7.4. Этот график приведен на рис. 7.7.
Как следует из рис. 7.7, остатки распределились в основном в горизонтальной полосе вблизи нуля, поэтому приближенно можно считать, что в рассмотренном примере линейная модель регрессии является адекватной.
Проверка значимости коэффициента регрессии
Если в результате проведенной проверки нет оснований сомневаться в адекватности линейной модели, то необходимо проверить гипотезу о том, что в действительности в генеральной совокупности отсутствует линейная регрессия, а то, что полученный коэффициент регрессии b отличен от нуля,, объясняется только случайностью выборки.
Если данных много, то необходимость в такой проверке, как правило, отпадает, потому что зависимость явно прослеживается при графическом представлении данных (см., например, рис. 7.3). Но если выборка невелика, то такaя проверка полезна.
Гипотеза проверяется с помощью стандартного t-критерия Стьюдента, рассмотренного в гл. 6. Значение t-критерия определяется по формуле:
где — абсолютная величина коэффициента регрессии,
— стандартная ошибка предсказания, определяемая формулой (7.6).
t-критерий применяется обычным образом, как показано в гл. 6. Вычисленное по формуле (7.7) значение критерия сравнивается с критическим значением при уровне значимости а и числе степеней свободы v= n — 2. Критические значения /« приведены в табл. 4 Приложения.
Заметим, что здесь a-уровень значимости, его не следует путать со свободным членом уравнения регрессии для которого также принято обозначение а.
Если значение критерия то нулевая гипотеза отклоняется, и можно сделать вывод, что линейная регрессия значима на уровне значимости а. В противном случае гипотеза
принимается.
Пример 7.4 (продолжение)
Оценим значимость коэффициента регрессии b = 3,0, рассчитанного для данных нашего примера. Зададимся уровнем значимости а=0,05.
Подставим найденные ранее значения в формулу
(7.7) и определим значение t-критерия:
Из табл. 4 Приложения находим при а = 0,05 и v = 10-2 = 8:
Поскольку то на уровне значимости 0,05 отклоняем нипотезу
т. е. коэффициент регрессии b = 3,0 является статистически значимым.
Полиномиальная регрессия
Часто зависимость между двумя величинами, которую можно предположить, анализируя графическое представление экспериментальных данных или опираясь на предметный анализ явлений, оказывается достаточно сложной, и модель линейной регрессии плохо подходит. Тогда прибегают к более сложным моделям, начиная обычно с самой простой из них — полиномиальной регрессии. Эти модели описываются выражением, содержащим, кроме линейного члена (1-й степени х) более высокие степени переменной х. Редко используется полином выше 3-й степени, поэтому модель полиномиальной регрессии можно представить в следующем виде:
Все предположения, которые принимаются при регрессионном анализе с использованием такой модели, полностью соответствуют предположениям, которые были сделаны в случае простой линейной регрессии.
Оценка параметров полиномиальной модели
по выборочным данным
также производится по методу наименьших квадратов. Система нормальных уравнений в этом случае имеет вид:
Решая совместно эти уравнения, находим коэффициенты .
Можно получить эти решения в готовом виде, и они приведены в, но выражения получаются громоздкими и плохо пригодны для вычислений на калькуляторе, где приходится Применять такие сложные операции, что затраты времени становятся неоправданными. Поэтому, если возникнет необходимость использовать полиномиальную регрессию, лучше обратиться за помощью к специалисту и выполнить расчеты на ЭВМ. Можно надеяться, что в ближайшем будущем положение в корне изменится с появлением общедоступных и простых персональных ЭМ, и что не менее важно, специальных программ статистического анализа для них, по которым неискушенный в программировании человек сможет выполнить необходимые расчеты в режиме понятного диалога с ЭВМ. Тогда вычислительные трудности перестанут быть для многих определяющими при выборе статистических методов анализа.
Коэффициент корреляции
Как уже отмечалось в начале этой лекции, при исследовании корреляции двух признаков обе величины X и Y, описывающие поведение этих признаков, рассматриваются как случайные величины, которые представлены совместным вероятностным распределением. Для двух случайных величин совместное распределение называется двумерным.
Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения () двух признаков. Если экспериментальных данных немного, то двумерное эмпирическое распределение представляется в виде двух рядов связанных между собой значений
. При большом количестве данных их запись в виде двойного ряда значений
, становится трудно обозримой, и тогда, как и в случае одномерного распределения, данные группируют, а двумерное эмпирическое распределение представляют в виде корреляционной таблицы, в которой для каждой области группировки, задаваемой интервалами группировки по признакам X и Y, записывается частота совместного попадания значений х, и у, в данную область группировки. Анализ корреляции с использованием корреляционных таблиц подробно изложен в литературе [4, 7, 8, 9, 10,
и здесь рассматриваться не будет.
Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения
Когда исследуется корреляция между количественными признаками, значение которых можно точно измерить в единицах метрических шкал (метры, секунды, килограммы и т. п.), то очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Плотность вероятностей двумерного нормального распределения имеет вид
где
Это распределение зависит от пяти параметров, четыре из которых нам уже знакомы:— средние значения (математические ожидания);
— стандартные отклонения случайных величин X и У. Пятый параметр р носит название «коэффициент корреляции» и является мерой связи между случайными величинами X и У.
Модель двумерного нормального распределения позволяет дать наглядную графическую интерпретацию коэффициента корреляции.
Если р — 0, то значения полученные из двумерной нормальной совокупности, располагаются на графике в координатах х, у в пределах области, ограниченной окружностью (рис. 7.8, а). В этом случае между случайными величинами X и У отсутствует корреляция и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин X и Y.
Если р= I или р= — 1, то между случайными величинами X и У существует линейная функциональная зависимость (У = с + dX). В этом случае говорят о полной корреляции. При р = 1 значения ( определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением
значения
также увеличиваются), при р = — 1 прямая имеет отрицательный наклон (рис. 7.8, б).
В промежуточных случаях точки, соответствующие значениям
попадают в область, ограниченную некоторым эллипсом (рис. 7.8, в, а), причем при р>0 имеет место положительная корреляция (с увеличением
значения
имеют тенденцию к возрастанию), при р<0 корреляция отрицательная. Чем ближе р к ±1, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии.
Таким образом, коэффициент корреляции является мерой линейной связи между случайными величинами.
В двумерном нормальном распределении существуют две линии регрессии: регрессия У на X и регрессия X на У (в зависимости от того, какую из величин X или У считать независимой, а какую — зависимой). Причем для нормального распределения регрессия всегда линейна, т. е. среднее значение одной случайной величины линейно зависит от значений другой случайной величины. Поэтому для двумерного нормального распределения коэффициент корреляции является мерой взаимосвязи двух случайных величин.
Это справедливо только для двумерного нормального распределения. При произвольном распределении корреляция является мерой только линейной связи. Пусть, например, две случайные величины связаны функциональной квадратичной зависимостью и случайная величина X равномерно распределена на интервале значений (—х, х), т. е. вероятности ее попадания в любой сколь угодно малый интервал внутри общего интервала (—х, х) одинаковы. В этом случае оказывается, что коэффициент корреляции равен 0, хотя имеет место функциональная зависимость. Это нужно иметь в виду при использовании коэффициента корреляции в качестве меры связи двух случайных величин. Поэтому, когда определяется коэффициент корреляции, обычно предполагается, что экспериментальные данные получены из генеральной совокупности, имеющей двумерное нормальное распределение.
Если нет оснований предполагать двумерное нормальное распределение, в качестве меры связи часто используется коэффициент ранговой корреляции Спирмена, для которого вид распределения случайных величин X и Y не имеет значения. Коэффициент ранговой корреляции является мерой любой монотонной (неубывающей или невозрастаюшей) зависимости между случайными величинами. Его применение рассмотрено в разделе 7.7
Если исследуется корреляционная зависимость между качественными признаками, которые не поддаются непосредственному измерению, то такая зависимость называется сопряженностью. В качестве меры зависимости используются коэффициенты сопряженности, рассмотренные в разделе 7.8.
Оценка коэффициента корреляции
Коэффициент корреляции р для генеральной совокупности, как правило, неизвестен, поэтому он оценивается по экспериментальным данным, представляющим собой выборку объема n пар значений полученную при совместном измерении двух признаков X и Y. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции). Его принято обозначать символом r.
В качестве оценки генерального коэффициента корреляции р используется коэффициент корреляции r Бра-ве — Пирсона. Для его определения принимается предположение о двумерном нормальном распределении генеральной совокупности, из которой получены экспериментальные данные. Это предположение может быть проверено с помощью соответствующих критериев значимости. Следует отметить, что если по отдельности одномерные эмпирические распределения значений согласуются с нормальным распределением,, то из этого еще не следует, что двумерное распределение будет нормальным. Для такого заключения необходимо еще проверить предположение о линейности связи между случайными величинами X и Y. Строго говоря, для вычисления коэффициента корреляции достаточно только принять предположение о линейности связи между случайными величинами, и вычисленный коэффициент корреляции будет мерой этой линейной связи. Но тогда нельзя оценить достоверность найденного коэффициента корреляции с помощью стандартных критериев значимости, которые рассмотрены ниже. Для этого требуется принять предположение о двумерном нормальном распределении.
Коэффициент корреляции r Браве — Пирсона вычис ляется по формуле:
где — выборочные средние арифметические, n — объем выборки.
Для практических расчетов более удобна следующая формула:
В этой формуле все суммы также вычисляются для i от 1 до n. Удобство формулы (7.9) в том, что она оперирует непосредственно с исходными данными поэтому вычисления производятся более точно, чем по формуле (7.8), в которой присутствуют
, которые всегда содержат ошибки округления.
Важным свойством коэффициента корреляции является то, что он не изменяет своего значения при любом линейном преобразовании исходных данных . Например, если заменить
с помощью преобразований:
то значение , выведенное по преобразованным данным, совпадает с
выведенным по исходным данным.
Это свойство позволяет существенно упростить вычисление коэффициента корреляции в тех случаях, когда значения представлены многоразрядными числами.
Между коэффициентом корреляции r и коэффициентами регрессии (коэффициенты регрессии У на X и X на У) существует простая взаимосвязь:
Зная коэффициент корреляции, можно легко определить коэффициент регрессии:
где — выборочные стандартные отклонения.
Квадрат коэффициента корреляции называется коэффициентом детерминации (d):
Коэффициент детерминации является мерой определенности линейной регрессии. Чем больше коэффициент детерминации, тем меньше наблюдаемые значения при каждом значении
отклоняются от линии регрессии У на X, тем точнее определена линия регрессии. Так, например, если r = 0,9, то d = 0,81 и 81 % общего рассеяния значений
(характеризуемого дисперсией
можно объяснить линейной связью с изменяющимися значениями
Пример 7.5
Определим, существует ли связь между результатами в беге на 30 и на 100 м для данных примера 7.4, полученных для группы школьников.
Исходные данные (результаты в беге на 30 м) и
(результаты бега на 100 м) приведены в столбцах 2 и 3 табл. 7.3. Корреляционный анализ производится в следующем порядке:
1. Наносим исходные данные на график корреляционного поля, отображая каждую пару значений (
) в виде точки с координатами
в прямоугольной системе координат. Этот график построен на рис. 7.5.
Анализ графика позволяет сделать предположение о линейной связи между результатами в беге на 30 и 100 м для данной категории испытуемых. Силу этой связи можно оценить по коэффициенту корреляции r Браве — Пирсона.
2. Вычисляем значения промежуточных сумм, входящих в формулу (7.9), для коэффициента корреляции:
Промежуточные расчеты приведены в столбцах 2—6 табл. 7.3.
3. По формуле (7.9) вычисляем коэффициент корреляции:
Такое значение коэффициента корреляции свидетельствует о наличии сильной положительной корреляции между результатами в беге на 30 и 100 м.
4, Находим коэффициент детерминации
93,5% рассеяния результатов в беге на 100 м может быть объяснено изменением результатов в беге на 30 м. Иными словами, на оба исследуемых признака (результаты в беге на 30 и 100 м) действуют общие факторы, вызывающие варьирование этих признаков, и доля общих факторов составляет 93,5 %. Остальные 6,5 % приходятся на долю факторов, действующих на исследуемые признаки избирательно.
Пример 7.6
Исследовалась группа спортсменок I разряда, специализирующихся в беге на 400 м. Цель исследования состояла в том, чтобы выявить влияние времени на первой половине дистанции на время пробегания последних 200 м. На соревнованиях для 20 спортсменок измерены результаты на обеих половинах дистанции 400 м. Эти данные приведены в столбцах 2 и 3 табл. 7.4: — результаты на первой,
— на второй половине дистанции.
Проведем корреляционный анализ экспериментальных данных.
1. Построим график корреляционного поля (рис. 7.9). Анализ графика показывает, что в данном случае можно предположить существование линейной корреляции между исследуемыми признаками, причем здесь корреляция отрицательная для данной категории испытуемых, т. е. при более быстром пробегании первой половины дистанции время на последних 200 м имеет тенденцию к возрастанию.
Вычислим коэффициент корреляции Браве — Пирсона для полученных экспериментальных данных.
Как показал предыдущий пример 7.5, расчет коэффициента корреляции достаточно громоздкий. Можно ожидать, что в данном примере расчеты будут еще сложнее, потому что данных вдвое больше. Чтобы упростить вычисления, воспользуемся линейным преобразованием исходных данных (7.10). Это не изменит значения коэффициента корреляции, но позволит существенно упростить расчеты при правильном выборе линейного преобразования. Применим следующие преобразования:
Значения = 25,8 и
— 30,5 выбраны примерно в центре рядов
а множитель с — 10 выбран с целью преобразовать данные в целочисленные значения.
Преобразованные данные приведены в столбцах-4 и
5 табл. 7.4. Далее порядок вычислений ничем не отличается от рассмотренного в примере 7.5.
2. Находим значения промежуточных сумм:
По формуле (7.9) определяем:
Полученный результат говорит о наличии сильной отрицательной корреляции.
4. Коэффициент детерминации равен
В данном случае 64 % рассеяния результатов на последних 200 м объясняется изменением результатов на первой половине дистанции.
Критерий значимости и доверительные интервалы для коэффициента корреляции
Основываясь только на значении выборочного коэффициента корреляции, особенно если это значение не очень близко к ±1, нельзя сделать вывод о достоверности корреляции между признаками. Этот вывод может быть сделан с помощью соответствующих критериев значимости корреляции. Такие критерии служат для проверки гипотезы о том, что в генеральной совокупности отсутствует корреляция, а отличие от нуля выборочного коэффициента корреляции объясняется только случайностью выборки. Альтернатива
может быть двусторонней
если не известен знак корреляции, или односторонней
когда знак корреляции может быть заранее определен.
Применение стандартных критериев значимости корреляции основано на предположении о двумерном нормальном распределении генеральной совокупности, из которой получены экспериментальные данные.
Если принять предположение о наличии линейной связи между исследуемыми признаками, то гипотезу о двумерном нормальном распределении можно проверить с помощью стандартных критериев согласия (см. раздел 6.4), примененных к одномерным эмпирическим распределениям признаков X и Y.
Если предположение о двумерном нормальном распределении принимается, то могут быть использованы следующие критерии значимости корреляции:
t-критерий. При использовании t-критерия Стыодента-вычисляется значение критерия по формуле:
где r — выборочный коэффициент корреляции; n — объем выборки.
Вычисленное по формуле (7.13) значение t-критерия сравнивается с критическим значением при заданном уровне значимости и числе степеней свободы
= n — 2.
Чтобы упростить применение t-критерия, составлена таблица критических значений коэффициента корреляции (см. табл. 10 Приложения). При наличии этой таблицы отпадает необходимость в вычислениях по формуле (7.13). Достаточно просто сравнить выборочный
коэффициент корреляции r с критическим значением при уровне значимости а и объеме выборки n. Если окажется, что
то гипотеза
принимается и делается вывод об отсутствии значимой корреляции. Если
гипотеза
отклоняется. Для двустороннего критерия это означает, что коэффициент корреляции статистически значимо отличается от 0 на уровне значимости а, для одностороннего критерия делается вывод о наличии значимой положительной или отрицательной корреляции. Заметим, что табл. 10 Приложения содержит критические значения для двустороннего критерия,
—критерий, основанный на Z-преобразовании. Другой критерий значимости корреляции основан на Z-преобра-зовании Фишера:
Перевод значений коэффициента корреляции r в значении Z может быть выполнен по табл. 11 Приложения. Эта таблица содержит только положительные значения r, но можно воспользоваться тем фактом, что Z-преобра-зование симметрично, и Z для отрицательного r равно значению Z для соответствующего положительного r, взятого со знаком минус.
Величина Z имеет приближенно нормальное распределение со средним значением
и стандартным отклонением
Z-преобразование можно применять при Критерий значимости применяется следующим образом:
1. Вычисляем значение 2. Сравниваем значение
с критическим значением
нормированного нормального распределения при заданном уровне значимости а. Критические значения
для стандартных уровнен значимости приведены в табл. 6.2.
3. Если то гипотеза
принимается, и делаем вывод об отсутствии значимой корреляции. При
отклоняется. Для двустороннего критерия делаем вывод о том, что коэффициент корреляции значимо (7.14)
отличается от 0. Для одностороннего критерия отклонение означает, что существует статистически значимая положительная или отрицательная корреляция.
Доверительный интервал для коэффициента корреляции
Z-преобразование удобно тем, что с его помощью можно определить границы доверительного интервала для генерального коэффициента корреляции p. Доверительный интервал строится следующим образом:
1. Вычисляем значение Z по формуле (7.14) или с помощью табл. 11 Приложения и стандартное отклонение по формуле
2. Задаемся доверительной вероятностью 1 — а и определяем граничные значения нормированного нормального распределения, соответствующие этой доверительной вероятности. Граничные значения равны критическим значениям
двустороннего
-критерия, поэтому для их определения можно пользоваться табл. 6.2.
3. Находим границы доверительного интервала для среднего значения величины Z:
4. С помощью обратного преобразования Фишера переходим к доверительному интервалу для коэффициента корреляции р. Для этого по табл. 12 Приложения’ находим значения r, соответствующие значениям Z Это и будут границы доверительного интервала для р.
Пример 7.6 (продолжение)
Оценим значимость корреляции на уровне значимости a = 0,05 и границы 95 %-ного доверительного интервалу для коэффициента корреляции для данных примера 7.6, представляющих собой результаты на первой и второй половине дистанции 400 м для спортсменок I разряда.
Действуем в таком порядке:
1. Вначале проверим гипотезу о том, что экспериментальные данные получены из двумерной нормальной совокупности.
Значения критерия W Шапиро — Уилки (см. раздел 6.4.4) для рядов соответственно равны:
Промежуточные расчеты здесь не приводятся, и предоставляется возможность выполнить их самостоятельно.
Критическое значение для уровня значимости a = 0,05 и объема выборки n= 20 находим по табл. 7 Приложения:
Поскольку превышают
то одномерные распределения значений
согласуются с нормальным распределением на уровне значимости 0,05. Кроме того, принято предположение о линейной связи величин X и Y, поэтому можно считать обоснованным предположение о двумерном нормальном распределении и применить стандартные критерии значимости корреляции.
2. Оценим значимость корреляции путем сравнения с критическим значением коэффициента корреляции. Ранее вычисленный выборочный коэффициент корреляции По табл. 10 Приложения находим при
и n — 20 критическое значение
= 0,468.
Поскольку , то делаем вывод о статистической значимости коэффициента корреляции на уровне значимости 0,05. Между результатами на первой и второй половине дистанции 400 м существует значимая корреляция. Вероятность ошибки такого вывода
так как r превышает критическое значение
Воспользуемся Z-преобразованием для проверки значимости корреляции. Отметим, что для рассматриваемого примера данный критерий можно не применять, так как выборочный коэффициент корреляции значительно превышает критическое значение, и использование еще одного критерия вряд ли изменит в такой ситуации вывод о значимости корреляции. Но Z-преобразование потребуется нам для определения доверительного интервала для коэффициента корреляции.
По табл. 11 Приложения при r =0,802 находим Z = 1,099.
Стандартное отклонение
Значение ц-критерия по формуле (7.15) составляет:
При уровне значимости а — 0,05 по табл. 6.2 находим критическое значение двустороннего
-критерия:
Поскольку вывод о наличии значимой корреляции подтверждается.
4. Определим границы доверительного интервала для генерального коэффициента корреляции р.
Границы 95 %-ного доверительного интервала для по формуле (7.16) равны:
По табл. 12 Приложения находим значения r, соответствующие границам доверительного интервала для р: 0,558 и 0,917.
Следовательно, 95 %-ный доверительный интервал для р будет: —0,917<р<—0,558.
Здесь мы учли, что выборочный коэффициент корреляции отрицательный.
Коэффициент ранговой корреляции Спирмена
Если потребуется установить связь между двумя признаками, значения которых в генеральной совокупности распределены не по нормальному закону, т. е. предположение о том, что двумерная выборка получена из двумерной нормальной генеральной совокупности, не принимается, то можно воспользоваться коэффициентом ранговой корреляции Спирмена
В этом выражении
— разность рангов
пары значений
Определение рангов было дано выше в разделе 6.5.1.
Формула (7.17) получается непосредственно из формулы (7.8) для коэффициента корреляции Браве — Пирсона, если в последнюю вместо; подставить их ранги.
Коэффициент ранговой корреляции также имеет пределы 1 и —1. Если ранги одинаковы для всех значений то все разности рангов
Если ранги
расположены в обратном порядке,
Таким образом, коэффициент ранговой корреляции является мерой совпадения рангов значений
и
Когда ранги всех значений строго совпадают или расположены строго в обратном порядке, между случайными величинами X и Y существует функциональная зависимость, причем эта зависимость не обязательно линейная, как в случае с коэффициентом линейной корреляции Браве — Пирсона, а может быть любой монотонной зависимостью (т. е. постоянно возрастающей
или постоянно убывающей зависимостью). Если зависимость монотонно возрастающая, то ранги значений — совпадают и
= 1; если зависимость монотонно убывающая, то ранги обратны и
= — 1. Следовательно, коэффициент ранговой корреляции является мерой любой монотонной зависимости между случайными величинами X и Y.
В тех случаях, когда в рядах встречаются одинаковые, совпадающие между собой значения, формула (7.17) дает несколько завышенный результат. Для более точных расчетов применяется следующая формула:
— число совпадающих значений
(или рангов значений
) в каждой из групп, где эти значения совпадают.
При небольшом числе совпадающих значений формула (7.17)обеспечивает практически приемлемую точность и можно не усложнять расчеты вычислением
Коэффициент ранговой корреляции Спирмена вычисляется значительно проще, чем коэффициент корреляции Браве — Пирсона при одних и тех же исходных данных, поскольку при вычислении используются ранги, представляющие собой обычно целые числа.
Коэффициент ранговой корреляции целесообразно использовать в следующих случаях:
1. Если экспериментальные данные представляют собой точно измеренные значения признаков X и Y и требуется быстро найти приближенную оценку коэффициента корреляции. Тогда даже в случае двумерного нормального распределения генеральной совокупности можно воспользоваться коэффициентом ранговой корреляции вместо точного коэффициента корреляции Браве — Пирсона. Вычисления будут существенно проще, а точность оценки генерального параметра р с помощью коэффициента при больших объемах выборки составляет 91,2% по отношению к точности оценки по коэффициенту корреляции r.
2. Когда значения и (или)
заданы в порядковой шкале (например, оценки судей в баллах, места на соревнованиях, количественные градации качественных признаков), т. е. когда признаки не могут быть точно измерены, но их наблюдаемые значения могут быть расставлены в определенном порядке.
Пример 7.7.
Воспользуемся данными примера 7.5 и определим коэффициент ранговой корреляции между результатами школьников в беге на 30 и 100 м. Исходные данные приведены в столбцах 2 и 3 табл. 7.5.
Расчет производится в следующем порядке:
1. Находим ранги значений
как показано в разделе 6.5.1.
Ранги приведены в столбцах 4 и 5 табл. 7.5. 2 3 4
2. Вычисляем разности рангов (столбец 6). Для проверки правильности вычисления рангов можно использовать тот факт, что сумма всех разностей di должна быть равна нулю. 3. Возводим разности
в квадрат и находим сумму:
4. В рядах
встречаются совпадающие значения, поэтому для вычисления коэффициента ранговой корреляции нужно пользоваться формулой (7.18).
Предварительно найдем значения В ряду
имеются 3 группы совпадающих значений: первая группа содержит два значения (4,6; 4,6), вторая и третья — по 3 значения. Поэтому
В ряду всего одна группа из двух совпадающих значений, следовательно,
5. По формуле (7.18) находим . Заметим, что если не учитывать наличия совпадающих значений, а воспользоваться формулой (7.17), то получим значение
Это подтверждает сделанное выше замечание о том, что при небольшом числе совпадающих значений можно не учитывать их наличия.
Как видим, коэффициент ранговой корреляции0,975 несущественно отличается от вычисленного ранее коэффициента корреляции Браве — Пирсона (r = 0,967), но получен путем значительно более простых расчетов.
Пример 7.8
Выясним, существует ли связь между результатами в
прыжках в длину с места и местами, занятыми на соревнованиях, для гимнастов 11—12 лет. Данные, полученные по наблюдениям за 10 гимнастами этой возрастной категории, приведены в столбцах 2 и 3 табл. 7.6.
Данный пример соответствует второму случаю применения коэффициента ранговой корреляции Спирмена. Здесь значения (места на соревнованиях) выражены в порядковой шкале. К таким данным коэффициент корреляции Браве — Пирсона не применим, а взаимосвязь может быть установлена только с помощью коэффициента ранговой корреляции.
Порядок расчета полностью соответствует рассмотренному выше в примере 7.7, за исключением того, что в данном примере отсутствуют совпадающие значения и
поэтому нет необходимости вычислять
Коэффициент ранговой корреляции по формуле (7.17) составляет
Значимость коэффициента ранговой корреляции
Гипотеза (генеральный коэффициент ранговой корреляции равен 0) может быть проверена путем сравнения выборочного коэффициента ранговой корреляции
с критическим значением
. Критические значения для стандартных уровней значимости приведены в табл. 13 Приложения. Содержащиеся в этой таблице критические значения соответствуют одностороннему критерию (альтернатива
т. е. при использовании этого критерия должна быть уверенность в знаке предполагаемой корреляции. Если такой уверенности нет, следует применять двусторонний критерий (альтернатива
. при этом уровни значимости, приведенные в табл. 13 Приложения, следует удвоить.
Если то коэффициент ранговой корреляции статистически незначим на уровне значимости а; если
делаем вывод о наличии значимой корреляции.
Табл. 13 Приложения содержит критические значения для объемов выборки . Если объем выборки больше или подобной таблицы нет под рукой, то при
можно
приближенно воспользоваться t-критерием, значение которого вычисляется следующим образом:
Это значение сравнивается с критическим значением t-распределения Стьюдента при числе степеней свободы v = n — 2. Критические значения
приведены в табл. 4 Приложения.
Пример 7.7 (продолжение)
Выборочный коэффициент ранговой корреляции, определенный для данных примера7.7, составляет — 0,975. Для уровня значимости а = 0,05 и объема выборки n = 10 из табл. 13 Приложения находим критическое значение:
Поскольку гипотеза
отклоняется на уровне значимости 0,05. Между результатами школьников в беге на 30 и на 100 м существует статистически значимая положительная корреляция. (Делаем вывод именно о положительной корреляции, потому что был использован односторонний критерий.) Ошибка утверждения о значимости положительной корреляции Р<0,001, поскольку
превышает и критическое значение
= 0,8667).
Пример 7.8 (продолжение)
Для данных примера 7.8 выборочный коэффициент ранговой корреляции = 0, 539. Его сравнение с
0,5512 свидетельствует об отсутствии статистически значимой положительной корреляции между результатами гимнастов 11 —12 лет в прыжках в длину с места и местами, занятыми на соревнованиях, несмотря на то, что выборочный коэффициент корреляции кажется сравнительно высоким. Имеющийся у нас объем экспериментальных данных (n=10) не позволяет отклонить гипотезу
об отсутствии корреляции даже при значении выборочного коэффициента ранговой корреляции
0,539.
Сопряженность качественных признаков
Если требуется выявить связь (сопряженность) между качественными признаками, которые не поддаются непосредственному измерению, для этого используются коэффициенты сопряженности.
Здесь рассматривается только простейший случай: связь между двумя альтернативными признаками. Мерой альтернативных признаков является наличие или отсутствие их у объектов исследования. Например, человек может заниматься или не заниматься спортом, заболеть или не заболеть простудным заболеванием, сдать или не сдать зачет по математической статистике, установить или не установить мировой рекорд в плавании, легкой атлетике и т. д.
При исследовании сопряженности двух альтернативных признаков исходные экспериментальные данные представляют в виде четырехклеточной таблицы сопряженности признаков (табл. 7.7). В этой таблице содержатся частоты а, b, с и d, соответствующие для выборки объема n наличию (+) или отсутствию (—) каждого из признаков «1» или «2» у испытуемых.
Взаимосвязь между двумя альтернативными признаками устанавливается с помощью тетрахорического коэффициента сопряженности (или коэффициента ассоциации) Пирсона
Рассмотрим его применение на примере.
Пример 7.9
Пусть, например, было проведено исследование влияния занятий спортом на утомляемость в течение рабочего дня у молодых выпускников технического вуза. Обследование проводилось с помощью анкетного опроса, и 200 ответов на вопросы анкеты «Занимаетесь ли вы спортом систематически?», «Чувствуете ли вы состояние психического или физического утомления к концу рабочего дня?» распределились, как показано в табл. 7.8.
Тетрахорический коэффициент сопряженности определяется по следующей формуле:
Этой формулой можно пользоваться, если все частоты а, b, с и d не меньше 5.
Для данных рассматриваемого примера Это значение дает основание предполагать, что при систематических занятиях спортом состояние утомления в течение рабочего дня наблюдается реже.
Для проверки нулевой гипотезы о независимости признаков (об отсутствии сопряженности) используется Пирсона (см. раздел 6.4). Значения критерия
определяются по формуле:
Вычисленное значение
сравнивается с критическим значением
ПРИ числе степеней свободы v=l. Если
то гипотеза об отсутствии сопряженности между признаками принимается. Если
делается вывод о наличии статистически значимой связи между признаками. В данном случае, как правило, используется двусторонний критерий, т. е. знак предполагаемой сопряженности заранее не устанавливается.
Для рассматриваемого примера значение -кРитерия составляет
Зададимся уровнем значимости а =0,05 и по табл. 5 Приложения находим критические значения -кРитеРия с одной степенью свободы:
Поскольку можно сделать вывод о наличии статистически значимой связи между занятиями спортом и утомляемостью к концу рабочего дня для данной категории испытуемых. Ошибка такого вывода Р<0,001, поскольку
превышает и критическое значение
-критерия на уровне значимости 0,001
Приложение
Удвоенные значения функции Лапласа
Удвоенные значения функции Лапласа:
(площадь под кривой нормального распределения между точками —u, u)
Ординаты нормальной кривой
Ординаты нормальной кривой
Критические значения одностороннего F-критерия Фишера
Критические значения одностороннего F-критерия Фишера (верхние числа в строке соответствуют уровню значимости 0,05; средние — 0,01; нижние — 0,001) Таблица 3
Критические значения двустороннего t-критерия Стьюдента
Критические значения двустороннего t-критерия Стьюдента
(v — число степеней свободы)
Вспомогательные коэффициенты для проверки нормальности
Вспомогательные коэффициенты для проверки нормальности распределения по критерию W Шапиро — Уилки (n — объем совокупности, k — номер сравниваемой пары)
Лекции по предметам:
- Математика
- Алгебра
- Линейная алгебра
- Векторная алгебра
- Геометрия
- Аналитическая геометрия
- Высшая математика
- Дискретная математика
- Математический анализ
- Теория вероятностей
- Математическая логика
Учебник онлайн:
- Точечные оценки, свойства оценок
- Доверительный интервал для вероятности события
- Проверка гипотезы о равенстве вероятностей
- Доверительный интервал для математического ожидания
- Доверительный интервал для дисперсии
- Проверка статистических гипотез
- Регрессионный анализ
- Корреляционный анализ
- Статистические решающие функции
- Случайные процессы
- Выборочный метод
- Статистическая проверка гипотез
- Статистические оценки
- Теория статистической проверки гипотез
- Линейный регрессионный анализ
- Вариационный ряд
- Законы распределения случайных величин
- Дисперсионный анализ
- Математическая обработка динамических рядов
- Корреляция — определение и вычисление
- Элементы теории ошибок
- Методы математической статистики
Проверка гипотезы о нормальном распределении генеральной совокупности
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Проверка дискретного распределения на нормальность
Пусть
эмпирическое распределение задано в виде последовательности равноотстоящих
вариант и соответствующих им частот:
|
|
|
… |
|
|
|
|
… |
|
Требуется, используя критерий Пирсона, проверить
гипотезу о том, что генеральная совокупность
распределена нормально.
Для того,
чтобы при заданном уровне значимости
проверить гипотезу о нормальном распределении
генеральной совокупности, надо:
1. Вычислить
выборочную среднюю
и выборочное среднее квадратическое отклонение
.
2.
Вычислить теоретические частоты
где
– объем выборки,
— шаг (разность между двумя соседними
вариантами)
3. Сравнить эмпирические и теоретические частоты
с помощью критерия Пирсона. Для этого:
а)
составляют расчетную таблицу (см. пример), по которой находят наблюдаемое
значение критерия
б) по
таблице критических точек распределения
, по заданному уровню
значимости
и числу степеней свободы
(
– число групп выборки) находят критическую
точку
правосторонней критической области.
Если
– нет оснований отвергнуть гипотезу о
нормальном распределении генеральной совокупности. Если
— гипотезу отвергают.
Проверка интервального распределения на нормальность
Пусть
эмпирическое распределение задано в виде последовательности интервалов
и соответствующих им частот
.
Требуется,
используя критерий Пирсона, проверить гипотезу о том, что генеральная
совокупность
распределена нормально.
Для того,
чтобы при уровне значимости
проверить гипотезу о нормальном распределении
генеральной совокупности, надо:
1.
Вычислить выборочную среднюю
и выборочное среднее квадратическое отклонение
, причем в качестве вариант
принимают среднее арифметическое концов
интервала:
2.
Пронормировать
, то есть перейти к
случайной величине
и
вычислить концы интервалов:
причем
наименьшее значение
, то есть
полагают равным
, а наибольшее, то есть
полагают равным
.
3. Вычислить теоретические
частоты:
где
– объем выборки
– вероятности попадания
в интервалы
– функция Лапласа.
4. Сравнить эмпирические и
теоретические частоты с помощью критерия Пирсона. Для этого:
а)
составляют расчетную таблицу (см. пример), по которой находят наблюдаемое
значение критерия
б) по
таблице критических точек распределения
, по заданному уровню
значимости
и числу степеней свободы
(
– число групп выборки) находят критическую
точку
правосторонней критической области.
Если
– нет оснований отвергнуть гипотезу о
нормальном распределении генеральной совокупности. Если
— гипотезу отвергают.
Замечание.
Малочисленные частоты
следует объединить, в этом случае и
соответствующие им теоретические частоты также надо сложить. Если производилось
объединение частот, то при определении числа степеней свободы по формуле
следует в качестве
принять число групп выборки, оставшихся после
объединения частот.
Примеры решения задач
Пример 1
Используя
критерий Пирсона при уровне значимости 0,05, проверить, согласуется ли гипотеза
с нормальным распределением генеральной совокупности X с заданным эмпирическим
распределением:
xi | -4.5 | -3.5 | -2.5 | -1.5 | -0.5 | 0.5 | 1.5 | 2.5 | 3.5 | 4.5 |
ni | 1 | 4 | 21 | 30 | 63 | 59 | 34 | 18 | 5 | 2 |
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Вычислим
характеристики распределения. Для этого составим расчетную таблицу.
Выборочная средняя:
Средняя
квадратов:
Выборочная
дисперсия:
Среднее квадратическое
отклонение:
Вычислим
теоретические частоты.
Вероятность
попадания в соответствующий интервал:
Теоретические
частоты:
где
-объем выборки
Составим
расчетную таблицу:
Проверим
степень согласия эмпирического и теоретического распределения по критерию
Пирсона. Объединяем малочисленные частоты (
).
Из
расчетной таблицы
Уровень
значимости
Число
степеней свободы
По
таблице критических точек распределения:
Нет
оснований отвергнуть гипотезу о нормальном распределении генеральной
совокупности.
Пример 2
Из большой партии по схеме случайной
повторной выборки было проверено 150 изделий с целью определения процента
влажности древесины, из которой изготовлены эти изделия. Получены следующие
результаты:
Процент влажности, xi |
11-13 |
13-15 |
15-17 |
17-19 |
19-21 |
Число изделий, ni |
8 |
42 |
51 |
37 |
12 |
На уровне значимости 0,05 проверить
гипотезу о нормальном законе распределения признака (случайной величины) X, используя критерий χ2 — Пирсона.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Составим расчетную таблицу
Средняя:
Средняя квадратов:
Дисперсия:
Исправленная дисперсия:
Исправленное среднее квадратическое
отклонение:
Вычислим теоретические частоты.
Составим расчетную таблицу:
Вероятность попадания в
соответствующий интервал:
, где
— функция Лапласа
Теоретические частоты:
, где
-объем выборки
Составим расчетную таблицу:
Проверим степень согласия
эмпирического и теоретического распределения по критерию Пирсона:
Из расчетной таблицы
Уровень значимости
Число степеней свободы
По таблице критических точек
распределения:
Нет оснований отвергать гипотезу о
распределении случайной величины по нормальному закону.
Задачи контрольных и самостоятельных работ
Задача 1
Выборка X
объемом n=100 задана таблицей:
|
0.8 | 1.1 | 1.4 | 1.7 | 2 | 2.3 | 2.6 |
|
5 | 13 | 25 | 25 | 19 | 10 | 3 |
1) Построить
полигон относительных частот
.
2) Вычислить
среднее выборочное
, выборочную дисперсию
и среднее квадратическое отклонение
.
3) Вычислить
теоретические частоты
. Построить график
на одном рисунке с полигоном.
4) С помощью
критерия χ2 проверить гипотезу о нормальном распределении
генеральной совокупности при уровне значимости α=0.05.
Задача 2
Построить
нормальную кривую по опытным данным. Рассчитать теоретические (выравнивающие) частоты
и сравнить с опытным распределением.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 3
Выборка X
объемом N=100 измерений задана таблицей:
|
0.6 | 1.5 | 2.4 | 3.3 | 4.2 | 5.1 | 6 |
|
5 | 13 | 26 | 24 | 19 | 10 | 3 |
а)
Построить полигон относительных частот
б)
вычислить среднее выборочное
, выборочную дисперсию
и среднее квадратическое отклонение
;
в) по
критерию χ2 проверить гипотезу о
нормальном распределении генеральной совокупности при уровне значимости α=0.05.
Задача 4
Для
изучения количественного признака
из генеральной совокупности извлечена выборка
объема n, имеющая данное
статистическое распределение.
а)
Построить полигон частот по данному распределению выборки.
б) Найти
выборочное среднее
, выборочное среднее
квадратическое отклонение
и исправленное среднее квадратическое
отклонение
.
в) При
данном уровне значимости
проверить по критерию Пирсона гипотезу о
нормальном распределении генеральной совокупности.
г) В
случае принятия гипотезы о нормальном распределении генеральной совокупности
найти доверительные интервалы для математического ожидания
и среднего квадратического отклонения σ при
данном уровне надежности γ=1-α; α=0.05
|
4 | 8 | 12 | 16 | 20 | 24 | 28 | 32 |
|
5 | 9 | 15 | 19 | 20 | 16 | 10 | 6 |
Задача 5
Для выборки
объема N=100, представленной вариационным рядом
|
-1 | 0 | 1 | 2 | 3 | 4 | 5 |
|
3 | 8 | 11 | 19 | 37 | 17 | 5 |
построить
полигон относительных частот и гистограмму накопленных частот. Найти выборочное
среднее
и выборочное среднее квадратичное отклонение
. Определить доверительный интервал с
доверительной вероятностью β=0,95 для оценки математического ожидания
генеральной совокупности в предположении, что среднее квадратическое отклонение
генеральной совокупности σ равно исправленному выборочному среднему s. Проверить
гипотезу о нормальности закона распределения генеральной совокупности,
используя критерий Пирсона с уровнем значимости α=0,05.
Задача 6
Для случайной величины X составить интервальный
вариационный ряд, вычислить выборочные средние характеристики, подобрать
теоретический закон распределения, проверить его согласование с теоретическим
критерием Пирсона при α=0,05.
7 | 4 | 4 | 15 | 1 | 1 | 7 | 15 | 19 | 4 |
0 | 4 | 8 | 14 | 10 | 0 | 1 | 11 | 8 | 2 |
6 | 2 | 5 | 3 | 12 | 2 | 9 | 6 | 2 | 5 |
13 | 5 | 7 | 3 | 3 | 10 | 0 | 11 | 17 | 11 |
9 | 6 | 11 | 7 | 20 | 1 | 14 | 6 | 7 | 4 |
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 7
Данные о
продолжительности телефонных разговоров, отобранные по схеме
собственно-случайной бесповторной выборки, приведены в таблице:
Время, мин | 1.5-2.5 | 2.5-3.5 | 3.5-4.5 | 4.5-5.5 | 5.5-6.5 | 6.5-7.5 | 7.5-8.5 | 8.5-9.5 | 9.5-10.5 | Итого |
Число разговоров | 3 | 4 | 9 | 14 | 37 | 12 | 8 | 8 | 5 | 100 |
Используя χ2-критерий Пирсона при уровне
значимости α=0.05 проверить гипотезу о том, что случайная величина X —
продолжительность телефонных разговоров — распределена по нормальному закону.
Построить на одном чертеже гистограмму и соответствующую нормальную кривую.
Задача 8
Распределение
случайной величины X – заработной платы сотрудников на фирме (в у.е.) –
задано в виде интервального ряда:
Найти:
. Построить теоретическое
нормальное распределение и сравнить его с эмпирическим с помощью критерия
согласия Пирсона χ2 при α=0,05.
Задача 9
Записать для выборки интервальное
распределение, построить гистограмму относительных частот. По критерию Пирсона
проверить гипотезу нормальном распределении.
7.81 | 3.15 | 2.27 | 32.64 | 4.72 | 5.33 | 8.51 | 7.72 | 30.23 | 20.12 |
9.83 | 8.33 | 9.61 | 31.83 | 8.52 | 27.22 | 27.22 | 8.43 | 15.91 | 25.46 |
24.82 | 26.54 | 46.73 | 17.31 | 13.05 | 53.24 | 5.23 | 18.28 | 40.93 | 17.44 |
32.34 | 28.26 | 9.75 | 3.72 | 8.16 | 22.91 | 0.74 | 12.97 | 12.05 | 1.53 |
43.15 | 45.57 | 2.02 | 32.23 | 8.67 | 4.83 | 9.12 | 6.77 | 6.48 | 19.22 |
36.42 | 47.81 | 40.64 | 5.45 | 0.21 | 26.51 | 17.36 | 3.62 | 15.57 | 23.21 |
58.73 | 62.52 | 10.15 | 38.36 | 35.55 | 6.10 | 3.04 | 4.54 | 1.95 | 5.24 |
64.71 | 67.63 | 1.21 | 0.81 | 2.03 | 10.17 | 5.51 | 8.35 | 43.76 | 8.74 |
4.72 | 17.54 | 17.32 | 29.43 | 5.91 | 6.92 | 4.72 | 16.04 | 57.54 | 15.46 |
13.31 | 36.45 | 3.45 | 16.15 | 15.77 | 2.43 | 14.24 | 2.25 | 15.63 | 23.72 |
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 10
Результаты наблюдений над случайной
величиной
оказались
лежащими на отрезке
и были
сгруппированы в 10 равновеликих интервалов. Значения
и частоты
попадания в интервалы приведены в таблице. Построить: гистограмму частот,
эмпирическую функцию распределения, найти медиану. Найти выборочное среднее
и исправленное
среднеквадратическое отклонение
. Указать 95-процентные доверительные интервалы для
. С помощью критерия Пирсона проверить гипотезу о
нормальном (с параметрами
) законе распределения (уровень значимости α=0.02
.
Задача 11
В таблице приведены результаты
измерения роста (см.) случайно отобранных 100 студентов:
Интервалы роста |
154-158 | 158-162 | 162-166 | 166-170 | 170-174 | 174-178 | 178-182 |
Число студентов, |
10 | 14 | 26 | 28 | 12 | 8 | 2 |
С помощью критерия Пирсона при
уровне значимости α=0.05 проверить правдоподобие гипотезы о нормальном
распределении роста студентов.
Задача 12
При массовых стрельбах из пушек для
одинаковых общих условий были зафиксированы продольные ошибки (м) попадания
снарядов в цель:
На уровне значимости 0,05 проверить
гипотезу о нормальном законе распределения признака (случайной величины) L, используя критерий χ2— Пирсона.
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ