медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

в предыдущем сравнении, соответственно то же и критическое значение. Оно больше вычисленного, следовательно, различие статистически не значимо.

В данном случае вывод не отличается от полученного при применении критерия Стьюдента с поправкой Бонферрони.

КРИТЕРИЙ ТЬЮКИ

Критерий Тьюки совпадает с критерием Ньюмена—Кейлса во всем, кроме способа определения критического значения. В критерии Ньюмена—Кейлса критическое значение q зависит от интервала сравнения /. В критерии Тьюки при всех сравнениях вместо / берут число групп т, таким образом, критическое значение q все время одно и то же. Критерий Ньюмена-Кейлса был разработан как усовершенствование критерия Тьюки.

Применяя критерий Тьюки к только что рассмотренной задаче о влиянии бега на частоту менструаций, нужно было бы приравнять / к числу групп т = 3. Соответствующее критическое значение равно 3,385 и неизменно при всех сравнениях. В нашем примере при двух последних сравнениях критические значения по Тьюки будут больше, чем по Ньюмену—Кейлсу. Однако в данном случае результат применения обоих критериев один и тот же. Разумеется, так будет не всегда. Поскольку в критерии Тьюки при всех сравнениях используется максимальное критическое значение q, различия будут выявляться реже, чем при использовании критерия Ньюмена-Кейлса.

Критерий Тьюки слишком жесток и отвергает существование различий чаще, чем нужно, а критерий Ньюмена—Кейлса, напротив, слишком мягок. В общем, выбор критерия определяется скорее психологическим фактором: чего больше боится исследователь: найти отличия там, где их нет, или пропустить их там, где они есть. Автор предпочитает критерий Ньюмена—Кейлса.

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ С КОНТРОЛЬНОЙ ГРУППОЙ*

Иногда задача заключается в том, чтобы сравнить несколько групп с единственной — контрольной. Конечно, можно было бы использовать любой из описанных методов множественного сравнения (критерий Стьюдента с поправкой Бонферрони, Ньюмена—Кейлса или Тьюки): попарно сравнить все группы, а затем отобрать те сравнения, в которых участвовала контрольная группа. Однако в любом случае (особенно при применении поправки Бонферрони) из-за большого числа лишних сравнений критическое значение окажется неоправданно высоким. Иными словами, мы слишком часто будем пропускать реально существующие различия. Преодолеть эту трудность позволяют специальные методы сравнения, из которых мы разберем два. Это еще одна модификация критерия Стьюдента с поправкой Бонферрони и критерий Даннета. Как и другие методы множественного сравнения, их следует применять только после того, как с помощью дисперсионного анализа отвергнута нулевая гипотеза о равенстве всех средних.

Поправка Бонферрони

* Этот материал важен для тех, кто использует нашу книгу как руководство для анализа данных. Во вводном курсе этот раздел можно опустить.

8 - 7038

Применить поправку Бонферрони к сравнению нескольких групп с одной контрольной очень просто. Ход вычислений такой же, что и при применении поправки Бонферрони в общем случае. Надо только учесть, что число сравнений к составляет теперь

т -1, и соответственно рассчитать уровень значимости в каждом из сравнений: а=а'/к. Применим этот метод к исследованию частоты менструаций. Сравним спортсменок и физкультурниц с контрольной группой. Число сравнений к = 2 (а не 3, как при всех возможных сравнениях). Чтобы полная вероятность ошибочно обнаружить различия не превышала 0,05, при каждом сравнении уровень значимости должен быть 0,05/2 = 0,025 (вместо 0,05/3 = 0,017). Число степеней свободы — 75; критическое значение / = 2,31 (при всех возможных сравнениях оно бы составило 2,45). Величину t для сравнения физкультурниц и спортсменок с контролем мы уже рассчитывали — 2,54 и 4,35 соответственно. Таким образом, и спортсменки, и физкультурницы статистически значимо отличаются от контрольной группы. В данном случае вывод получился тот же, что и при применении поправки Бонферрони в общем случае. Ясно, однако, что за счет снижения критического уровня t чувствительность метода повышается. Обратите внимание, что в данном случае мы не делаем никакого заключения о различии спортсменок и физкультурниц.

Критерий Даннета

Критерий Даннета — это вариант критерия Ньюмена—Кейлса для сравнения нескольких групп с одной контрольной. Он вычисляется как

кон А

Число сравнений равно числу групп, не считая контрольной, и существенно меньше числа сравнений в исходном критерии Ньюмена—Кейлса. Соответственно, меньше и критические значения (табл. 4.4). Как и в критерии Ньюмена-Кейлса, сначала средние значения для всех групп упорядочиваются, только теперь — по абсолютной величине их отличия от контрольной группы. Затем контрольную группу сравнивают с остальными, начиная с наиболее отличной от контрольной. Если различия с очередной группой не найдены, вычисления прекращают. Параметр / постоянен и равен

числу групп, включая контрольную. Число степеней свободы вычисляют как в критерии Ньюмена-Кейлса: v = N -т.

Применим критерий Даннета к анализу влияния бега на менструации. Сначала сравним с контрольной наиболее от нее отличную группу спортсменок:

X кон % \

11,5-9,1

= 4,35.

вну

(

V^koh

+

п

I )

'3,95

V

1 ±1

26 +26у

Общее число средних равно трем, поэтому 1 = 3. Число степеней свободы равно 75. По таблице 4.4 находим критическое значение для уровня значимости 0,05. Оно равно 2,28. Вычисленное значение больше критического. Тем самым, различие между спортсменками и контрольной группой статистически значимо, и сравнения можно продолжать.

Теперь сравним с контрольной группу физкультурниц:

X кон

11,5-10,1

= 2,54

1 вну

+

V^koh П2 )

13,95

V

_1_ _П 26 + 26у

Критическое значение по-прежнему равно 2,28. Вычисленное значение больше. Различие между физкультурницами и контрольной группой статистически значимо.

Критерий Даннета, как вариант критерия Ньюмена—Кейлса, более чувствителен, чем критерий Стьюдента с поправкой Бонферрони, особенно при большом числе групп. Если бы групп было больше, мы убедились бы, что критерий Ньюмена—Кейлса обнаруживает те различия, которые упускает критерий Стьюдента с поправкой Бонферрони, завышающей критические значения t.

ЧТО ОЗНАЧАЕТ Р

Поговорим еще раз о вероятности справедливости нулевой гипотезы Р. Понимание смысла Р требует понимания логики проверки статистической гипотезы. Например, исследователь хочет узнать, влияет ли некий препарат на температуру тела. Очевидная схема эксперимента: взять две группы, одной дать препарат, другой плацебо, измерить температуру и вычислить для обеих групп среднюю температуру и стандартное отклонение. Средние температуры вряд ли совпадут, даже если препарат не обладает никаким действием. Поэтому естественен вопрос: сколь вероятно, что наблюдаемое различие случайно?

Для ответа на этот вопрос прежде всего нужно выразить различия одним числом — критерием значимости. Со многими из них мы уже встречались — это критерии F, t, q nq\ Значение критерия тем больше, чем больше различия. Если препарат не оказывает действия, то величина критерия будет мала, если оказывает — велика. Но что значит «мала» и что значит «велика»?

Чтобы разграничить «большие» и «малые» значения критерия, строится предположение, что препарат не оказывает влияния на температуру. Это так называемая нулевая гипотеза. Если нулевая гипотеза верна, то обе группы можно считать просто случайными выборками из одной и той же совокупности. Далее эксперимент мысленно проводится на всех возможных выборках, и для каждой пары вычисляется значение критерия. Чаще всего оно будет небольшим, но какая-то часть выборок даст весьма высокие значения. При этом мы сможем указать такое число (критическое значение), выше которого значение критерия оказывается, скажем, в 5% случаев.

Теперь вернемся к препарату и вычислим значение критерия. Если оно превышает критическое значение, то мы можем утверждать следующее: если бы нулевая гипотеза была справедлива, то вероятность получить наблюдаемые различия была бы меньше 5%. В принятой системе обозначений это записывается как Р < 0,05. Отсюда мы заключаем, что гипотеза об отсутствии влияния препарата на температуру вряд ли справедлива, то есть различия статистически значимы (при 5% уровне значимости). Разумеется, этот вывод по сути своей носит вероятностный характер. Не исключено, что мы ошибочно признаем неэффективный препарат эффективным, то есть найдем различия там, где их нет. Однако мы можем утверждать, что вероятность подобной ошибки не превышает 5%.

Дадим определение Р.

Р есть вероятность того, что значение критерия окажется не меньше критического значения при условии справедливости нулевой гипотезы об отсутствии различий между группами.

Определение можно сформулировать и по-другому.

Р есть вероятность ошибочно отвергнуть нулевую гипотезу об отсутствии различий.

Упрощая, можно сказать, что Р — это вероятность справедливости нулевой гипотезы. Часто говорят также, что Р — это вероятность ошибки. В общем, и это верно, однако несколько неточно. Дело в том, что существует два рода ошибок. Ошибка I рода — это ошибочное заключение о существовании различий, которых в действительности нет. Вероятность именно этой оценивает Р. Возможна и противоположная ошибка — принять неверную нулевую гипотезу, то есть не найти действительно существующее различие. Это так называемая ошибка II рода. О вероятности этой ошибкиР ничего не говорит, мы обсудим ее в гл. 6.

ЗАДАЧИ

4.1. Конахан и соавт. определили среднее артериальное давление и общее периферическое сосудистое сопротивление при операциях на открытом сердце с галотановой (9 больных) и мор-финовой (16 больных) анестезией. Результаты приведены в табл. 4.2. Можно ли утверждать, что в группах галотановой и морфиновой анестезии эти гемодинамические показатели различаются статистически значимо?

4.2. Кокаин чрезвычайно вреден для сердца, он может вызвать инфаркт миокарда даже у молодых людей без атеросклероза. Кокаин сужает коронарные сосуды, что приводит к уменьшению притока крови к миокарду, кроме того, он ухудшает

страница 15
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(19.10.2018)