медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

авильное представление о статистической значимости различий только в случае, если выборки извлечены именно из такой совокупности.

Параметрические методы, как видно уже из их названия, oneрируют параметрами распределения. В частности, дисперсионный анализ и его частный случай, критерий Стьюдента, основаны на сравнении средних и дисперсий. Но эти параметры правильно описывают только нормально распределенную совокупность. Если распределение далеко от нормального, среднее и дисперсия дадут о нем неверное представление. Столь же неверными окажутся и критерии, основанные на этих параметрах.

В гл. 2 мы изучали рост юпитериан (см. рис. 2.ЗА). Средний рост составил 37,6 см, а стандартное отклонение 4,5 см. На рис. 2.3Б изображено, как выглядело бы нормальное распределение с такими параметрами. Оно мало похоже на распределение, наблюдаемое в действительности. Если бы распределение роста юпитериан было нормальным, рост большинства из них оказался бы в пределах 37—38 см и рост практически всех — в интервале от 26 до 49 см. Однако картина иная. Рост большинства юпитериан группируется вокруг 35 см, то есть ниже среднего. При этом интервал, охватывающий все значения роста (от 31 до 52 см), смещен вправо, то есть распределение асимметрично.

Непараметрические методы, которые мы рассмотрим в этой главе, заменяют реальные значения признака рангами. При этом мы сохраняем большую часть информации о распределении, но избавляемся от необходимости знать, что это за распределение. Нас не интересуют более параметры распределения, отпадает и необходимость равенства дисперсий. Остается в силе только предположение, что тип распределения во всех случаях одинаков*.

* Кроме того, теоретически распределение должно быть непрерывным. При практическом применении непараметрических критериев этим условием можно пренебречь.

Если выполняется условие нормальности распределения, параметрические критерии обеспечивают наибольшую чувствительность. Если же это условие не выполняется хотя бы приблизительно, их чувствительность существенно снижается и непараметрические критерии дают больше шансов выявить реально существующие различия. Что будет, если применить непараметрический критерий при нормальном распределении? Чувствительность критериев, которые мы рассмотрим в этой главе, составляет в этом случае примерно 95% от чувствительности их параметрических аналогов (это обстоятельство можно использовать для оценки чувствительности непараметрических критериев и определения необходимого числа наблюдений).

Как выяснить, согласуются ли данные с предположением о нормальности распределения? Простейший способ состоит в том, чтобы нанести их на график, подобный тем, которые мы рисовали, изучая рост инопланетян в гл. 2. Нарисовав график, прикиньте, похож ли он на нормальное распределение. Та ли у него форма, достаточно ли он симметричен относительно среднего, покрывает ли интервал, равный плюс-минус двум стандартным отклонениям от среднего, практически все наблюдения? Сравните графики для разных групп. Близок ли разброс значений? Ответив на все вопросы утвердительно, воспользуйтесь параметрическим критерием. В противном случае следует использовать непараметрический критерий. Изложенный нехитрый прием почти наверняка поможет правильно выбрать тип критерия.

Для тех, кто не привык полагаться на зрительные впечатления, укажем еще два способа, иногда более точные и всегда более трудоемкие. Первый основан на использовании нормальной вероятностной бумаги. Вы легко поймете, о "чем идет речь, если когда-нибудь видели логарифмическую бумагу. Вся разница в том, что на логарифмической бумаге вертикальная ось проградуиро-вана так, чтобы графиком экспоненты была прямая, а на нормальной вероятностной бумаге прямой окажется функция нормального распределения. На такую бумагу определенным образом наносят имеющиеся значения. Если они расположатся почти на одной прямой, можно применять параметрические методы. Второй способ опирается на критерий X2. Он позволяет сравнить реальные данные с теми, которые дало бы нормальное распределение, имеющее то же среднее и дисперсию. Мы не будем останавливаться на этих процедурах*, поскольку их выводы наверняка совпадут с теми, что даст простая прикидка.

* Желающие могут познакомиться с ними по книгам J. Н. Zar. Bio-statstical analisys. 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984 и W. J. Dixon, F. J. Massey, Jr. Introduction to statistical analisys. 4th ed., McGraw-Hill, New York, 1983.

Как правило, основная трудность состоит не в том, какой из перечисленных способов выбрать, а в том, что объем выборки слишком мал, чтобы применить любой из них. Убедительные свидетельства в пользу гипотезы нормальности или против нее встречаются редко. Гораздо чаще все решают интуиция, привычка и вкус исследователя. Существуют две точки зрения на то, как следует поступать в таких случаях. Согласно одной, в отсутствие очевидных противоречий между данными и гипотезой их нормального распределения следует применить параметрический метод. Согласно другой, если нет явного подтверждения гипотезы нормальности распределения, лучше воспользоваться непараметрическим методом. Сторонники первой точки зрения упирают на то, что параметрические методы более чувствительны и более известны. Приверженцы второй резонно замечают, что исследователь не должен исходить из предположений, которые нельзя проверить, и что, применяя непараметрические критерии, мы почти ничем не рискуем — ведь даже в случае нормального распределения их чувствительность не намного ниже чувствительности параметрических. Ни одна из сторон пока не одержала верх, и похоже, этого не произойдет никогда.

СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИ

Напомним схему, по которой строились все параметрические методы, будь то критерий Стьюдента, дисперсионный или корреляционный анализ. Из нормально распределенной совокупности мы извлекали все возможные выборки определенного объема и строили распределение значений соответствующего критерия. Теперь, упорядочив значения признака и перейдя от реальных значений к рангам, мы поступим несколько иначе. Мы просто перечислим все возможные варианты упорядочивания двух групп.

Как это сделать, мы покажем на простом примере. Чтобы вариантов упорядочивания было не слишком много, рассмотрим опыт с участием 7 добровольцев. Из них 3 принимают плацебо (контрольная группа), а 4 препарат, предположительно диуретик (экспериментальная группа). В табл. 10.1 приведены данные о суточном диурезе. Против каждого значения диуреза указан

его ранг — место в общем упорядоченном ряду. Рангом наименьшей величины будет 1; ранг наибольшей величины равен числу наблюдений, то есть 7. Если препарат увеличивает диурез, то ранги в экспериментальной группе должны быть больше, чем в контрольной. Мерой отличия изберем сумму рангов в меньшей из групп и'обозначим ее Т. В нашем примере меньшая группа — контрольная. Соответствующее значение Т равно 9.

Достаточно ли мало значение Г, чтобы отклонить гипотезу об отсутствии действия препарата?

Для ответа на этот вопрос рассмотрим совокупность всех возможных перестановок. Заметьте, после перехода к рангам нам уже не нужно рассматривать сами исходные величины и совокупность их возможных значений. Поэтому наши дальнейшие рассуждения полностью применимы к любым двум группам наблюдений по 3 и 4 наблюдения в каждой.

Итак, нулевая гипотеза — гипотеза об отсутствии влияния препарата на диурез. Если она справедлива, любой ранг может равновероятно оказаться в любой из групп. Чтобы узнать, велика ли вероятность случайно получить перестановку из табл. 10.1, рассмотрим все возможные перестановки. Понятно, что распределить ранги по двум группам — это то же самое, что набрать ранги для одной из групп (оставшиеся автоматически попадут во вторую). Тогда, перечислив все варианты выбора 3 рангов из 7, мы тем самым перечислим все варианты распределения семи рангов по двум группам. Число способов по-разному выбрать 3 ранга из 7 равно 35. Все 35 вариантов приведены в табл. 10.2. Крестиком помечены ранги, попадающие в контрольную группу. В правом

О

ооооо

ООООООО

ооооооооо ооооооооооооо

I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I

0 5 10 15 20

Сумма рангов для меньшей из групп (Г)

Рис. 10.1. 35 возможных сумм рангов для меньшей из групп (см. табл. 10.2).

столбце для каждого из вариантов указана величина Т — сумма рангов меньшей (контрольной) группы. Если нанести значения Т на график, получится распределение, показанное на рис. 10.1. Если справедлива нулевая гипотеза, то все сочетания рангов равновероятны. Это значит, что если, например, Т = 12 в 5 вариантах из 35, то вероятность случайно получить значение Т = \2 равна 5/35. Таким образом, на рис. 10.1 изображено распределение значений Т в случае справедливости нулевой гипотезы об отсутствии действия препарата. По форме оно напоминает распределение t (рис. 4.5). Однако есть и отличия. Действительно, распределение t непрерывно. Оно построено по бесконечной совокупности значений, вычисленных для бесконечного числа выборок из бесконечной нормально распределенной совокупности. Напротив, распределение Т конечно и дискретно, то есть имеет ступенчатый вид, принимая значения лишь в конечном числе целочисленных точек.

Глядя на рис. 10.1, легко определить вероятность получить то или иное значение Т при условии справедливости нулевой гипотезы. Например, значения Г=9иГ = 15 наблюдаются в 3 вариантах, то есть вероятность появления каждой из этих сумм равна 3/35. Вероятность получить значение Т, равное 8 или 16, составляет 2/35 = 0,057. Будем считать эти значения Т критическими. В нашем опыте Т = 9, так что нулевую гипотезу отвергнуть мы не можем.

Уровень значимости обычно принимают равным 5% или 1%. Можно ли установить такой уровень в нашем примере? Оказывается, нет. У нас есть всего 13 разных значений Т, поэтому уровень значимости может меняться только скачками. Назвав произвольный уровень значимости ос, мы скорее всего обнаружим, что нет такого значения Т, которому бы он соответствовал. В качестве критичес

страница 41
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(20.08.2018)