медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

итерий Уилкоксона. Принцип критерия следующий. Для каждого больного вычисляют величину изменения признака. Все изменения упорядочивают по абсолютной величине (без учета знака). Затем рангам приписывают знак изменения и суммируют эти «знаковые ранги» — в результате получается значение критерия Уилкоксона W.

Как видим, используется информация об абсолютной величине изменения и его знаке (то есть уменьшении или увеличении наблюдаемого признака). Метод основан на рангах, поэтому не нуждается в предположениях о типе распределения изменений. Как в случае с критерием Манна—Уитни, здесь также можно перечислить все возможные величины Wn найти критическое значение.

Обратите внимание, исходно ранги присваиваются в соответствии с абсолютной величиной изменения. Так, например,

величины 5,32 и —5,32 получат один и тот же ранг, а уже затем рангам будет присвоен знак изменения.

Рассмотрим пример. Допустим, мы исследуем некий препарат, предположительно диуретик. Дадим его 6 добровольцам и сравним диурез до и после приема препарата. Результаты представлены в табл. 10.5.

У 5 человек диурез увеличился. Значит ли это, что препарат является диуретиком?

Упорядочим изменения диуреза по абсолютной величине и присвоим им ранги от 1 до 6. Затем, приписав рангу каждого изменения соответствующий изменению знак, перейдем к знаковым рангам (последний столбец табл. 10.5). Наконец, вычислим сумму знаковых рангов W= 13.

Если препарат не оказывает действия, сумма рангов со знаком «+» должна быть примерно равна сумме рангов со знаком «-» и значение Покажется близким нулю. Напротив, если препарат увеличивает (или уменьшает) диурез, будут преобладать положительные (отрицательные) ранги и значение W будет отличным от нуля.

Чтобы найти критическое значение W, выпишем все 64 возможных исхода опыта (табл. 10.6 и рис. 10.3). В четырех случаях значение Wпо абсолютной величине равно или превосходит 19. Таким образом, отвергая нулевую гипотезу при W > 19, мы обеспечим уровень значимости 4/64 = 0,0625. Изменение диуреза в нашем опыте надо признать статистически не значимым:

Таблица 10.6. Возможные сочетания знаковых рангов для 6 пар

измерений

Ранги Сумма зна1 2 3 4 5 6 ковых рангов

_ _ _ _ _ - —

+ _____ -19 + ---- -17- + --- -15-- + -- -13--- + - -11

_____ + -9

+ + ---- -15

+ - + --- -13

+ -- + -- -11

+ --- + - -9

+ ----+ -7 + + --- -11 + - + -- -9 + -- + - -7 + ---+ _5 -- + + -- -7 -- + - + - -5 -- + --+ -3 --- + + - -3 --- + -+ -1 ---- + + 1 + + + --- -9 + + - + -- -7 + + -- + - -5 + + ---+ -3 + - + + -- -5 + - + - + - -3 + - + --+ -1 + -- + + - -1 + -- + -+ 1 + --- + + 3

ОООО ОООООООООО

оооооооооооо оооооооооооооооо

• •ООООООООООООООООООФФ

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 121 -1 1 21

W

Рис. 10.3. 64 возможные суммы рангов для группы из 6 человек (см. табл. 10.6). 4 наибольших по абсолютной величине значения помечены черным.

Р < 0,0625. На самом деле в таблице имеется 14 значений W, по абсолютной величине не меньших 13. Поскольку 14/64 = 0,219, мы могли бы записать Р < 14/64.

Как и в случае критерия Манна—Уитни, распределение Whq является непрерывным и поэтому нельзя указать критическое значение, для которого уровень значимости в точности равнялся бы, например, 5%. В табл. 10.7 приведены критические значения, наиболее близкие к 5 и 1% уровням значимости для случая, когда численность группы не превосходит 20.

Если число пар измерений больше 20, то распределение W достаточно близко к нормальному со средним \xw = 0 и стандартным отклонением

л(л +1)(2л +1)

где л — число пар наблюдений (то есть численность группы). Можно, таким образом, использовать

_ W-\xw _ W

zw —

о> л(л + 1)(2л + 1)

Чтобы приближение было более точным, воспользуемся поправкой Йейтса на непрерывность:

zw —

2

л(л+ 1)(2л + 1)

При анализе наблюдений до—после встречается два вида совпадений. Это, во-первых, совпадение величин, которым присваиваются ранги. Такая ситуация возникает при использовании любого рангового метода, будь то критерий Манна—Уитни или коэффициент корреляции Спирмена. Как всегда, совпадающим величинам присваивается общий ранг, равный среднему мест, занимаемых ими в упорядоченном наборе*.

Единственная особенность — то, что в случае наблюдений (до—после) речь идет о совпадении не самих величин наблюдае* Если некоторые значения совпадают, стандартное отклонение должно быть уменьшено в соответствии со следующей формулой:

= л(я + 1)(2л + 1) у(т,-1)т,(т, + 1)

w л/ 6 ^12

где п — численность группы, т, - число значений /-го ранга.

мого признака, а их изменений. Другой вид совпадения — совпадение значений «до» и «после». Каждую такую пару наблюдений нужно исключать из расчета, соответственно уменьшая на единицу объем выборки.

Повторим последовательность шагов, позволяющую по наблюдениям, выполненным до и после лечения, проверить его эффективность.

• Вычислите величины изменений наблюдаемого признака. Отбросьте пары наблюдений, которым соответствует нулевое изменение.

• Упорядочите изменения по возрастанию их абсолютной величины и присвойте соответствующие ранги. Рангами одинаковых величин назначьте средние тех мест, которые они делят в упорядоченном ряду.

• Присвойте каждому рангу знак в соответствии с направлением изменения: если значение увеличилось — «+», если уменьшилось — «—».

• Вычислите сумму знаковых рангов W*.

• Сравните полученную величину Wc критическим значением. Если она больше критического значения, изменение показателя статистически значимо.

А теперь применим критерий Уилкоксона к анализу рассмотренного в гл. 9 эксперимента Левина.

Курение и функция тромбоцитов

* Существует вариант критерия Уилкоксона, в котором суммируют только положительные или только отрицательные знаковые ранги. На выводе это никак не сказывается, однако значение W, естественно, получается другим. Поэтому важно знать, на какой вариант критерия рассчитана имеющаяся в вашем распоряжении таблица критических значений.

В гл. 9 мы разобрали исследование Левина, посвященное влиянию курения на функцию тромбоцитов. В частности, на рис. 9.2 приведены результаты опыта с выкуриванием сигареты: агрегация тромбоцитов до и после этого вредоносного воздействия. Рассмотрим еще раз эти данные (табл. 10.8). Обратим внимание на 4-й столбец: здесь показана величина изменения интересу

ющего нас показателя. Можно ли считать распределение изменения нормальным? При большом желании да, но следует все же признать, что для суждения о типе распределения данных слишком мало. Смущает и «выскакивающее» значение 27% — оно наводит на мысль о возможной асимметрии распределения. В подобных случаях лучше не рисковать и воспользоваться непараметрическим критерием. Применим критерий Уилкоксона.

Выпишем абсолютные величины изменений в порядке возрастания. Полученные ранги приведены в пятом столбце табл. 10.8, а шестой столбец содержит те же ранги, но со знаками, соответствующими направлению изменения. Сумма знаковых рангов Ж = 2 + 3,5 + 6 ч- 7 +10 ч- 8,5 + 3,5 +11 + 5 + (-1) + 8,5 = 64. В табл. 10.7 находим 1,8% критическое значение для суммы рангов. Оно равно 52, то есть меньше полученного нами. Поэтому мы признаем изменение агрегации тромбоцитов статистически значимым (Р < 0,018).

СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: КРИТЕРИЙ КРУСКАЛА—УОЛЛИСА

В гл. 3 была рассмотрена задача сравнения нескольких выборок. Эта задача возникает, например, когда нужно определить, одинаково ли эффективны несколько методов лечения, каждый из которых испытывается на отдельной группе. Предполагалось, что данные, полученные для каждой из групп, подчиняются нормальному распределению, причем дисперсии по всем группам примерно одинаковы. На этом допущении и основан изложенный в гл. 3 однофакторный дисперсионный анализ. Сейчас мы познакомимся с его непараметрическим аналогом, не требующим предположения о нормальности распределения. Это критерий Крускала—Уоллиса.

Критерий Крускала—Уоллиса представляет собой обобщение критерия Манна—Уитни. Сначала все значения, независимо от того, какой выборке они принадлежат, упорядочивают по возрастанию. Каждому значению присваивается ранг — номер его места в упорядоченном ряду. (Совпадающим значениям присваивают общий ранг, равный среднему тех мест, которые эти величины делят между собой в общем упорядоченном ряду.) Затем вычисляют суммы рангов, относящихся к каждой группе, и для каждой группы определяют средний ранг. При отсутствии межгрупповых различий средние ранги групп должны оказаться близки. Напротив, если существует значительное расхождение средних рангов, то гипотезу об отсутствии межгрупповых различий следует отвергнуть. Значение критерия Крускала—Уоллиса Ни является мерой такого расхождения средних рангов.

Для простоты положим, что групп всего три. Обобщение на большее число групп получится автоматически. Имеются результаты измерения некоторого признака в трех группах. Численность групп — я,, п2 и«3. Значения объединим, упорядочим и каждому присвоим ранг. Вычислим сумму_рангов для каждой группы — RiyR2nR3. Найдем средние ранги: R{ =Rl/nl,R2 = R2 /п2 иД3 =R3/n3.

Общее число наблюдений N = я, +п2 +п3. Для объединенной группы рангами являются числа 1, 2,Л^и общая сумма рангов равна

l + 2+...+(N-l) + N =——-.

Тогда средний ранг R для объединенной группы равен

F 1 + 2 + 3+...+JV N + l

N 2

Теперь найдем величину Д равную

D=n{(R{ -R)2+n2{R2-R)2 + n3(R3 -R)2.

Это прямой аналог межгрупповой вариации, знакомой нам по гл. 9. Величина D зависит от размеров групп. Чтобы получить показатель, отражающий их различия, следует поделить D на N(N +1) /12. Полученная величина

Н = -= --YnM(RM -R)2

N(N + \)/\2 N(N + 1)^ м

является значением критерия Крускала—Уоллиса. Суммирование в приведенной формуле производится по всем группам.

Как найти критическое значение Н? Можно было бы просто перечислить все сочетания рангов, как это делалось для критериев Манна—Уитни и Уилкоксона. Однако сделать это довольно трудно — число ва

страница 43
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(19.10.2018)