медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

жем, в одного больного имеет большее значение при малом ожидаемом числе, чем при большом. Определим критерий X2 следующим образом:

(О-Е)

где О — наблюдаемое число в клетке таблицы сопряженности, Е — ожидаемое число в той же клетке. Суммирование проводится по всем клеткам таблицы. Как видно из формулы, чем больше разница наблюдаемого и ожидаемого числа, тем больший вклад вносит клетка в величину X2. При этом клетки с малым ожидаемым числом вносят больший вклад. Таким образом, критерий удовлетворяет обоим требованиям — во-первых, измеряет различия и, во-вторых, учитывает их величину относительно ожидаемых чисел.

Применим критерий X2 к данным по тромбозам шунта'. В табл. 5.1 приведены наблюдаемые числа, а в табл. 5.2 — ожидаемые.

2 ^(О-Е)2 _

х2=1

Е

_(18-13,64)2 (7-11,36)2 (6-10,36)2 | (13-8,64)2 _?1Q Ц64 + flJ36 + Щ36 + 8^64 ~ '

Много это или мало? Испытаем наш новый критерий на данных по галотановой и морфиновой анестезии (табл. 5.3 и 5.4):

2 (53-52,42)2 ,(8-8,58)2 , (57-57,58)2 , (10-9,42)2 „nQ

у = + + + = 0,09.

52,42 8,58 57,58 9,42

Разница найденных значений X2 довольно велика: 7,10 в первом случае и 0,09 во втором, что соответствует тем впечатлениям, которые мы получили, сравнивая табл. 5.1 с 5.2 и 5.3 с 5.4. В первом случае мы получили «большое» значение X2, «большим» бы1,0

2,0

0 1,0 2,0 3,0 4,0 5,0

Рис. 5.7. Распределение Х2с 1 степенью свободы. Заштрихованная зона — это 5% наибольших значений.

ло и значение z, полученное по тем же данным. Можно показать, что для таблиц сопряженности размером 2x2 выполняется равенство X2 = z2 ?

Критическое значение X2 можно найти хорошо знакомым нам способом. На рис. 5.7 показано распределение возможных значений X для таблиц сопряженности размером 2x2 для случая, когда между изучаемыми признаками нет никакой связи. Величина X2 превышает 3,84 только в 5% случаев. Таким образом, 3,84 — критическое значение для 5% уровня значимости. В примере с тромбозом шунта мы получили значение 7,10, поэтому мы отклоняем гипотезу об отсутствии связи между приемом аспирина и образованием тромбов. Напротив, данные из табл. 5.3 хорошо согласуются с гипотезой об одинаковом влиянии галотана и морфина на послеоперационный уровень смертности.

Разумеется, как и все критерии значимости, X2 дает вероятностную оценку истинности той или иной гипотезы. На самом деле аспирин может и не оказывать влияния на риск тромбоза. На самом деле галотан и морфин могут по-разному влиять на операционную летальность. Но, как показал критерий, и то и другое маловероятно.

Применение критерия X2 правомерно, если ожидаемое число в любой из клеток больше или равно 5*. Это условие аналогично условию применимости критерия zКритическое значение X2 зависит от размеров таблицы сопряженности, то есть от числа сравниваемых методов лечения (строк таблицы) и числа возможных исходов (столбцов таблицы). Размер таблицы выражается числом степеней свободы v:

v=(r-l)(c-l),

где г — число строк, а с — число столбцов. Для таблиц размером 2x2 имеем v =(2 -1)(2 -1) = 1. Критические значения X2 для разных v приведены в табл. 5.7.

Приведенная ранее формула для X в случае таблицы 2x2 (то есть при 1 степени свободы) дает несколько завышенные значения (сходная ситуация была с критерием z)- Это вызвано тем, что теоретическое распределение X2 непрерывно, тогда как набор вычисленных значений X2 дискретен. На практике это приведет к тому, что нулевая гипотеза будет отвергаться слишком часто. Чтобы компенсировать этот эффект, в формулу вводят поправку Йейтса:

flo-'l-l]'

г ? t—T^Заметим, поправка Йейтса применяется только при v = 1, то есть для таблиц 2x2.

Применим поправку Йейтса к изучению связи между приемом аспирина и тромбозами шунта (табл. 5.1 и 5.2):

* В противном случае мы вынуждены использовать точный критерий Фишера.

18-13,64

( 1л

7-11,36

х2 =

+

V

13,64

( п

V

6-10,36

)

10,36

+

)

+

11,36

( 1л

13-8,64 --8,64

)

+

= 5,57.

Как вы помните, без поправки Йейтса значение X равнялось 7,10. Исправленное значение X оказалось меньше 6,635 — критического значения для 1% уровня значимости, но по-прежнему превосходит 5,024 — критическое значение для 2,5% уровня значимости.

Критерий X2 для произвольной таблицы сопряженности

Теперь рассмотрим случай, когда таблица сопряженности имеет число строк или столбцов, большее двух. Обратите внимание, что критерий z в таких случаях неприменим.

В гл. 3 мы показали, что занятия бегом уменьшают число менструаций*. Побуждают ли эти изменения обращаться к врачу? В табл. 5.5 приведены результаты опроса участниц исследования. Подтверждают ли эти данные гипотезу о том, что занятия бегом не влияют на вероятность обращения к врачу по поводу нерегулярности менструаций?

Из 165 обследованных женщин 69 (то есть 42%) обратились к врачу, остальные 96 (то есть 58%) к врачу не обращались. Если

занятия бегом не влияют на вероятность обращения к врачу, то в каждой из групп к врачу должно было обратиться 42% женщин. В табл. 5.6 приведены соответствующие ожидаемые значения. Сильно ли отличаются от них реальные данные? Для ответа на этот вопрос вычислим X2:

2 (14-22,58)2 (40-31,42)2 (9-9,62)2

у = + + +

22,58 31,42 9,62

.(14-Ц38)2 ,(46-36,80)2 |(42-51,20)2

н + 1 =9,63.

13,38 36,80 51,20

Число строк таблицы сопряженности равно трем, столбцов — двум, поэтому число степеней свободы v =(3-1)(2-1) = 2. Если гипотеза об отсутствии межгрупповых различий верна, то, как видно из табл. 5.7, значение X2 превзойдет 9,21 не более чем в 1% случаев. Полученное значение больше. Тем самым, при уровне значимости 0,01 можно отклонить гипотезу об отсутствии связи между бегом и обращениями к врачу по поводу менструаций. Однако, выяснив, что связь существует, мы тем не менее не сможем указать, какая (какие) именно группы отличаются от остальных.

Итак, мы познакомились с критерием X . Вот порядок его применения.

• Постройте по имеющимся данным таблицу сопряженности.

• Подсчитайте число объектов в каждой строке и в каждом столбце и найдите, какую долю от общего числа объектов составляют эти величины.

• Зная эти доли, подсчитайте с точностью до двух знаков после запятой ожидаемые числа — количество объектов, которое

попало бы в каждую клетку таблицы, если бы связь между строками и столбцами отсутствовала.

• Найдите величину X2, характеризующую различия наблюдаемых и ожидаемых значений. Если таблица сопряженности имеет размер 2x2, примените поправку Йейтса.

• Вычислите число степеней свободы, выберите уровень зна-чимости и по табл. 5.7 определите критическое значение X . Сравните его с полученным для вашей таблицы.

Как вы помните, для таблиц сопряженности размером 2 х2 критерий X2 применим только в случае, когда все ожидаемые числа больше 5. Как обстоит дело с таблицами большего размера? В этом случае критерий X2 применим, если все ожидаемые числа не меньше 1 и доля клеток с ожидаемыми числами меньше 5 не превышает 20%. При невыполнении этих условий критерий X2 может дать ложные результаты. В таком случае можно собрать дополнительные данные, однако это не всегда осуществимо. Есть и более простой путь — объединить несколько строк или столбцов. Ниже мы покажем, как это сделать.

Преобразование таблиц сопряженности

В предыдущем разделе мы установили существование связи между занятием бегом и обращениями к врачу по поводу менструаций, или, что то же самое, существование различий между группами по частоте обращения к врачу. Однако мы не могли определить, какие именно группы отличаются друг от друга, а какие нет. С похожей ситуацией мы сталкивались в дисперсионном анализе. При сравнении нескольких групп дисперсионный анализ позволяет обнаружить сам факт существования различий, но не указывает выделяющиеся группы. Последнее позволяют сделать процедуры множественного сравнения, о которых мы говорили в гл. 4. Нечто похожее можно проделать и с таблицами сопряженности.

Глядя на табл. 5.5, можно предположить, что физкультурницы и спортсменки обращались к врачу чаще, чем женщины из контрольной группы. Различие между физкультурницами и спортсменками кажется незначительным.

Проверим гипотезу о том, что физкультурницы и спортсменки обращаются к врачу одинаково часто. Для этого выделим из исходной таблицы подтаблицу, содержащую данные по двум этим группам. В табл. 5.8 приведены наблюдаемые и ожидаемые числа; они довольно близки.

Размер таблицы 2x2. Поэтому вычислим X с поправкой Йейтса:

= 1\0-Е

V

(

V

9-11,40

V

+

(

V

14-11,60

п

2

+

11,40

11,60

(

+

V

46-43,60

43,60

V

+

V

42-44,40

44,40

V

= 0,79.

Полученная величина значительно меньше критического значения. Поэтому гипотеза об отсутствии межгрупповых различий не отклоняется. Следовательно, эти группы можно объединить в одну. Полученную объединенную группу бегуний сравним с контрольной (табл. 5.9). На этот раз значение X2 равно 7,39, то

есть больше критического значения 6,63, соответствующего уровню значимости 0,01.

Заметьте, мы выполнили два сравнения, используя одни и те же данные. Поэтому нужно применить поправку Бонферрони, умножив уровень значимости на 2. Исправленное значение уровня значимости 2x0,01=0,02. Итак, с уровнем значимости 0,02 мы заключаем, что физкультурницы не отличаются от спортсменок, но обе эти группы отличаются от женщин, не занимающихся бегом.

ТОЧНЫЙ КРИТЕРИЙ ФИШЕРА

Критерий X годится для анализа таблиц сопряженности 2x2, если ожидаемые значения в любой из ее клеток не меньше 5. Когда число наблюдений невелико, это условие не выполняется и критерий X2 неприменим. В этом случае используют точный критерий Фишера. Он основан на переборе всех возможных вариантов заполнения таблицы сопряженности при данной численности групп, поэтому чем она меньше, тем проще его применить.

Нулевая гипотеза состоит в том, что между лечением и исходом нет никакой связи. Тогда вероятность получить некоторую таблицу равна

Rt \R21С, !С2! Ои\0]2\02]\022\

где i?, и R2 — суммы по строкам (числ

страница 19
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(14.12.2018)