медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

ок равны, то есть я, =п2 =п, то мы получим ранее использовавшуюся формулу для t.

ПРОДОЛЖЕНИЕ ПРИМЕРОВ

Применим теперь критерий Стьюдента к тем данным, которые рассматривались при изучении дисперсионного анализа. Выводы, которые мы получим, не будут отличаться от прежних, поскольку, как говорилось, критерий Стьюдента есть частный случай дисперсионного анализа.

Позволяет ли правильное лечение сократить срок госпитализации?

Обратимся к рис. 3.7. Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное (соответствующее официальным рекомендациям) лечение, составила 4,51 сут, а 36 больных, получавших неправильное лечение, — 6,28 сут. Стандартные отклонения для этих групп — соответственно 1,98 сут и 2,54 сут. Так как численность групп одна и та же, объединенная оценка дисперсии s2 = ){(1,982 + 2,542) = 5,18. Подставив эту величину в выражение для t, получим

t =

4,51-6,28

= -3,30.

5,18 5,18 +

36 36

Число степеней свободы v = 2 (п -1) = 2 (36 -1) = 70. По таблице 4.1 находим, что для 1% уровня значимости критическое значение t составляет 2,648, то есть меньше, чем мы получили (по абсолютной величине). Следовательно, если бы наши группы представляли собой две случайные выборки из одной совокупности, то вероятность получить наблюдаемые различия была бы меньше 1%. Итак, различия в сроках госпитализации статистически значимы.

Галотан и морфин при операциях на открытом сердце

В исследовании Конахана и соавт. (рис. 3.8) минимальное АДсредн между началом анестезии и началом операции составляло в среднем: при галотановой анестезии 66,9 мм рт. ст., при морфино7 - 7038

вой — 73,2 мм рт. ст. Стандартные отклонения составляли соответственно 12,2 и 14,4 мм рт. ст. В каждой группе был 61 больной. Вычислим объединенную оценку дисперсии:

?2 = i(l2,22 +14,42) = 178,1,

тогда t =

66,9-73,2 '178,1 178,1

61 61

= -2,607.

Число степеней свободы v = 2 (п-1) = 2(61-1) = 120. По таблице 4.1 находим, что для 5% уровня значимости критическое значение / составляет 1,980, то есть меньше, чем мы получили. Заключаем, что морфин меньше снижает артериальное давление, чем галотан.

Конахан и соавт. измеряли еще один параметр гемодинамики — минутный объем сердца (объем крови, который левый желудочек перекачивает за минуту). Поскольку этот объем зависит от размеров тела, деятельность сердца (которая и интересовала исследователей) лучше характеризуется сердечным индексом — отношением минутного объема сердца к площади поверхности тела. В группе галотана сердечный индекс определили у 9 больных (табл. 4.2), он составил в среднем 2,08 л/мин/м2 (стандартное отклонение 1,05 л/мин/м2), у 16 больных в группе морфина — 1,75 л/мин/м2 (стандартное отклонение 0,88 л/мин/м2). Является ли это различие статистически значимым? Найдем объединенную оценку дисперсии

^=(9-1)1,052 +(16-1)0,882 =Qg9

9 + 16-2

и поэтому

(0,89 0,89— + ——

9 16

Число степеней свободы v = 9 + 16-2 =23. Критическое значение t при 5% уровне значимости составляет 2,069, что больше полученного нами! Итак, статистически значимых различий не найдено. Можно ли утверждать, что различий нет! Ответ на этот вопрос мы узнаем в гл. 6.

КРИТЕРИЙ СТЬЮДЕНТА С ТОЧКИ ЗРЕНИЯ ДИСПЕРСИОННОГО АНАЛИЗА*

Хотя критерий Стьюдента является просто вариантом дисперсионного анализа, этот факт осознается очень немногими. Покажем, что в случае двух групп справедливо равенство F = t2. _ Рассмотрим две выборки равного объема п со средними Х] и Х2 и стандартными отклонениями s, и s2.

* Этот раздел посвящен сугубо математической стороне дела, и его можно пропустить без ущерба для понимания дальнейшего изложения.

Как вы помните, отношение F есть отношение двух оценок дисперсии. Первая, внутригрупповая оценка есть среднее выборочных дисперсий:

^вну — л (S\ + S2 )•

Вторая, межгрупповая оценка вычисляется по выборочным средним:

SX \{ХХ-ХУ НХг-Ху

2-1

следовательно,

4=(j,-j)2+(j2-j)2,

где X — среднее двух выборочных средних:

Х=1-(Х1+Х2).

Исключим X из формулы для S\

4 =

ХХ-Х-(Х^Х2)

п2

+

1

Х2-^(Х1+Х2)

п2

(\ - \ - Л

—XI Х-) 2 2)

+

— Х~> XI 2 2 'J

Если разность возводится в квадрат, все равно что из чего вычитать: (a-b)2 = (Ь-а)2. Поэтому

4 =

1 ^

1.-7^

+

Л2 , ч2

Jfi Jfv

= 2

1

п2

= \{X,-X2?

Таким образом, межгрупповая оценка дисперсии SL,X=NS2-=n-(Xt-X2F.

F есть отношение межгрупповой оценки к внутригрупповой и равно

2

вну

2

2

Хх -Х2

\ п п

V )

Но величина в скобках есть не что иное, как t. Тем самым,

Межгрупповое число степеней свободы в F равно числу групп минус единица, то есть 2 -1 = 1. Внутригрупповое число степеней свободы равно произведению числа групп на число, равное численности каждой группы минус единица, то есть 2(п -1). Но это как раз число степеней свободы в критерии Стьюдента.

Таким образом, можно сказать, что в случае сравнения двух групп критерий Стьюдента и дисперсионный анализ — варианты одного критерия. Конечно, если групп больше двух, дисперсионный анализ в форме критерия Стьюдента неприменим и нужно воспользоваться общим вариантом дисперсионного анализа, изложенным в гл. 3.

ОШИБКИ В ИСПОЛЬЗОВАНИИ КРИТЕРИЯ СТЬЮДЕНТА

Критерий Стьюдента предназначен для сравнения двух групп. Однако на практике он широко (и неправильно — см. рис. 4.1) используется для оценки различий большего числа групп посредством попарного их сравнения. При этом вступает в силу эффект множественных сравнений, который нам еще неоднократно встретится в разнообразных обличиях.

Рассмотрим пример. Исследуют влияние препаратов А и Б на уровень глюкозы плазмы. Исследование проводят на трех группах — получавших препарат А, получавших препарат Б и получавших плацебо В. С помощью критерия Стьюдента проводят

3 парных сравнения: группу А сравнивают с группой В, группу Б — с группой В и наконец А с Б. Получив достаточно высокое значение / в каком-либо из трех сравнений, сообщают, что «Р < 0,05». Это означает, что вероятность ошибочного заключения о существовании различий не превышает 5%. Но это неверно: вероятность ошибки значительно превышает 5%.

Разберемся подробнее. В исследовании был принят 5% уровень значимости. Значит, вероятность ошибиться при сравнении групп А и В — 5%. Казалось бы, все правильно. Но точно так же мы ошибемся в 5% случаев при сравнении групп Б и В. И наконец, при сравнении групп А и Б ошибка возможна также в 5% случаев. Следовательно, вероятность ошибиться хотя бы в одном из трех сравнений составит не 5%, а значительно больше. В общем случае эта вероятность равна

Р' = 1-(1-0,05)\

где к — число сравнений.

При небольшом числе сравнений можно использовать приближенную формулу

Р' = 0,05к,

то есть вероятность ошибиться хотя бы в одном из сравнений примерно равна вероятности ошибиться в одном, помноженной на число сравнений.

Итак, в нашем исследовании вероятность ошибиться хотя бы в одном из сравнений составляет примерно 15%. При сравнении четырех групп число пар и соответственно возможных попарных сравнений равно 6. Поэтому при уровне значимости в каждом из сравнений 0,05 вероятность ошибочно обнаружить различие хотя бы в одном равна уже не 0,05, а примерно 6 х0,05 = 0,30. И когда исследователь, выявив таким способом «эффективный» препарат, будет говорить про 5% вероятность ошибки, на самом деле эта вероятность равна 30%.

Вернемся на минуту к нашим марсианам. Рассматривая в гл. 2 случайные выборки из населения этой планеты, мы убедились, что у разных выборок из одной совокупности могут быть заметно разные средние значения и стандартные отклонения — взять хоть три случайные выборки на рис. 2.6. Представим себе, что это — результаты исследования влияния гормонов человека на рост марсиан. Одной группе дали тестостерон, другой — эст-радиол, а третьей — плацебо. Как известно, гормоны человека не оказывают на марсиан никакого действия, поэтому три экспериментальные группы — это просто три случайные выборки из одной совокупности, как мы это и знали с самого начала. Что хорошо известно нам, то неизвестно исследователям. На рис. 4.6 результаты исследования представлены в виде, принятом в медицинских публикациях. Столбиками изображены выборочные средние. Вертикальные черточки задают интервалы в плюс-минус одну стандартную ошибку среднего. Засучив рукава, наши исследователи приступают к попарному сравнению групп с помощью критерия Стьюдента и получают такие значения t плацебо—тестостерон — 2,39; плацебо—эстрадиол — 0,93 и тестостерон—эстрадиол — 1,34. Так как в каждом сравнении участвуют 2 группы по 10 марсиан в каждой, число степеней свободы равно 2(10 — 1) = 18. По таблице 4.1 находим, что при 5% уровне значимости критическое значение t равно 2,101. Таким образом, пришлось бы заключить, что марсиане, получавшие тестостерон, стали меньше ростом, чем марсиане, получавшие плацебо, в то время как эстрадиол по влиянию на рост существенно не отличается от плацебо, а тестостерон от эстрадиола.

Задумайтесь над этим результатом. Что в нем не так?

Если тестостерон дал результаты, не отличающиеся от эстрадиола, а эстрадиол действует неотличимо от плацебо, то как тестостерон оказался отличным от плацебо? Столь странный вывод обычно не смущает исследователей, а лишь вдохновляет их на создание изощренного «Обсуждения».

Дисперсионный анализ приведенных данных дает значение F = 2,74. Число степеней свободы vMe>K = w-l = 3- l= 2 и vBHy = =т(п -1) = 3(10-1) = 27. Критическое значение F для 5% уровня значимости равно 3,35, то есть превышает полученное нами. Итак, дисперсионный анализ говорит об отсутствии различий между группами.

В заключение приведем три правила. • Критерий Стьюдента может быть использован для проверки

гипотезы о различии средних только для двух групп.

40§ 35

и о а.

30

Плацебо Тестостерон Эстрадиол

Рис. 4.6. Влияние гормонов человека на рост марсиан. Именно в таком виде результаты исследования увидели бы свет в каком-нибудь медицинском журнале. Высота столбиков соответствует средним, верт

страница 13
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(17.01.2018)