медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

йную выборку из 10 особей. В выборку попало 5 зеленых и 5 розовых марсиан, на рисунке они помечены черным. Б. В таком виде данные предстанут перед исследователем, который не может наблюдать всю совокупность и вынужден судить о ней по выборке. Оценка доли розовых марсиан р = 5 /10 = 0,5.

Предположим, что из всех 200 марсиан случайным образом выбрали 10. Распределение розовых и зеленых марсиан во всей совокупности, неизвестное исследователям, изображено в верхней части рис. 5.4. Закрашенные кружки соответствуют марсианам, попавшим в выборку. В нижней части рис. 5.4 показана информация, которой располагал бы исследователь, получивший такую выборку. Как видим, в выборке розовые и зеленые марсиане поделились поровну. Основываясь на этих данных, мы решили бы, что розовых марсиан столько же, сколько и зеленых, то есть их доля составляет 50%.

Исследователь мог бы извлечь другую выборку, например одну из представленных на рис. 5.5. Здесь выборочные доли розовых марсиан равны 30, 30, 10 и 20%. Как любая выборочная оценка, оценка доли (обозначим ее р) отражает долю р в совокупности, но отклоняется от нее в силу случайности. РассмотРозовые Зеленые

Рис. 5.5. Еще 4 случайные выборки из той же совокупности марсиан. Оценки доли розовых марсиан: 30, 30, 10 и 20%.

рим теперь не совокупность марсиан, а совокупность всех значений р, вычисленных по выборкам объемом 10 каждая. (Из совокупности в 200 членов можно получить более 1016 таких выборок.) На рис. 5.6 приведены пять значений р, вычисленных по пяти выборкам с рис. 5.4 и 5.5, и еще 20 значений, полученных на других случайных выборках того же объема. Среднее этих 25 значений составляет 30%. Это близко к истинной доле розовых марсиан — 25%. По аналогии со стандартной ошибкой среднего найдем стандартную ошибку доли. Для этого нужно охарактеризовать разброс выборочных оценок доли, то есть рассчитать

ООО ООО

оооо о о о о о о е о о о • о

i—i—i i—i i—i—i—i—i—i

0 0 2 04 06 08 10

р

Рис. 5.6. Нанесем на график оценки доли розовых марсиан, полученные по выборке с рис. 5.4 и четырем выборкам с рис. 5.5. Добавим к ним еще 20 выборочных оценок. Получилось распределение выборочных оценок р. Стандартное отклонение совокупности средних — это стандартная ошибка доли.

стандартное отклонение совокупности р. В данном случае оно равно примерно 14%; в общем случае

где Gр — стандартная ошибка доли, о — стандартное отклонение, п — объем выборки. Поскольку а = ^р(1-р), то

GP =л •

V п

Заменив в приведенной формуле истинное значение доли ее оценкой р, получим оценку стандартной ошибки доли:

V п

Из центральной предельной теоремы (см. гл. 2) вытекает, что при достаточно большом объеме выборки выборочная оценка р приближенно подчиняется нормальному распределению, имеющему среднее р и стандартное отклонение о^. Однако при значениях р, близких к 0 или 1, и при малом объеме выборки это не так. При какой численности выборки можно пользоваться приведенным способом оценки? Математическая статистика утверждает, что нормальное распределение служит хорошим приближением, если и прип(1 -р) превосходят 5*. Напомним, что примерно 95% всех членов нормально распределенной совокупности находятся в пределах двух стандартных отклонений от среднего. Поэтому если перечисленные условия соблюдены, то с вероятностью 95% можно утверждать, что истинное значение р лежит в пределах 2sр от р.

Вернемся на минуту к сравнению операционной летальности при галотановой и морфиновой анестезии. Напомним, что при использовании галотана летальность составила 13,1% (численность группы — 61 больной), а при использовании морфина — 14,9% (численность группы — 67 больных).

для группы морфина

Стандартная ошибка доли для группы галотана

Если учесть, что различие в летальности составило лишь 2%, то маловероятно, чтобы оно было обусловлено чем-нибудь, кроме случайного характера выборки.

Прежде чем двигаться дальше, перечислим те предпосылки, на которых основан излагаемый подход. Мы изучаем то, что в статистике принято называть независимыми испытаниями Бер-нулли. Эти испытания обладают следующими свойствами.

• Каждое отдельное испытание имеет ровно два возможных взаимно исключающих исхода.

• Вероятность данного исхода одна и та же в любом испытании.

• Все испытания независимы друг от друга.

* Если объем выборки недостаточен для использования нормального распределения, можно прибегнуть к помощи биномиального распределения. О биномиальном распределении см. J. Н. Zar. Biostatis-tical analysis, 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984.

В терминах совокупности и выборок эти свойства формулируются так.

• Каждый член совокупности принадлежит одному из двух классов.

• Доля членов совокупности, принадлежащих одному классу, неизменна.

• Каждый член выборки извлекается из совокупности независимо от остальных.

СРАВНЕНИЕ ДОЛЕЙ

В предыдущей главе мы рассмотрели критерий Стьюдента t. Он вычисляется на основе выборочных средних и стандартной ошибки:

Разность выборочных средних

Стандартная ошибка разности выборочных средних

Выборочная доля р аналогична выборочному среднему. Выражение для стандартной ошибки мы уже вывели. Теперь мы можем перейти к задаче сравнения долей, то есть к проверке нулевой гипотезы о равенстве долей. Для этого используется критерий z, аналогичный критерию Стьюдента /:

Разность выборочных долей

— .

Стандартная ошибка разности выборочных долей

— объемы двух выборок, то

Пусть р] и р2 — выборочные доли. Поскольку стандартная ошибка — это стандартное отклонение всех возможных значений р, полученных по выборкам заданного объема, и поскольку дисперсия разности равна сумме дисперсий, стандартная ошибка разности долей равна

SPi = л 1 KSP,=

P\(l-P\) „ Pitt-Pi)

я, у П2

Таким образом,

л л

1

П{ П2

Итак, мы вывели формулу для критерия z- Вообще, этой буквой обозначаются величины со стандартным нормальным распределением (то есть нормальным распределением со средним ц = 0 и стандартным отклонением а =1, см. табл. 6.4). С величиной z мы встретимся еще неоднократно. В данном случае нормальное распределение имеет место только при достаточно больших объемах выборок*.

щ +п2 Тогда

Если при оценке дисперсии объединить наблюдения из обеих выборок, чувствительность критерия Стьюдента увеличится. Таким же способом можно повысить чувствительность критерия z-Действительно, если справедлива нулевая гипотеза, то обе выборочные доли р\ =mjnx и р2 = т2/п2 — это две оценки одной и той же доли р, которую мы, следовательно, можем оценить как

А ш, + т2 Р =

Sp =У1Р(1-Р)-Отсюда имеем

2 2 Sn S;

— н

я, п2

V

«1 п2)

* Точнее говоря, когда значения прип(\-р) больше 5. Если хотя бы для одной выборки это условие не выполняется, то критерий z неприменим и нужно воспользоваться точным критерием Фишера. Этот критерий мы рассмотрим чуть позже.

Подставляя полученную объединенную оценку в формулу для критерия z, имеем:

z =

Р\ ~ Pi

\р(\-р)

1 1 ^

— + —

щ п2)

О статистически значимом различии долей можно говорить, если значение z окажется «большим». С такой же ситуацией мы имели дело, рассматривая критерий Стьюдента. Отличие состоит в том, что t подчиняется распределению Стьюдента, a z — стандартному нормальному распределению. Соответственно, для нахождения «больших» значений z нужно воспользоваться стандартным нормальным распределением (рис. 2.5). Однако, поскольку при увеличении числа степеней свободы распределение Стьюдента стремится к нормальному, критические значения z можно найти в последней строке табл. 4.1. Для 5% уровня значимости оно составляет 1,96, для 1% — 2,58.

Поправка Йейтса на непрерывность

Нормальное распределение служит лишь приближением для распределения Z- При этом оценка Р оказывается заниженной и нулевая гипотеза будет отвергаться слишком часто. Причина состоит в том, что z принимает только дискретные значения, тогда как приближающее его нормальное распределение непрерывно. Для компенсации излишнего «оптимизма» критерия z введена поправка Йейтса, называемая также поправкой на непрерывность. С учетом этой поправки выражение для z имеет следующий вид:

Z =

Р\ -Рг

1 1 >

— +

п2 )

]р(1-р)

1 1

— + —

Поправка Иейтса слегка уменьшает значение z, уменьшая тем самым расхождение с нормальным распределением.

Галотан и морфин: операционная летальность

Теперь мы можем, наконец, сравнить операционную летальность при галотановой и морфиновой анестезии. Как вы помните, Конахан и соавт. исходили из предположения о том, что морфин в меньшей степени угнетает кровообращение, чем галотан, и потому предпочтительнее для общей анестезии. Действительно, при использовании морфина артериальное давление и сердечный индекс были выше, чем при использовании галотана, и различия эти статистически значимы. Однако выводы делать рано — ведь до сих пор не проанализированы различия операционной летальности, а именно этот показатель наиболее значим с практической точки зрения.

Итак, среди получавших галотан (1 -я группа) умерли 8 больных из 61 (13,1%), а среди получавших морфин (2-я группа) — 10 из 67 (14,9%). Объединенная оценка доли умерших

Р =

л 8 + 10

= 0,141.

61+67

Величина пр для каждой из выборок равна соответственно пхрх = 61 х 0,141 = 8,6 и п2 р2 =67x0,149 = 9,4. Оба значения больше 5*, поэтому можно воспользоваться критерием Z- С учетом поправки Йейтса имеем:

z =

Р\ ~Рг

2

1 1 ^

— + —

п2 )

'АО-А)

0,131-0,149

п2 ) \( 1

V

61 + 67у

= 0,04.

(0,141(1-0,141)

* Больше 5 и «(1-^) - нетрудно показать, что если /><0,5, то п{\-р)>пр.

Это очень маленькая величина. Она гораздо ниже 1,96 — критического значения для 5% уровня значимости. Следовательно, хотя галотан и морфин действуют на кровообращение по-разному, нет никаких оснований говорить о различии операционной летальности.

Этот пример очень поучителен: мы убедились, сколь важно учитывать исход лечения. Организм устроен сложно, действие любого препарата многообразно. Если препарат положительно в

страница 17
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(22.04.2018)