медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

тетрагидроканнабинолов на антибактериальную защиту у крыс. Допустим, минимальное снижение, которое мы хотим выявить, составляет 20%, уровень значимости а = 0,05. Какова чувствительность критерия Стьюдента?

6.5. По тем же данным определите, какой должна быть численность групп, чтобы обеспечить выявление снижения антибактериальной защиты на 20% с вероятностью 90% (уровень значимости а = 0,05).

6.6. Какой должна быть численность групп, чтобы с вероятностью 90% обнаруживать снижение летальности с 90 до 30%. Уровень значимости а = 0,05. При решении вам пригодятся табличные значения стандартного нормального распределения (табл. 6.4).

6.7. Используя данные из задачи 3.2, найдите вероятность обнаружить снижение максимальной объемной скорости середины выдоха на 0,25 л/с при уровне значимости а = 0,05.

6.1. Используя данные из задачи 3.3, найдите вероятность обнаружить увеличение уровня липопротеидов высокой плотности на 5 и 10 мг%. Уровень значимости а = 0,05.

6.2. По тем же данным определите, какой должна быть численность групп, чтобы изменение в 5 мг% можно было обнаружить с вероятностью 80% при уровне значимости а = 0,05.

6.10. В задаче 5.4 сравнивали частоту рецидивов инфекции мочевых путей после короткого курса того или иного антибактериального препарата. Допустим, минимальные различия, которые мы хотим выявить, таковы: в группах ампициллина и три-метоприма/сульфаметоксазола рецидив наступает у двух третей девочек, в группе цефалексина — у одной трети. Какой была бы чувствительность таблицы сопряженности при численности групп, указанной в задаче 5.4? Уровень значимости а = 0,05.

6.11. Каким должен быть объем выборки, чтобы в задаче 6.10 чувствительность составила 80%?

Глава 7

Доверительные интервалы

До сих пор мы занимались в основном нахождением различий между группами, не слишком интересуясь величиной этих различий. Мы формулировали нулевую гипотезу, то есть предполагали, что экспериментальные группы — это просто две случайные выборки из одной и той же совокупности. Затем мы оценивали вероятность получить наблюдаемые различия при условии, что нулевая гипотеза верна. Если эта вероятность была мала, мы отвергали нулевую гипотезу и делали вывод, что различия статистически значимы. При таком подходе мы всегда получаем только качественный результат: либо отклоняем нулевую гипотезу, либо не отклоняем, либо признаем различия статистически значимыми, либо не признаем. Количественная оценка различий от нас ускользает. Между тем, как мы выяснили в предыдущей главе, вероятность выявления различий зависит не только от их величины, но и от численности групп. Сколь угодно малые различия при достаточно большой численности групп могут оказаться статистически значимыми, или, как пишут в диссертациях, «высоко достоверными». При этом речь может идти о разнице в несколько миллиметров ртутного столба.

Характеристика, которая дополняет и даже заменяет качественное суждение (значимо—незначимо), — это доверительный интервал. В гл. 2 мы уже встречались с этим понятием, хотя и не применяли этот термин. Тогда мы выяснили, что истинное среднее в 95% случаев лежит на расстоянии не больше двух ошибок среднего от выборочного среднего. Промежуток длиной в четыре ошибки среднего — это и есть 95% доверительный интервал. Смысл доверительного интервала из этого примера достаточно ясен: мы не знаем точно, чему равна некоторая величина, но можем указать интервал, в котором она находится (с заданной вероятностью). В этой главе мы научимся определять доверительные интервалы для разных величин, в том числе для разности средних (величины эффекта) и доли. Мы покажем, что доверительный интервал можно использовать вместо обычных критериев значимости*. Доверительные интервалы используют также для определения границ нормы лабораторного показателя.

ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ РАЗНОСТИ СРЕДНИХ

В гл. 4 мы определили критерий Стьюдента как

Разность выборочных средних

t= —

Стандартная ошибка разности выборочных средних

* Существует мнение, что только доверительные интервалы и нужно использовать. Эта точка зрения кратко изложена в работе: К. J. Roth-man. A show of confidence. N Engl. J. Med., 299:1362-1363, 1978.

Вычислив /, его сравнивают с критическим значением ta для заданного уровня значимости а. Для двух случайных выборок из одной совокупности вероятность получить значение t, по абсолютной величине превышающее ta, весьма мала (а именно, не превышает а; напомним, что уровень значимости а — это максимальная приемлемая вероятность ошибочно признать существование различий там, где их нет). Поэтому, получив «боль

шое» значение г, мы делаем вывод о статистической значимости различий.

Для случайных выборок, извлеченных из одной совокупности, распределение всех возможных значений / (распределение Стьюдента) симметрично относительно среднего, равного нулю (см. рис. 4.5). Если же выборки извлечены из двух совокупностей с разными средними, то распределение всех возможных значений / будет иметь среднее, отличное от нуля (см. рис. 6.3 и 6.5).

Формулу для t можно видоизменить так, чтобы распределение t было всегда симметрично относительно нуля:

Стандартная ошибка разности выборочных средних

Заметим, что если обе выборки извлечены из одной совокупности, то разность истинных средних равна нулю и в этом случае новая формула совпадает с предыдущей.

Вот математическая запись новой формулы:

(Х{ -Х2)~(\1]-]л2)

t

SXX-X2

Поскольку истинных средних (то есть средних по совокупности) мы не знаем, то и вычислить значение t по этой формуле мы не можем. Но эта формула и не предназначена для нахождения t. Она позволяет сделать другое — оценить разность ц, - ц2»то есть истинную величину различий. Для этого вместо вычисления t выберем его подходящее значение и, подставив в формулу, вычислим величину ц, — jlx2 . Как выбрать «подходящее» значение?

По определению 100а процентов всех возможных значений t расположены левее ~ta или правее +ta. Остальные 100(1 -а) процентов значений t попадают в интервал от -ta до +ta. Например, 95% значений / находится в интервале от -tw до +/0>05. (Критические значения t, в частности f0>05, можно найти по табл. 4.1.) Значит, в 100(1 - а) процентах всех случаев

. (Х\ ~^2)-(Ц1-Ц2) ^ ,,

*а v. v. -На .

SXT-X2

Разность выборочных средних — Разность истинных средних

Преобразуя это неравенство, получаем

(Хх -X2)-tasx-^i <ц, -u-2 <(Х{ -X2) + tasj[i_x2.

Таким образом, разность истинных средних отличается от разности выборочных средних менее чем на произведение ta и стандартной ошибки разности выборочных средних. Это неравенство задает доверительный интервал для разности средних jli] — ц.2. К примеру, 95% доверительный интервал для разности средних определяется неравенством

В этот интервал разность истинных средних попадет в 95% случаев.

Этот способ определения доверительного интервала, как и критерий Стьюдента, на котором он основан, можно применять только тогда, когда совокупность имеет хотя бы приближенно нормальное распределение*.

Эффективный диуретик

На рис. 6.1 показан суточный диурез в союкупности из 200 человек после приема плацебо (рис. 6.1А) и диуретика (рис. 6.1Б). Средний диурез при приеме плацебо составил \хп = 1200мл, при приеме диуретика — цд = 1400 мл. Таким образом, препарат увеличивает суточный диурез на и. д - и. п = 1400 -1200 = 200 мл. Как обычно, исследователь вынужден довольствоваться выборками, по которым он и оценивает величину эффекта. На рис. 6.1 помимо известных нам, но не исследователю, данных по совокупности приведены данные, полученные по двум выборкам, в каждую из которых входило по 10 человек. В контрольной группе средний диурез составил 1180 мл, а в группе, получавшей диуретик, — 1400 мл. Среднее увеличение диуреза в данном опыте:

ХД -Хп =1400-1180 =220мл.

* Доверительные интервалы можно определять и в случае множественных сравнений. Подробнее об этом см.: J. Н. Zar. Biostatistical analysis, 2nd ed, Prentice-Hall, Englewood Cliff, N. J., 1984, p. 191-192, 195.

Как и всякая выборочная оценка, подверженная влиянию случая, эта величина отличается от истинного увеличения суточного диуреза, равного 200 мл. И если бы мы, основываясь на выборочных данных, сказали, что препарат увеличивает суточный диурез в среднем на 220 мл, то упустили бы из виду неопределенность, присущую выборочной оценке. Правильнее будет рассчитать доверительный интервал — он покажет не одно число, скорее всего не совпадающее с истинным, а диапазон чисел, куда истинное попадает почти наверняка (например, с вероятностью 95%).

Вычислим сначала объединенную оценку дисперсии. По ней мы сможем найти стандартную ошибку разности средних. Стандартные отклонения у принимавших диуретик и плацебо составили соответственно 245 и 144 мл. В обеих группах было по 10 человек. Объединенная оценка дисперсии

s2 = + *п) = ^(2452 + 1442) = 2012. Стандартная ошибка разности средних

S2 (2012 2012 QQ Q

sy у =— + —= J + =89,9.

д п \па пп V 10 10

Для определения 95% доверительного интервала найдем по табл. 4.1 значение /0,о5 • Объем каждой из выборокп =10. Поэтому число степеней свободы v = 2(n -1) = 2(10 -1) = 18. Соответствующее табличное значение /0 05 равно 2,101.

Теперь можно вычислить 95% доверительный интервал для среднего изменения диуреза:

(X а -Xn)-t0 05Sx _х < <(Ха -Xn) + t0 05Sx _х ,

то есть

220 - 2,101 х 89,9 < ц д - ц п < 220 + 2,101 х 89,9 и окончательно: 31<цд-цп <409.

Таким образом, 95% доверительный интервал среднего изменения диуреза составляет 31—409 мл. Иными словами, выбоИстинная величина эффекта200 -100

0

100 200 300 400 500 600

700

В

?4200 -100

0 100 200 300 400 500 600 700

Изменение суточного диуреза, мл

рочные данные позволяют с 95% надежностью утверждать, что препарат увеличивает диурез более чем на 31 мл, но менее чем на 409 мл. Как и следовало ожидать, истинное значение 200 мл находится в этом интервале.

Первый из рассчитанных нами доверительных

страница 25
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(20.01.2018)