медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

от среднего, поэтому их разность еще больше отклоняется от среднего, чем они сами.

Продолжим рассматривать рис. 4.3. Все пары извлекали из одной совокупности. Ее дисперсия равна 1. В таком случае дисперсия разностей будет

2 2 2

GХ-У — СУ ^ + СУу =1 + 1=2.

Стандартное отклонение есть квадратный корень из дисперсии. Поэтому стандартное отклонение разностей равно V2, то есть больше стандартного отклонения исходной совокупности примерно на 40%, как и получилось в нашем примере.

Чтобы оценить дисперсию разности членов двух совокупностей по выборочным данным, нужно в приведенной выше формуле заменить дисперсии их выборочными оценками:

2 _ 2 2 SX-Y = SX + SYЭтой формулой можно воспользоваться и для оценки стандартной ошибки разности выборочных средних. В самом деле, стандартная ошибка выборочного среднего — это стандартное отклонение совокупности средних значений всех выборок объемом п. Поэтому

Тем самым, искомая стандартная ошибка разности средних

ь мы можем вычислить отношение t.

КРИТИЧЕСКОЕ ЗНАЧЕНИЕ t

Напомним, что мы рассматриваем отношение Разность выборочных средних

Стандартная ошибка разности выборочных средних Воспользовавшись результатом предыдущего раздела, имеем

Если ошибку среднего выразить через выборочное стандартное отклонение, получим другую запись этой формулы:

где п — объем выборки.

Если обе выборки извлечены из одной совокупности, то выборочные дисперсии s\ и s\ — это оценки одной и той же дис-Персии а . Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется как

2 2 2 _ Sf +S2

Значение /, полученное на основе объединенной оценки:

X \ — Хt =

2 2 S S

+

п п

Если объем выборок одинаков, оба способа вычисления / дадут одинаковый результат. Однако если объем выборок разный, то это не так. Вскоре мы увидим, почему важно вычислять объединенную оценку дисперсии, а пока посмотрим, какие значения

/ мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.

Так как выборочные средние обычно близки к среднему по совокупности, значение / будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значения / (вспомним опыты с F в предыдущей главе). Чтобы понять, какую величину / следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент, подобный тому, что мы делали в предыдущей главе. Вернемся к испытаниям предполагаемого диуретика. Допустим, что в действительности препарат не оказывает диуретического действия. Тогда и контрольную группу, которая получает плацебо, и экспериментальную, которая получает препарат, можно считать случайными выборками из одной совокупности. Пусть это будет совокупность из 200 человек, представленная на рис. 4.4А. Члены контрольной и экспериментальной групп различаются штриховкой. В нижней части рисунка данные по этим двум выборкам показаны так, как их видит исследователь. Взглянув на эти данные, трудно подумать, что препарат — диуретик. Полученное по этим выборкам значение / равно -0,2.

Разумеется, с не меньшим успехом можно было бы извлечь любую другую пару выборок, что и сделано на рис. 4.4Б. Как и следовало ожидать, две новые выборки отличаются как друг от друга, так и от извлеченных ранее (рис. 4.4А). Интересно, что на этот раз нам «повезло» — средний диурез довольно сильно различается. Соответствующее значение t равно -2,1. На рис. 4.4В изображена еще одна пара выборок. Они отличаются друг от друга и от выборок с рис. 4.4А и 4.4Б. Значение г для них равно 0.

Разных пар выборок можно извлечь более 1027. На рис. 4.5А приведено распределение значений /, вычисленных по 200 парам выборок. По нему уже можно судить о распределении /. Оно симметрично относительно нуля, поскольку любую из пары выборок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю; значения, меньшие -2 и большие +2, встречаются редко.

На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев) / меньше -2,1 или больше+2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение

Суточный диурез, мл

Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препарат не обладает диуретическим действием, поэтому обе группы — просто две случайные выборки из совокупности, показанной в верхней части рисунка. Члены совокупности, которым посчастливилось принять участие в исследовании, помечены штриховкой. В нижней части рисунка данные показаны такими, какими их видит исследователь. Вряд ли он решит, что препарат — диуретик: средний диурез в группах различается очень незначительно. Б. Исследователю могла бы попасться и такая пара выборок. В этом случае он наверняка счел бы препарат диуретиком. В. Еще две выборки из той же совокупности.

t лежит вне интервала от -2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение принимает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5% крайних значений соответствуют закрашенным областям графика левее -2,1 и правее +2,1. Итак, мы нашли, что если две выборки извлечены из одной и той же совокупности, то вероятность получить значение /, большее +2,1 или меньшее -2,1, составляет всего 5%. Следовательно, если значение t находится вне

Рис. 4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Значения t для трех пар выборок с рис. 4.4 помечены черным. Большая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1, составляет 5%. В. Продолжая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихованные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно, «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в 5% случаев мы будем находить различия там, где их нет. Чтобы снизить вероятность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от общей площади под кривой, критическое значение должно составлять 2,878.

интервала от -2,1 до +2,1, нулевую гипотезу следует отклонить, а наблюдаемые различия признать статистически значимыми.

Обратите внимание, что таким образом мы выявляем отличия экспериментальной группы от контрольной как в меньшую, так и в большую сторону — именно поэтому мы отвергаем нулевую гипотезу как при / < -2,1, так и при / > +2,1. Этот вариант критерия Стьюдента называется двусторонним; именно его обычно и используют. Существует и односторонний вариант критерия Стьюдента. Используется он гораздо реже, и в дальнейшем, говоря о критерии Стьюдента, мы будем иметь в виду двусторонний вариант.

Вернемся к рис. 4.4Б. На нем показаны две случайные выборки из одной и той же совокупности, при этом t = -2,2. Как мы только что выяснили, нам следует отвергнуть нулевую гипотезу и признать исследуемый препарат диуретиком, что, самой собой, неверно. Хотя все расчеты были выполнены правильно, вывод ошибочен. Увы, такие случаи возможны.

Разберемся подробнее. Если значение / меньше -2,1 или больше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши группы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые различия (или более сильные) равна 0,05. Следовательно, ошибочный вывод о существовании различий мы будем делать в 5% случаев. Один из таких случаев и показан на рис. 4.4Б.

Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а, скажем, 0,01. Тогда, как видно из рис. 4.5Г, мы должны отвергать нулевую гипотезу при t < -2,88 или t > +2,88. Теперь-то рис. 4.4Б нас не проведет — мы не признаем подобные различия статистически значимыми. Однако, во-первых, ошибочные выводы о существовании различий все же не исключены, просто их вероятность снизилась до 1%, и, во-вторых, вероятность не найти различий там, где они есть, теперь повысилась. О последней проблеме подробнее мы поговорим в гл. 6.

Критические значения t (подобно критическим значениям F, они сведены в таблицу) зависят не только от уровня значимости, но и от числа степеней свободы v. Если объем обеих выбоСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА 95

Таблица 4.1. Окончание

Уровень значимости

J. Н. Zar. Biostatistical analysis (2 ed.). Prentice-Hall, Englewood Cliffs, N. J., 1984.

рок — n, то число степеней свободы для критерия Стьюдента равно 2 (п -1). Чем больше объем выборок, тем меньше критическое значение t. Это и понятно — чем больше выборка, тем менее выборочные оценки зависят от случайных отклонений и тем точнее представляют исходную совокупность.

ВЫБОРКИ ПРОИЗВОЛЬНОГО ОБЪЕМА

Критерий Стьюдента легко обобщается на случай, когда выборки содержат неодинаковое число членов. Напомним, что по определению

Х] - Х2

t =

/4.+ 4,

где s% и — стандартные ошибки средних для двух выборок. Если объем первой выборки равен щ, а объем второй — п2, то

Л „2

2 s\ 2 s2

SY = И4 = '

А| «1 Хг П2

где s] и s2 — стандартные отклонения выборок. Перепишем определение t, используя выборочные стандартные отклонения:

Объединенная оценка дисперсии для выборок объема и, и п2 равна

^2 =(rh-\)S2 +(«2-1)522

П\ + п2 - 2

я, «2

Тогда _ X, - Х2

Это определение / для выборок произвольного объема. Число степеней свободы v = «, +п2 -2.

Заметим, что если объемы выбор

страница 12
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(20.07.2018)