медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

Оценим статистическую значимость корреляции.

Критическое значение tom при числе степеней свободы v = 39-2 = 37 равно 3,574, то есть меньше полученного нами. Таким образом, при уровне значимости 0,001 можно утверждать, что существует корреляция между потреблением животных жиров и смертностью от рака молочной железы.

Теперь проверим, связана ли смертность с потреблением растительных жиров? Соответствующие данные приведены на рис. 8.12Б. Коэффициент корреляции равен 0,15. Тогда

t =

= 0,92.

Даже при уровне значимости 0,10 вычисленное значение t меньше критического. Корреляция статистически не значима.

Таким образом, риск рака молочной железы статистически значимо связан с потреблением животных, но не растительных жиров. Значит ли это, что животный жир способствует развитию рака молочной железы? Пока нет. Ведь обе рассматриваемые переменные могут зависеть от какой-то третьей. В обсервацион* К. К. Carroll. Experimental evidence of dietary factors and hormone-dependent cancers. Cancer Res., 35:3375—3383, 1975.

el О

is

0) о о о

>2 к о

О тсв

о х

СО р) О 0)

?5

со * z >s

5 °

5 1 ю т

о о 2 ^

а 2 л л

я Q25 15 ? Нидерланды

Великобритания

Канада • Т. *

Дания w

Швейцария • Бельгия # Ирландия Новая

• • Зеландия

США

,,, • Австралия

Германия. • Швеция

Италия *

Австрия» # Норвегия

• Франция

* Португалия

^Гонконг

-1или

Венесуэла* • » Pyi Панама* Греция* *iqi

Чехословакия*

• Финляндия

Венгрия*

Болгария •

•_• Чили

мыния Югославия Испания

Польша

• Пуэрто-Рико

Филиппины • Колумбия • * Мексика л • Тайвань Цевлон Япония

Таиланд

• • Сальвадор

20

40

60

80

100

120

140

160

Потребление животных жиров на душу населения, г/сут

Рис. 8.12. Смертность от рака молочной железы и потребление жиров на душу населения в разных странах. А. Потребление животных жиров. Б. Потребление растительных жиров. Связь смертности с потреблением животных жиров достаточно отчетлива, чего не скажешь о связи с потреблением растительных жиров.

ном исследовании, каковым является работа Кэррола, такую возможность отвергнуть нельзя*. Однако экспериментальные данные, о которых мы упомянули выше, — сильный аргумент в пользу именно причинно-следственной связи.

Вообще истолкование результатов регрессионного и корреляционного анализа зависит от того, в каком исследовании были получены данные — обсервационном или экспериментальном. Если мы обнаружили связь переменных в обсервационном исследовании, то это не значит, что одна из них влияет на другую. Возможно, их согласованные изменения — результат действия какого-то неизвестного нам фактора. В экспериментальном исследовании, произвольно меняя одну из переменных, мы можем быть уверены, что связь, если она будет выявлена, является причинной. Впрочем, осторожность не помешает и в этом случае. В самом деле, трудно менять только одну переменную. Увеличивая содержание жира в рационе, мы либо увеличиваем общую калорийность, либо снижаем содержание белков и углеводов. Кто поручится, что канцерогенное действие оказывает именно жир, а не дисбаланс питательных веществ?

КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА

* Например, исследования показывают, что заболеваемость раком молочной железы связана с уровнем доходов, числом автомобилей и телевизоров в семье. (В. S. Drasar, D. Irving. Environmental factors and cancer of the colon and breast. Br. J. Cancer, 27:167—172, 1973.) Ho значит ли это, что, покупая новый автомобиль, домашняя хозяйка увеличивает риск заболеть раком молочной железы? На основании таких данных мы вправе только предположить, что какой-то фактор, связанный с уровнем жизни, влияет на риск рака молочной железы, но не можем точно указать этот фактор.

Расчет коэффициента корреляции возможен при тех же условиях, что и регрессионный анализ. Это прежде всего линейность связи переменных и нормальность распределения. Эти условия выполняются далеко не всегда. Кроме того, в клинических исследованиях мы часто имеем дело с порядковыми признаками, а к ним ни регрессионный анализ, ни расчет коэффициента корреляци, разумеется, неприменим. В подобных случаях следует воспользоваться коэффициентом ранговой корреляции Спирмена*. Это непараметрический метод — он не требует нормальности распределения; не требует он и линейной зависимости, его можно применять как к количественным, так и к порядковым признакам**.

Идея коэффициента ранговой корреляции Спирмена (его обозначают rs) проста. Нужно упорядочить данные по возрастанию и заменить реальные значения их рангами. Рангом значения называется его номер в упорядоченном ряду. Например, в ряду 1,4, 8, 8, 12 ранг числа 4 равен 2. Затем, беря вместо самих значений их ранги, рассчитывают обычный коэффициент корреляции Пирсона. Это и будет коэффициент ранговой корреляции Спирмена. Его можно рассчитать и проще:

, 6ld2

rs =1—5 ,

п -п

где d — разность рангов для каждого члена выборки.

* Упомянем также коэффициент ранговой корреляции Кендалла, обозначаемый т. В отличие от коэффициента ранговой корреляции Спирмена он может быть обобщен для случая нескольких независимых переменных. Заключения, основанные на использовании обоих коэффициентов, одинаковы, хотя числовые значения коэффициентов не совпадают. О коэффициенте ранговой корреляции Кендалла можно прочесть в книге: S. Siegel, N. J. Castellar. Non-parametric statistics for the behavioral sciences (2d ed.). McGraw-Hill, New York, 1988.

** Если параметрические методы, требующие нормального распределения, применить к данным с иным типом рапределения, это приведет к ошибочному заключению. Напротив, непараметрические методы можно смело применять и в случае нормального распределения. Однако тогда чувствительность их будет несколько ниже чувствительности параметрических методов. Что касается коэффициента ранговой корреляции Спирмена, то он и в этом случае проигрывает коэффициенту корреляции Пирсона весьма незначительно.

Как быть, если в ряду встретятся одинаковые значения? Скажем, в приведенном примере это две восьмерки. Им следует

присвоить один и тот же ранг, равный среднему занимаемых ими мест: (3 + 4)/2 = 3,5. Рангом стоящего за ними числа 12 будет 5.

Посмотрим, как вычислить rs для знакомой нам выборки из 10 марсиан (табл. 8.5). Вначале упорядочим по возрастанию значения каждой из переменных. Ранг 1 присваивается меньшему значению, 10 — большему. Упорядочим марсиан по росту. На 5-м и 6-м месте в нем стоят одинаковые значения. Присвоим им общий ранг (5 + 6)/2 =5,5. Затем упорядочим марсиан по весу и для каждого марсианина вычислим разность рангов роста и веса.

Наконец, вычислим коэффициент ранговой корреляции Спирмена:

6[(-1)2 + (-1)2 + 22 + О2 + 0,52 + (-0,5)2 + О2 + О2 + О2 ] _

103- 10

= 0,96.

Обратимся к таблице 8.6, где приведены критические значения коэффициента ранговой корреляции Спирмена для разных уровней значимости и объемов выборки. Критическое значение для уровня значимости 0,001 и объема выборки п = 10 равно 0,903, что меньше полученного нами. Тем самым, корреляция статистически значима (Р < 0,001).

Если объем выборки больше 50, нужно применить критерий Стьюдента:

с числом степеней свободы v = п -2.

В данном случае связь веса и роста можно было установить и без помощи коэффициента ранговой корреляции Спирмена. Применение обычного коэффициента корреляции, как мы видели, приводит к тем же результатам.

Сколько лабораторных анализов нужно врачу?

* S. A. Schroeder, A. Schliftman, Т. Е. Piemine. Variation among physicians in use of laboratory tests: relation to quality of care. Med. Care, 12: 709-713, 1974.

В первые дни пребывания в больнице больному обычно делают множество дорогостоящих анализов. Всели из них необходимы? Шредер с коллегами* попытались, анализируя работу 21 врача, выяснить, существует ли связь между квалификацией врача и стоимостью необходимых ему анализов. Прежде всего, специальная комиссия оценила квалификацию каждого врача. Каждому из врачей присвоили ранг от 1 (лучшая квалификация) до

21 (худшая квалификация). Затем была подсчитана средняя стоимость анализов, которые потребовались каждому из врачей за первые 3 суток пребывания больного в клинике. Эти данные упорядочили по возрастанию; наименьшей стоимости присвоили ранг 1, наибольшей — 21.

В результате каждому врачу была присвоена пара рангов — ранг по шкале квалификации и ранг по шкале расходов. Эти пары представлены на рис. 8.13. Остается выяснить связь между квалификацией врача и величиной расходов на необходимые ему анализы. Вычислив коэффициент Спирмена, получим всего лишь rs = -0,13. Абсолютная величина rs оказалась меньше критического значения даже при уровне значимости а = 0,05 (критическое значение г005 = 0,435).

Однако значит ли это, что не существует связи между квалификацией врача и затратами на анализы? Нет. Связь существует, но она не линейная. Присмотревшись к рис. 8.13, можно заметить, что самыми дешевыми анализы были у лучших и... худших врачей. И тем и другим, чтобы уверенно судить о болезни, не требуется много анализов. Причем, похоже, большей уверенностью отличаются именно худшие специалисты.

Но почему эта связь не была уловлена коэффициентом корреляции? Исключительно из-за ее нелинейной формы. Ни один из коэффициентов корреляции не сможет уловить зависимость, график которой — перевернутая U-образная кривая с рис. 8.13.

Этот пример показывает, что, прежде чем применять какие-либо методы анализа связей, следует примерно определить, какой может быть форма зависимости. Лучший способ для этого — просто нарисовать график, подобный изображенному на рис. 8.13.

ЧУВСТВИТЕЛЬНОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Как уже говорилось, из статистической значимости коэффициента корреляции вытекает статистическая значимость коэффициента наклона. Ограничимся поэтому вычислением чувствительности коэффициента корреляции. Можно показать, что величина

03

о

X

с; та х то

5 Н

и о

Ъ S

о ь и

а> с;

о с

X

га О.

i г

21

Ранг по шкале квалификации

Рис. 8.13. А. Квалифи

страница 33
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(21.09.2018)