медицинский каталог




Медико-биологическая статистика

Автор С.Гланц

диана и процентили, в отличие от среднего и стандартного отклонения, не дают полного описания распределения. Однако между 25-м и 75-м процентилями находится половина значений — значит, мы можем судить, каков ростом средний юпитерианин. По положению медианы относительно 25-го и 75-го процентилей можно судить о том, насколько асимметрично распределение. И наконец, теперь мы примерно знаем, кто на Юпитере считается высоким (выше 75-го проценти-ля), а кто ростом не вышел (ниже 25-го процентиля).

Для описания распределения чаще всего применяют 25-й и 75-й процентили. Однако можно рассчитывать любые другие процентили. Например, в качестве границ нормы лабораторных показателей часто используют 5-й и 95-й процентили.

Вычисление процентилей — хороший способ разобраться в том, насколько распределение близко к нормальному. Напомним, что для нормального распределения 95% значений заключено в пределах двух стандартных отклонений от среднего и 68% — в пределах одного стандартного отклонения; медиана совпадает со средним. Соответствие между процентилями и числом стандартных отклонений от среднего таково (см. также рис. 2.5):

Процентили Отклонения от среднего

2,5

16

50

84

97,5

ц — 2а ц — а

ц + а ц + 2а

Если соответствие между процентилями и отклонениями от среднего не слишком отличается от приведенного, то распределение близко к нормальному и его можно описать при помощи среднего и стандартного отклонения.

2,5

16

Процентили 50

84

97,5

Рис. 2.5. Нормальное распределение: соответствие между числом стандартных отклонений от среднего и процентилями.

Есть еще одна, и очень важная, причина, по которой нужно знать, близко ли распределение к нормальному. Дело в том, что многие методы проверки гипотез, в частности рассматриваемые в гл. 2, 4 и 9, основаны на предположении, что распределение близко к нормальному. Только в этом случае эти методы будут надежны. (Методы, не требующие нормальности распределения, изложены в гл. 10.)

ВЫБОРОЧНЫЕ ОЦЕНКИ

До сих пор нам удавалось получить данные обо всех объектах совокупности, поэтому мы могли точно рассчитать значения среднего, дисперсии и стандартного отклонения. На самом деле обследовать все объекты совокупности удается редко: обычно довольствуются изучением выборки, полагая, что эта выборка отражает свойства совокупности. Выборку, отражающую свойства совокупности, называют представительной. Имея дело с выборкой, мы, конечно, не узнаем точных значений среднего и стандартного отклонения, но можем оценить их. Оценка среднего, вычисленная по выборке, называется выборочным средним. Выборочное среднее обозначают X и вычисляют по формуле:

X

XX

п

где п — объем выборки.

Оценка стандартного отклонения называется выборочным стандартным отклонением (s) и определяется следующим образом:

Эта формула отличается от формулы для стандартного отклонения по совокупности. Во-первых, среднее \х заменяется его выборочной оценкой — X. Во-вторых, в знаменателе из числа членов выборки вычитается единица. Строгое обоснование последнего требует основательной математической подготовки, поэтому ограничимся следующим объяснением. Разброс значений в пределах выборки никогда не бывает столь большим, как во всей совокупности, и деление не на и, а на п-1 компенсирует возникающее занижение оценки стандартного отклонения.

Подытожим. Если известно, что выборка скорее всего принадлежит к совокупности с нормальным распределением, лучше всего использовать выборочное среднее и выборочное стандартное отклонение. Если есть основания полагать, что распределение в совокупности отличается от нормального, следует использовать медиану, 25-й и 75-й процентили.

НАСКОЛЬКО ТОЧНЫ ВЫБОРОЧНЫЕ ОЦЕНКИ

Выборочное среднее и выборочное стандартное отклонение есть оценки среднего и стандартного отклонения для совокупности, вычисленные по случайной выборке. Понятно, что разные выборки дадут разные оценки. Для характеристики точности выборочных оценок используют стандартную ошибку. Стандартную ошибку можно подсчитать для любого показателя, но сейчас мы остановимся на стандартной ошибке среднего — она позволяет

© © © © ©

©

О О

©

© О © О

Рис. 2.6. Три случайные выборки из одной совокупности дают три разных оценки среднего и стандартного отклонения.

оценить точность, с которой выборочное среднее характеризует значение среднего по всей совокупности.

На рис. 2.6А представлено уже знакомое нам распределение марсиан по росту. Мы уже знаем рост каждого марсианина. Посмотрим, что получится, если оценивать средний рост по выборке объемом, скажем, 10 марсиан.

Из 200 обитателей Марса наугад выберем 10 и пометим их черными кружками (рис. 2.6А). На рис. 2.6Б эта выборка изображена в виде, принятом в журнальных публикациях. Точка и два

?

О

о о о о о о о о о о о о

ООО

© о о о о •

о

о о

30

35

40

45

50

Рис. 2.7. Такое распределение мы получим, выбрав 25 раз по 10 марсиан из совокупности, представленной на рис. 2.6А, и рассчитав среднее для каждой выборки (средние для трех выборок с рис. 2.6 показаны заполненными кружками). Если построить распределение средних для всех возможных выборок, оно окажется нормальным. Среднее этого распределения будет равно среднему той совокупности, из которой извлекаются выборки. Стандартное отклонение этого распределения называется стандартной ошибкой среднего.

отрезка по бокам от нее изображают выборочное среднее (X = = 41,5 см) и выборочное стандартное отклонение (s = 3,8 см). Эти значения близки, но не равны среднему по совокупности (ц = 40 см) и стандартному отклонению (а = 5 см).

Извлечем еще одну случайную выборку того же объема. Результат показан на рис. 2.6В. На рис. 2.6А попавшие в эту выборку марсиане изображены заштрихованными кружками. Выборочное среднее (36 см) по-прежнему близко к среднему по совокупности, хотя и отличается от него; что касается выборочного стандартного отклонения (5 см), то на этот раз оно совпало со стандартным отклонением по совокупности.

На рис. 2.6Г представлена третья выборка. Попавшие в нее марсиане на рис. 2.6А изображены кружками с точками. Среднее и стандартное отклонение для этой выборки составляют соответственно 40 и 5 см.

Теперь пора поставить добычу случайных выборок на промышленную основу. Рассмотрим совокупность средних для каждой из возможных выборок по 10марсиан. Общее число таких выборок превышает 1016. Три из них мы уже обследовали. Средние по этим выборкам представлены на рис. 2.7 в виде заполненных кружков. Пустые кружки — это средние еще для 22 выборок. Итак, теперь каждому выборочному среднему соответствует кружок, точно так же, как до сих пор кружки соответствовали отдельному объекту.

Посмотрим на рис. 2.7. Набор из 25 выборочных средних имеет колоколообразное распределение, похожее на нормальное. Это не случайно. Можно доказать, что если переменная представляет собой сумму большого числа независимых переменных, то ее распределение стремится к нормальному, какими бы ни были распределения переменных, образующих сумму. Так как выборочное среднее определяется именно такой суммой, его распределение стремится к нормальному, причем чем больше объем выборок, тем точнее приближение. (Если выборки принадлежат совокупности с нормальным распределением, распределение выборочных средних будет нормальным независимо от объема выборок.)

Поскольку распределение на рис. 2.7 нормальное, его можно описать с помощью среднего и стандартного отклонения.

Так как среднее значение для рассматриваемых 25 точек есть среднее величин, которые сами являются средними значениями, обозначим его Х% . Аналогично, стандартное отклонение обозначим s%. По формулам для среднего и стандартного отклонения находим: Х% = 40 см и s% = 1,6 см.

Среднее выборочных средних Х% оказалось равно среднему [х всей совокупности из 200 марсиан. Ничего неожиданного в этом нет. Действительно, если бы мы провели исследования всех возможных выборок, то каждый из 200 марсиан был бы выбран равное число раз. Итак, среднее выборочных средних совпадет со средним по совокупности.

Интересно, равно ли s% стандартному отклонению а совокупности из 200 марсиан? Стандартное отклонение для совокупности выборочных среднихs% равно 1,6 см, а стандартное отклонение самой совокупности — 5 см. Почему s% меньше, чем а? В общих чертах это можно понять, если учесть, что в случайную выборку редко будут попадать одни только коротышки и одни гиганты. Чаще их будет примерно поровну, и отклонения роста от среднего будут сглаживаться. Даже в выборке, куда попадут 10 самых высоких марсиан, средний рост составит только 50 см, тогда как рост самого высокого марсианина — 53 см.

Подобно тому как стандартное отклонение исходной выбор

ки из 10 марсиан s служит оценкой изменчивости роста марсиан, s% является оценкой изменчивости значений средних для выборок по 10 марсиан в каждой. Таким образом, величина s% служит мерой точности, с которой выборочное среднее X является оценкой среднего по совокупности ц. Поэтому s% носит название стандартной ошибки среднего.

Чем больше выборка, тем точнее оценка среднего и тем меньше его стандартная ошибка. Чем больше изменчивость исходной совокупности, тем больше изменчивость выборочных средних; поэтому стандартная ошибка среднего возрастает с увеличением стандартного отклонения совокупности.

Истинная стандартная ошибка среднего по выборкам объемом п, извлеченным из совокупности, имеющей стандартное отклонение а, равна*:

Собственно стандартная ошибка — это наилучшая оценка величины а у по одной выборке:

s

X

где s — выборочное стандартное отклонение.

Так как возможные значения выборочного среднего стремятся к нормальному распределению, истинное среднее по совокупности примерно в 95% случаев лежит в пределах 2 стандартных ошибок выборочного среднего.

* Вывод этой формулы приведен в гл. 4.

Как уже говорилось, распределение выборочных средних приближенно всегда следует нормальному распределению независимо от распределения совокупности, из которой извлечены выборки. В этом и состоит суть утверждения, называемого

страница 5
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

Скачать книгу "Медико-биологическая статистика" (7.41Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]


Химический каталог Rambler's Top100

Copyright © 2009
(23.06.2018)