Методические особенности применения t-критерия Стьюдента в медико-биологических исследованиях

Тип работы:
Реферат
Предмет:
Медицина


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 614. 1
В.П. Ильин
МЕТОДИЧЕСКИЕ ОСОБЕННОСТИ ПРИМЕНЕНИЯ Т-КРИТЕРИЯ СТЬЮДЕНТА В МЕДИКО-БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ
Учреждение Российской академии медицинских наук Научный центр проблем здоровья семьи
и репродукции человека Сибирского отделения РАМН (Иркутск)
В работе приводятся методические особенности применения в медико-биологических исследованиях параметрического t-критерия Стьюдента в связных и несвязных выборках для. количественных переменных, включающих оценку типа распределения, сравнение дисперсий и средних в двух и более группах. Ключевые слова: тип распределения, связные и несвязные выборки, критерии х2, t-критерий Стьюдента, F-критерий Фишера, множественные сравнения
METHODICAL ASPECTS OF USE STUDENT’S T-CRITERION IN BIOMEDICAL RESEARCH STUDIES
V.P. Iljin
Scientific Center of Family Health Problems and Human Reproduction SB RAMS, Irkutsk
The article presents methodical peculiarities of use of parametric Student'-s t-criterion in biomedical studies in apparent and non-apparent samples for quantitative variables, including estimation of distribution type, comparison of dispersions and averages in two and. more groups.
Key words: distribution type, apparent and non-apparent samples, х2 criteria, Student’s t-criteria,
Fisher'-s F-criteria
В настоящее время ощущается настоятельная потребность в критическом осмыслении корректности применения статистических методов как основы доказательности выводов и трактовки результатов, полученных в медико-биологических исследованиях. Актуальность данной работы обусловлена несколькими причинами. Одна из них связана с увеличением числа работ, выполняемых соискателями, которые, как правило, не имеют должного математического образования, понимания и умения, а чаще лишь осознают необходимость в применении разнообразных математических приемов доказательства. Второй существенной причиной является доступность и легкость использования самих статистических методов, реализованных в различных программных продуктах. Поэтому только ленивый не преминёт их использовать в украшении своей работы. В итоге мы имеем то, что имеем: соискатели играючи вставляют в свои работы различные статистические критерии без должной научной проработки проблемы применения статистических методов.
Применять статистические методы в исследовательских работах необходимо, но при этом важно понимать методические основы и возможности применения методов параметрического, непараметрического анализов и использовать эти методы корректно! Выбор методов анализа зависит от шкалы, в которой замерены изучаемые переменные, и законов распределения наблюдаемых величин. Непрерывные переменные (такие, как концентрация различных веществ, артериальное давление и т. д.) допускают изучение параметров распределения положения (средних, медиан, …) и рассеяния (дисперсий, стандартных отклонений), а категориальные и порядковые переменные требуют иных методов (непараметрических или таблиц сопряженности).
Исторически сложилось так, что измерительные, вычислительные и доказательные статистические методы анализа непрерывных переменных разрабатывались и применяются в настоящее время на основе нормального распределения, как доказано для достаточно больших по объему выборок и распределений, близких к нему и имеющих умеренные отклонения от нормального значения [1, 2, 3, 4, 5, 6].
Распространенными методами описания выборки и последующего сравнения двух и более выборок в медико-биологических исследованиях являются параметрические методы, предполагающие редукцию информацию, т. е. свертку первичных исходных данных, представляющих в дескриптивном виде набор параметров, адекватно заменяющих первичные данные, позволяющих проводить сравнение параметров, наиболее полно описывающих распределения переменной. Распределение описывается положением центра (среднее выборки, медиана, …) и удалением отдельных значений от центра (рассеянием, дисперсией). Среднее значение и стандартное отклонение суть характеристики гауссовой кривой или нормального распределения. В соответствии с законом больших чисел Бернулли, при достаточно большом объеме наблюдений (критерием оценки является сходимость по вероятности) выборочные среднее и дисперсия являются состоятельными оценками параметров распределения. Смысл этого этапа заключается в замене реальных данных, полученных в исследовании, моделью нормального распределения, имеющего конкретные значения средней величины и дисперсии, т. е. двух параметров, определяющих некую кривую нормального распределения из бесконечного множества кривых нормального распределения. Критериев оценки близости (согласия) реальных
данных кривой нормального распределения, полученной в исследовании по значениям среднего и дисперсии, достаточно много. Наиболее известные из них — х2 и критерий Колмогорова — Смирнова. Можно также провести сравнения по коэффициентам асимметрии и эксцесса.
Если по одному из критериев согласия принята гипотеза о нормальности распределения, то с этого момента реальные данные заменены на параметрическую модель, имеющую значения параметров распределения, полученных в реальном исследовании. Дальше проводится сравнение групп между собой по значениям параметров распределений, как правило, по средним и дисперсиям изучаемых выборок с учетом их численности. Критериев сравнения существует множество. Наиболее известные: t-критерий Стьюдента сравнения средних величин и F-критерий Фишера сравнения дисперсий. Известно [1], что t-критерий является робастным, т. е. малочувствительным к умеренным отклонениям от нормальности. Из этого следует, что одна и та же кривая нормального распределения может быть сопоставлена множеству реальных наблюдаемых данных, мало отличающихся друг от друга. При этом очень важно, чтобы сравниваемая переменная величина была измерена в метрической шкале. Умеренное отклонение исходной переменной от нормальности, тем не менее, означает наличие симметрии распределения, отсутствие нескольких «горбов» и «выскакивающих» значений. Принципиальным условием оценки средних является заключение о равенстве или неравенстве дисперсий. Одна из двух гипотез (нулевая о равенстве групповых средних или альтернативная о различии групповых средних) по t-критерию Стьюдента принимается при отсутствии различий дисперсий. Случай сравнения средних при неравенстве дисперсий представляет собой известную проблему Фишера — Беренса [4]. В этом случае рекомендуется применять критерии Уэлча (Welch) либо методы дисперсионного анализа (критерии Тьюки) [2, 4].
Какие тонкости существуют на этапе сравнения параметров распределения? Следует различать выборки по взаимному соотношению: независимые и зависимые выборки. Примером независимых выборок может служить сравнение показателей группы здоровых с группой больных. В этом случае необходимо применять t-критерий Стьюдента для независимых выборок. Примером зависимых выборок служит сравнение группы пациентов до лечения с этой же группой пациентов после лечения. При зависимых выборках стандартные отклонения, как правило, уменьшаются, а разница средних увеличивается. В этом случае необходимо применять t-критерий Стьюдента для зависимых выборок, более тонко учитывающий парные изменения [2, 3, 4, 6].
Особый случай представляет сравнение среднего значения показателя в группе с некоторой
константой, выражающей норму или табличное значение. В этом случае применяется одновыборочный t-критерий Стьюдента [4, 6].
К особенностям применения t-критерия Стьюдента следует отнести множественные сравнения: когда выявляются попарные различия более чем в двух выборках. При многократном попарном сравнении вероятность ошибочно найти различия там, где их нет, значительно возрастает. В этом случае необходима коррекция числа степеней свободы и критического уровня значимости по формулам Бонферрони:
n1 = n х m / 2- a1 = a / k, где: n — исходное число степеней свободы, m — число сравниваемых выборок, a — исходный уровень значимости, k — число сравнений. Поправка Бонферрони применима при числе групп менее 6. В противном случае рекомендуется метод Шеффе однофакторного дисперсионного анализа [3, 4, 6].
Таким образом, применение t-критерия Стьюдента для сравнения средних значений не является тривиальной одношаговой процедурой. Для корректного применения этого критерия необходимо провести несколько подготовительных шагов, включающих проверку симметрии распределения, отсутствие выскакивающих значений и многих горбов, оценить распределение на предмет близости к нормальному, сравнить дисперсии, выбрать нужный вариант t-критерия Стьюдента одновыборочный или для зависимых, независимых групп- при сравнении более двух групп — вычислить поправки Бонферрони. Из этого следует, что применению t-критерия Стьюдента предшествует вычисление хотя бы двух критериев: согласия х2 и F-критерия Фишера сравнения дисперсий. Если в научной работе приводится только один t-критерий Стьюдента, то, скорее всего, работа выполнена некорректно с точки зрения доказательных методов.
ЛИТЕРАТУРА
1. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ- пер. с англ. — М.: Мир, 1982. — 488 с.
2. Боровиков В. Statistica: искусство анализа данных на компьютере. Для профессионалов. — СПб.: Питер, 2001. — 656 с.
3. Гланц С. Медико-биологическая статистика- пер. с англ. — М.: Практика, 1998. — 459 с.
4. Закс Л. Статистическое оценивание- пер. с нем. В. Н. Варыгина / под ред. Ю. П. Адлера, В. Г. Горского. — М.: Статистика, 1976. — 598 с.
5. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия- пер. с англ. Ю. Н. Благовещенского. — М.: Финансы и статистика, 1982. — 317 с.
6. Реброва О. Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. — М.: Медиасфера, 2002. — 312 с.
Сведения об авторах
Ильин Владимир Петрович — доктор биологических наук, профессор, ведущий научный сотрудник Научного центра проблем здоровья семьи и репродукции человека СО РАМН (664 000, г Иркутск, ул. Тимирязева, 16- тел.: 8 (3952) 20-74-05)

ПоказатьСвернуть
Заполнить форму текущей работой