Аналитическая биостатистика.
Теоретическое обоснование статистических тестов

Тип работы:
Реферат
Предмет:
Медицина


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Аналитическая биостатистика. Теоретическое обоснование статистических тестов
Серпик В. Г., Ягудина Р. И.
Кафедра организации лекарственного обеспечения и фармакоэкономики Первого МГМУ им. И. М. Сеченова, г. Москва
Настоящая статья логически продолжает и развивает тему «Применение биостатистики в фармакоэкономике», которая была рассмотрена в журнале «Фармакоэкономика» № 2 2009 г. После проведения первичной статистической обработки данных — группирования данных (отбора элементов выборки), определения точечных оценок (средняя, мода, медиана) и оценок вариации (размах колебаний, среднее линейное отклонение, дисперсия, стандартное отклонение, размах квартилей) — возникает необходимость ответить на вопрос: «Какой вывод можно сделать из полученных данных?» или, другими словами, «О чем это говорит?». Решение данного вопроса является предметом дисциплины аналитической биостатистики.
Аналитическая биостатистика (Inferential biostatistics) — это раздел биостатистики, решающий задачу получения статистических выводов на основе собранной и систематизированной информации об объекте исследования. При первом рассмотрении необходимость данной дисциплины может показаться излишней, как и самого вопроса о формулировании вывода из полученных данных. Так, изучим гипотетический пример сравнительного фармакоэкономического исследования двух лекарственных средств (ЛС) для снижения веса: А и Б. Предположим, что исследование проводилось методом анализа «затраты-эффективность», а в качестве показателя эффективности был выбран параметр снижения индекса массы тела (ИМТ). Пусть, снижение ИМТ (средняя снижения ИМТ) для ЛС, А составило 1 единицу, а для ЛС Б — 2 единицы. В этом случае, не испытывая затруднений, можно сделать вывод, что ЛС, А эффективнее ЛС Б. Однако есть возможность того, что данные по эффективности будут иметь другие значения: например, для ЛС, А средняя снижения ИМТ будет составлять 1 единицу, а для ЛС Б — 0,999 единицы. В данной ситуации, на основе имеющейся об эффективности информации, затруднительно сделать какой-либо вывод. Возникает вопрос: разницей в 0,001 единицы можно пренебречь и в этом случае считать, что анализируемые
ЛС имеют одинаковую эффективность, или же указанная разница в эффективности значима, и тогда ЛС, А будет эффективнее ЛС Б? Последний вариант сюжета приведенного примера демонстрирует необходимость стандартизованного подхода к формулированию выводов по имеющимся данным, которые в соответствии с принципами доказательной медицины опирались бы не на умозрительные заключения и экспертные мнения, а на формализованную процедуру принятия решений. Такой процедурой являются статистические тесты, представляющие собой инструмент аналитической биостатистики.
В прикладной фармакоэкономике применение аналитической биостатистики определяется дизайном фармакоэкономического исследования. В случае проспективного дизайна, когда данные для исследования поступают в режиме реального времени, на специалиста, проводящего фармакоэкономическое исследование, может быть возложена обязанность проведения статистического анализа получаемых данных, включая как первичную статистическую обработку, так и проведение статистических тестов. Ретроспективный дизайн фармакоэкономического исследования, как правило, подразумевает поиск и анализ информации о результатах проведенных ранее исследований. Соответственно, в ретроспективных фармакоэкономических исследованиях критическим этапом, определяющим качество всего дальнейшего исследования, является выбор данных и перенос их в проводимое исследование. При этом данные, с которыми работает исследователь, имеют вид отчетов соответствующих клинических и фармакоэкономических исследований (т.е. данные, которые прошли статистическую обработку). Таким образом специалисту, выполняющему фарма-коэкономическое исследование, не требуется самому проводить статистический анализ данных, однако для качественного и обоснованного переноса данных в свое исследование ему необходимы знания и умение читать отчеты проведенных исследований, в т. ч. и ту часть отчета, в которой излагается описание проведенной
статистической обработки и использованных статических тестов. Понимание последнего позволяет критически оценивать принципы, на основе которых интерпретировались первичные данные, и, следовательно, определять возможность использования приведенных в отчете вторичных данных в своей работе. Последнее положение можно проиллюстрировать приведенным выше примером об анализе эффективности ЛС для снижения веса. Предположим, что специалист, проводящий фармакоэкономическое исследование, планирует использовать результаты анализа эффективности (который сам не проводил) в своем исследовании. При принятии решения об использовании результатов анализа эффективности возникает вопрос о его допустимости. Ответить на поставленный вопрос, поможет изучение использованного в ходе анализа эффективности статистического теста, т. к. выводы, полученные с применением одних статистических тестов, могут широко использоваться, в то время как заключения по первичным данным, полученные на основе использования других статистических тестов, имеют ограниченное применение.
Отдельным случаем следует выделить задачу проведения метаанализа, например, при написании обзора имеющихся фармакоэ-кономических/клинических исследований по заданной проблематике, при котором фактически осуществляется статистический анализ результатов исследований (рис. 1).
Также необходимо обратить внимание на существующую в современной медицине проблему качества проведения статистической обработки исследований. Многие авторы, изучающие данную проблему, отмечают недостаточный уровень образования медицинских работников в области биостатистики, что приводит к неправильному использованию инструментов биостатистики (в т. ч. и статистических тестов), в результате чего формулируются некорректные заключения о полученных данных [1, 10]. Учитывая данный факт, целью настоящей статьи является введение в основы аналитической биостатистики с целью создания у читателей представления о механизме действия статистических тестов и первичной подготовки их к чтению специализированной лите-
ратуры. Авторы рекомендуют читателям в случае необходимости перед работой со специализированной литературой обратиться к стандартному университетскому курсу высшей математики с целью восстановления навыков работы с математическим аппаратом, т. к. в данной статье математическое описание предоставляемой информации будет минимальным.
Аналитическая статистика располагает богатым набором методов, позволяющих решить основную задачу, стоящую перед данной дисциплиной — принятие формально обоснованного вывода на основе имеющихся данных. К основным методам аналитической статистики (формальным процедурам принятия решения) относят следующие:
• статистический тест-
• корреляционный анализ-
• регрессионный анализ-
• экстраполяцию-
• интерполяцию-
• моделирование (ANOVA, анализ временных рядов и т. д.).
Статистический тест (statistical test) — процедура, применяемая к количественным данным выборки для вычисления возможной истинности статистической гипотезы. План проведения статистического теста можно представить следующим образом:
1. Формулируется задача исследования в виде статистической гипотезы-
2. Выбирается статистическая характеристика гипотезы (выбирается подходящий статистический тест) —
3. Определяются область допустимых значений, критическая область, а также критическое значение статистического критерия по соответствующей таблице-
4. Вычисляется фактическое значение статистического критерия-
5. Проверяется испытуемая гипотеза на основе сравнения фактического и критического значений критерия, и в зависимости от результатов проверки гипотеза принимается либо не принимается.
Получение
данных РКИ 1*
Первичная статистическая
обработка (описательная
статистика)
Вторичная статистическая обработка — статистический анализ (аналитическая ________статистика)________
Получение
данных РКИ II
Первичная статистическая
обработка (описательная
статистика)
Вторичная статистическая обработка — статистический анализ (аналитическая статистика)
Результат РКИ I
Результат РКИ II
Мета-анализ-статистический анализ результатов нескольких
исследований
*РКИ — рандомизированное клиническое исследование
Рисунок 1. Применение статистики в медицине
Формулирование нулевой и альтернативной гипотезы
Первым этапом построения статистических тестов является постановка и формулирование задачи статистического анализа. При проведении клинических/фармакоэкономических исследований получаются различные данные (для достижения разнообразных целей), в связи с чем появляется необходимость формализовать эти цели, привести к общему единообразному виду.
Формализация цели каждого конкретного исследования в биостатистике происходит посредством постановки задачи проверки гипотез. При этом всегда формулируется две гипотезы:
Формальная запись гипотез:
Нулевая
¦ Альтернативная
Ho: М = Мп
Hi: М ф II"
Запись нулевой гипотезы (Nullhypothesis) читается следующим образом: «нулевая гипотеза (H0) заключается в том, что значение средней генеральной совокупности (|j) равно j0». Если нулевая гипотеза не принимается, то не отвергается альтернативная гипотеза (Alternative hypothesis): «альтернативная гипотеза (Н^ заключается в том, что генеральная средняя (j) не равна j0. (в данном случае употребляются выражения „не принимается“ и „не отвергается“, т. к. некорректно говорить с полной уверенностью
о принятии/отказе от гипотезы. Возможно лишь заключения с определенной долей достоверности1).
Рассмотрим постановку задачи проверки гипотез на предыдущем примере.
Формальная запись гипотез:
Нулевая
¦ Альтернативная
Н0: ХА = ХБ
H: Хд Ф Хг
Нулевая гипотеза заключается в том, что средняя снижения ИМТ ЛС, А (хА) равна средней снижения ИМТ ЛС Б (хБ).
Альтернативная гипотеза заключается в том, что средняя снижения ИМТ ЛС, А (хА) не равна средней снижения ИМТ ЛС Б (хБ) (& lt-Ф» заменена на «х», так рассматриваются средние выборочных).
После формулирования нулевой гипотезы следует выбор конкретного статистического теста и задание правила, по которому принимается решение о принятии или непринятии нулевой гипотезы. Подробно условия применения некоторых статистических тестов будут рассмотрены в следующей статье, тогда как настоящая работа направлена на рассмотрение теоретических основ процедуры статистического теста [4, 5].
Законы распределения и статистические критерии
Все статистические тесты теоретически базируются на теории вероятностей. В основе каждого теста лежит соответствующий статистический параметр, который называется также статистическим критерием. Именно в вычислении его значений и заключается процедура статистического теста, и на основе полученных значений статистического критерия делается заключение о принятии или непринятии нулевой гипотезы. Чтобы ясно представлять принцип работы статистических критериев необходимо обратиться к теории вероятностей. С позиций теории вероятностей применительно к области медицины любой показатель здоровья, эпидемиологический или фармакоэпидемиологический, имеет конкретный, ограниченный интервал (полуинтервал) значений- в зависимости от характера данных (исследуемого показателя), дискретного или непрерывного, будет получаться соответственно или набор отдельных значений или непрерывный интервал значений, причем каждому значению в этом интервале (полуинтервале) будет соответствовать своя вероятность, т. е. показатель принима-
ет то или иное значение с определенной вероятностью. Под вероятностью (p) при этом подразумевается число экспериментов (наблюдаемых пациентов), в результате которых показатель принял значение, А к общему числу проведенных экспериментов (наблюдаемых пациентов). Следует обратить внимание на значимость указанного определения, т. к. в настоящее время в теории аналитической статистики существуют две основные методологии: так называемая частотная (Frequency), определение вероятности которой было дано выше, и байесовская (Bayesian). Традиционно в медицине получила распространение аналитическая биостатистика, основанная на частотном определении вероятности и разработанная Р. Фишером. В силу ограниченности объема настоящей работы приведенная ниже информация будет дана относительно этой методологии. Однако необходимо дать объяснение различий между частотным и байесовским подходами в аналитической статистике для понимания читателями при работе с результатами клинических исследований логики, которой руководствовались исследователи при проведении статистического анализа. Основным отличием байесовской теории от частотной является учет в первой параметра, характеризующего предыдущий опыт наблюдения за данным показателем. То есть применением частотного подхода в аналитической статистике дается заключение о принятии или непринятии гипотезы при данных конкретных обстоятельствах без учета «прошлого опыта», в то время как байесовский критерий учитывает «опыт прошлого». Так как оба метода имеют надежные теоретические обоснования и хорошо разработанные методики, значительное число сторонников и противников со своими аргументами и контраргументами, то сложно делать заключение в целом о превалировании одного подхода над другим: выбор метода проведения статистического анализа, определяется условиями и задачами проведения конкретного исследования [2,
6, 7].
Совокупность всех значений признака и соответствующих им вероятностей называется рядом распределения. Он может быть проиллюстрирован таблицей, или выражен математически формулой и построенным на ее основе графиком (табл. 1, рис. 2). В связи с возможностью математического представления ряда распределения его также называют законом распределения (Distribution law).
X — значения величины Х xi Х2 Х3 Х… +1 Хк
P — соответствующая вероятность Pxi px2 РхЗ РХ… +1 РХк
Таблица 1. Ряд распределения показателя X
На рисунке 2 представлен график (называемый также кривой Гаусса) нормального закона распределения, или закона Гаусса, и его математическое представление. Этот закон, его свойства и связанные с ним теоремы играют важную роль в статистике, явля-
(1)
1 В дальнейшем для удобства изложения материала в статье будут применяться выражения «принимается», «не принимается»
Щ — плотность распределения- x — значение величины (анализируемого признака) —
1 — средняя арифметическая величины-
о — стандартное отклонение величины
Рисунок 2. График нормального закона распределения и его математическое выражение
ясь теоретической основой для статистических критериев. Столь большое значение закона нормального распределения в аналитической статистике объясняется предельным (универсальным) характером, которым он обладает: все остальные законы распределения (ненормальные, например Пуассона, биноминальное и т. п.) приближаются к нормальному закону распределения при определенных условиях. Фактически все статистические критерии, имеющие в своей основе законы распределения, отличные от нормального, представляют собой статистические параметры видоизмененного к тем или иным условиям нормального закона распределения2. Также необходимо отметить тот факт, что все массовые явления, включающие в себя и медицинские, подчиняются нормальному закону распределения (закону Гаусса). При этом отдельные факторы (слагаемые массового явления) могут подчиняться ненормальному закону распределения, но сумма факторов, как правило, распределена нормально. Важнейшим свойством закона распределения, является тот факт, что площадь, ограниченная сверху кривой распределения, а снизу осью абсцисс, равна единице, т. к. представляет собой графическое выражение полной вероятности наступления события А. Понятие полной вероятности события, А можно проиллюстрировать следующим примером: проводится исследование, в ходе которого оценивается фармакокинетика ЛС при помощи определения концентрации ЛС в крови. Концентрация Л С может принять любое значение в интервале от 0 (отсутствовать в крови) до х (некоторого максимального значения, к примеру, величины введенной дозы), при этом вероятность того, что концентрация примет некоторое конкретное значение х1 может быть неизвестна, но тот факт, что в ходе исследования концентрация примет какое-либо значение из указанного ранее интервала [0- х] со 100%-ной вероятностью (или с вероятностью, равной единице), очевиден.
В графике нормального закона распределения (рис. 2) по оси ординат откладывается плотность распределения ^(х)), по оси абсцисс — значения показателя X. Математическое выражение закона распределения (1) называется функцией плотности (^х)) распределения показателя X- функцией в математике называется зависимость одной переменной величины (функции) от другой переменной величины (аргумента). Как следует из приведенной формулы (1), функция плотности распределения определяется двумя параметрами (в терминах биостатистики): р — средней арифметической и о — стандартным отклонением. При этом значение средней (р) является центром распределения, т. е. значением показателя X, которому соответствует наибольшая вероятность, и определяет положение кривой относительно оси абсцисс (двигает график вправо или влево вдоль оси абсцисс). Стандартное отклонение определяет амплитуду кривой распределения — меньшее значение стандартного отклонения при неизменном значении средней будет сопровождаться увеличением амплитуды кривой распределения. Таким образом можно говорить не об одном единственном нормальном законе распределения, а о целом семействе нормальных законов распределения, каждое из которых характеризуется определенными значениями средней и стандартного отклонения. Но для всех распределений, являющихся нормальными, справедливы свойства площади под кривой нормального распределения, согласно которым интервалу р±1,64о соответствует 90% площади под кривой, или 90% значений распределения сосредоточено на данном участке, р±1,96о — 95% площади под кривой, р±2,5о — 99% площади под кривой. Указанные пропорции справедливы для любых явлений, распределенных по нормальному
закону, независимо от того, измеряется ли исследуемый признак в мг, руб., мл, днях госпитализации и т. п., имеет ли получаемая величина высокие порядки, как, например, при проведении анализа стоимости болезни, когда получаемые величины достигают млн и млрд, или же, наоборот, составляют десятые, сотые и тысячные доли, например, в исследованиях, объектом изучения которых является изменение концентрации лекарственного средства в крови пациента. Свойства площади под кривой постулируют, что для любого интервала р±го, где г & gt- 0, двух или более (медицинских) показателей, распределенных по нормальному закону (закону Гаусса), доли площади под кривой для каждого из показателей будут одинаковы. Например, площадь под кривой, соответствующая интервалу р±1,64о будет равна 90%, как для показателя добычи нефти из скважины, так и для показателя заболеваемости ОРВИ в зимнее время. Таким образом, указанное свойство площадей под кривой лежит в основе статистических тестов. Исходя из того, что для всех нормально распределенных величин (показателей) соотношения «интервал-доля площади под кривой» одинаковы, допустимо рассчитать все значения площадей под кривой для какого-то одного определенного нормального закона распределения и потом сравнивать с ним кривые любых других нормальных законов. При этом лишь важно соблюдать два условия: выражать интервалы значений величины (признака) в виде р±го и ввести процедуру стандартизации, которая будет приводить частный нормальный закон распределения к эталонному нормальному закону, для которого рассчитаны все значения площади под кривой. Процедура стандартизации имеет математическое выражение (в случае нормального закона):
1 =
где:
х- ?г
(2)
2 — число стандартных отклонений, содержащихся на отрезке между 1 и х (статистически критерий) — х — значение величины (анализируемого признака) —
1 — средняя арифметическая величины- о — стандартное отклонение величины.
По формуле (2) находится значение 2 для конкретной величины (показателя). Сам параметр 2 является тем, что называют статистическим критерием, и представляет собой условную безразмерную величину, на основе которой становится возможным проводить сравнения с целью принятия решения о принятии или непринятии нулевой гипотезы. Математически выражение (2) можно представить как преобразование нестандартизованной переменной х в стандартизованную переменную 2. При переходе от х к 2 соответственно изменяется и математическое выражение нормального закона (3):
1 г2
т'1ше~т,
(3)
2 При этом на практике определение того, подчиняется ли рассматриваемый показатель нормальному закону распределения или нет, осуществляется посредством построения графика плотности распределения этого показателя и последующего сравнения построенного графика с кривой Гаусса. В случае схожести построенных кривых делают заключение о нормальности распределения исследуемого показателя.
где:
2 — значение статистического критерия.
Изложенная логика механизма действия 2 статистического критерия (2 статистического теста или 2-теста), используемого при анализе величин, подчиняющихся нормальному закону распределения, справедлива и для других статистических критериев, которые применяются при ненормальном распределении анализируемой величины.
Целесообразно повторное обращение внимания на тот факт, что функцию плотности нормального распределения определяют два параметра — среднюю и стандартное отклонение. Характеристики именно этих параметров, а также объема выборки будут обосновывать выбор того или иного статистического критерия, что будет являться предметом анализа следующей статьи, посвя-
щенной биостатистике.
Также в настоящем теоретическом обзоре необходимо отметить, что статистические критерии подразделяются на параметрические и непараметрические. 2 — статистический критерий, используемый при анализе нормально распределенных величин, а также другие статистические критерии, применяемые при любом другом отличном от нормального распределения исследуемой величины, относят к параметрическим критериям. Параметрические тесты используют в том случае, когда закон распределения исследуемой величины известен, а также известны параметры этого распределения — средняя и стандартное отклонение. Однако в исследовательской практике встречаются ситуации, когда данных о законе распределения величины нет и, соответственно, нет возможности проводить статистические тесты, основанные на параметрических критериях. В этом случае применяются непараметрические критерии, которые не зависят от вида закона распределения и соответствующих параметров — средней и стандартного отклонения [2, 3, 4, 8, 9].
Критическая область и уровень значимости
После того как были сформулированы нулевая и альтернативная гипотезы и выбран статистический критерий (тест), необходимо задать правила принятия или непринятия нулевой гипотезы: объяснить, как в дальнейшем использовать найденные эмпирические значения статистических критериев, т. е. значения, найденные по формуле (2) в случае нормально распределенных величин. В роли таких правил выступают выбор критической области и уровня значимости.
Формальность подхода при проведении статистического теста заключается в том, что, вычислив значение статистического критерия, например 2, на основе эмпирических данных, производится его сравнение с критическим значением статистического критерия. В зависимости от того, принадлежит ли эмпирически рассчитанное значение 2 критерия интервалу, ограниченному референтным (критическим) значением, или лежит за пределами этого интервала, принимают решение о принятии или непринятии нулевой гипотезы.
Учитывая тот факт, что в основе статистических тестов лежит теория вероятностей, необходимо рассматривать решение о принятии или непринятии нулевой гипотезы с вероятностной точки зрения. С этой позиции существует вероятность ошибок при принятии решения о нулевой гипотезе:
1) не принять правильную гипотезу — отвергнуть нулевую гипотезу, в то время, когда она верна (а) —
2) принять неправильную гипотезу — принять нулевую гипотезу,
когда она неверна (Р).
Указанные возможные ошибки при решении о принятии/непринятии нулевой гипотезы соответственно называются ошибками первого и второго рода. Ошибки первого и второго рода находятся в обратной зависимости друг от друга, т. е., уменьшение ошибки первого рода приводит к увеличению ошибки второго рода, и наоборот. Ошибка второго рода является характеристикой самого статистического теста и в рамках настоящей статьи рассматриваться не будет. Ошибка первого рода носит название уровня значимости (а) и имеет важное значение в процедуре проведения статистического теста. Геометрический смысл последнего проиллюстрирован на рисунке 3, постановка задачи проверки гипотез для которого будет иметь следующий вид:
Зеленым цветом на рисунке 3 отмечена область принятия нулевой гипотезы (соответствующий ей отрезок оси абсцисс), а красным область ее непринятия — критическая область (соответствующие ей полуинтервалы на оси абсцисс). Как видно из графика (рис. 3), область принятия нулевой гипотезы ограничена интервалом [р0 ± 2а/2о], а критическая область лежит симметрично слева и справа за пределами данного интервала в виде так называемых «хвостов» кривой. При этом важно отметить, что симметричность критической области не является ее свойством, а определяется формулировкой альтернативной гипотезы: помимо указанной выше формулировки Н1: р ф р0, альтернативная гипотеза может быть задана неравенствами Н1: р & gt- р0- Н1: р & lt- р0, и в этом случае критическая область будет лежать соответственно несимметрично только справа или слева от области принятия нулевой гипотезы. Если значение 2-критерия, найденное на основе эмпирических данных, попадает в критическую область, то считается, что разница между фактической средней генеральной совокупности (р), вычисленной посредством данных выборки, и предполагаемым значением генеральной средней (р0) статистически значима, следовательно, нулевая гипотеза отвергается в пользу альтернативной. Критическое значение 2-критерия 2а/2 (или 2а в случае односторонней проверки гипотезы), определяющее границы интервала принятия нулевой гипотезы, в свою очередь, находится по выбранному уровню значимости (который на рис. 3 отражают красные области графика) в специальной таблице, в которой приведены (заранее рассчитанные эмпирическим путем) значения площади над кривой для всех значений 2-критерия. При проведении статистических тестов в медицине наиболее широко используемым уровнем значимости (обозначаемым также, как p-value или p) является 0,05 (нулевая гипотеза принимается при уровне значимости 5%, т. е. ошибка непринятия верной нулевой гипотезы составляет 5%), реже применяются значения 0,01 и
0,001 [4, 5, 8, 9].
Рисунок 3. Графическое представление уровня значимости, критической области и области допустимых значений
Заключение
В настоящем теоретическом обзоре была предпринята попытка наглядно продемонстрировать следующее: механизм работы статистических тестов на примере 2-тестов, необходимость знания аналитической биостатистики специалистов в области фармакоэкономики, основные подходы в современной аналитической биостатистике.
Таким образом проведение статистического теста начинается с постановки формальной задачи статистического анализа, которая производится посредством формулирования так называемых нулевой (Н0: р = р0) и альтернативной (Н1: р ф р0) гипотез. На следующем этапе процедуры происходит выбор статистического критерия, на основе которого будет приниматься решение о принятии или непринятии нулевой гипотезы. Статистические критерии бывают параметрическими и непараметрическими. Параметрические критерии применяются при условии того, что закон распределения изучаемой величины (показателя) известен и известны его основные параметры — средняя и стандартное отклонение, т. е.
• Нулевая гипотеза заключается в том, что значение средней генеральной совокупности равно р0 Н (: р = р0
• Альтернативная гипотеза заключается в том, что средняя генеральной совокупности не равна р0 Н1 р ф р0
использование конкретного статистического критерия ограничивается определенным видом закона распределения- при несоблюдении указанных условий обращаются к непараметрическим критериям. Законом распределения величины называется ряд всех принимаемых величиной значений с соответствующей каждому значению вероятностью. Существует множество разных видов распределений, но наибольшее значение имеет так называемый нормальный закон распределения, задаваемый формулой (1). Его исключительность в аналитической биостатистике заключается в том, что он обладает свойством предельности — при определенных условиях к нему стремятся все существующие ненормальные законы распределения. При этом существует не один нормальный (какой-либо ненормальный) закон распределения, а целое семейство нормальных (ненормальных) законов: для каждой величины свой. Однако для всех законов, относящихся к одному виду, справедливо следующее утверждение: одинаковым интервалом разных величин, подчиняющихся одному закону распределения, соответствуют одинаковые площади под кривой. Именно это свойство позволяет производить формализованное сравнение по статистическому критерию. Статистический критерий представляет собой условную величину, распределенную по некоторому закону, для всех значений которой эмпирически рассчитаны значения плотности под кривой. Методом стандартизации к распределению статистического критерия приводится распределение исследуемой величины (при условии, что она подчиняется тому же виду распределения, что и статистический критерий) и вычисляется значение статистического критерия для нее (в случае нормального распределения по формуле (2)). При принятии решения о нулевой гипотезе существует вероятность ошибочно отвергнуть верную гипотезу (ошибка первого рода) или принять неверную гипотезу (ошибка второго рода). Ошибка первого рода называется уровнем значимости и представляет собой правило, по которому производится решение о принятии или непринятии нулевой гипотезы. На основе выбранного уровня значимости в специальной таблице находится соответствующее критическое значение статистического критерия, которое сравнивается с эмпи-
рическим значением. По результатам сравнения нулевая гипотеза принимается или отвергается в пользу альтернативной. В продолжение настоящей статьи предполагается рассмотреть конкретные инструменты аналитической биостатистики, показания к их применению, достоинства, ограничения и примеры использования в практике фармакоэкономических исследований.
Литература
1. Барт А. Г., Вербицкая Е. В., Солнцев В. Н. О состоянии дел и перспективах обучения статистическому анализу медицинских данных // Международный журнал медицинской практики. — М.: Медиасфера. — 2006. — № 2
2. Прохоров Ю. В., Розанов Ю. А., Теория вероятностей. Основные понятия. Предельные теоремы. Случайные процессы. Справочник. — 3-е изд., перераб. — М.: Наука, 1987 — 400 с.
3. Серпик В. Г. Теоретические основы биостатистики при проведении фармакоэкономических исследований // Фармакоэкономика. — 2009. — № 2. -С. 9−14.
4. Сулицкий В. Н. Методы статистического анализа в управлении: Учеб. пособие. — М.: Дело, 2002. — 520 с.
5. Таха, Хэмди, А. Введение в исследование операций, 7-е издание.: Пер. с англ. — М.: Издательский дом «Вильямс», 2005. -912 с.
6. Bolstad, William M. Introduction to Bayesian Statistics, John Wiley ISBN 0−471−27 020−2
7. Goodman S.N. Towards evidence-based medical statistics: 1: The Bayes factor. Ann Intern Med 1999−130: 1005−13.
8. Harvey Motulsky. Intuitive Biostatistics. — Oxford University Press, USA, 1995 — 408 с.
9. Introduction to biostatistics: Textbook. Vienna School of Clinic. 2009.
10. Misusage of statistics in medical research. Ilker Ercan, Berna Yazici, Yaning Yang, Guven Ozkaya, Sengul Cangur, Bulent Ediz, Ismet Kan. Eur J Gen Med 2007- 4(3): 128−134.
INFERENTIAL BIOSTATISTIcS. THEORETIcAL juSTIFIcATION OF STATISTIcAL TESTS
Serpik V.G., Yagudim R.I.
Department of organization of medicinal provision with pharmacoeconomics course First Moscow State Medical University named IM Sechenov, Moscow
Resume: In this article the necessity of understanding the theoretical foundations and the creation of applied skills in using inferential biostatistics tools in the practice of pharmacoeconomic studies. The paper provides an overview of the most common approaches and methods in inferential biostatistics- disclosed procedure formulation of the problem of hypothesis testing and statistical tests.
Key words: biostatistics, methodology, pharmacoeconomics

ПоказатьСвернуть
Заполнить форму текущей работой