+ All Categories
Home > Documents > Математическая статистика: Анализ выживаемости

Математическая статистика: Анализ выживаемости

Date post: 06-Jul-2015
Category:
Upload: cs-center
View: 506 times
Download: 6 times
Share this document with a friend
Popular Tags:
26
Лекция 12. Анализ выживаемости Грауэр Л.В., Архипова О.А. CS Center Санкт-Петербург, 2014 Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 1 / 26
Transcript
Page 1: Математическая статистика: Анализ выживаемости

Лекция 12. Анализ выживаемости

Грауэр Л.В., Архипова О.А.

CS Center

Санкт-Петербург, 2014

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 1 / 26

Page 2: Математическая статистика: Анализ выживаемости

Cодержание

Содержание

1 Анализ выживаемости

2 Цензурирование

3 Функция выживаемости и функция риска

4 Оценка функции выживаемости и функции рискаПараметрические методыНепараметрические методы

5 Сравнение двух функций выживаемостиЛогранговый критерийКритерий Гехана

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 2 / 26

Page 3: Математическая статистика: Анализ выживаемости

Анализ выживаемости

Анализ выживаемости

Пусть T — неотрицательная случайная величина, представляющаясобой время ожидания до наступления некоторого события.Назовем исследуемое событие смертью,время ожидания — "временем выживания".

Продолжительность жизни после операции, начала леченияВозраст при вступлении в брак и продолжительность бракаВремя пребывания в городеВремя пребывания на определенном месте работы

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 3 / 26

Page 4: Математическая статистика: Анализ выживаемости

Анализ выживаемости

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 4 / 26

Page 5: Математическая статистика: Анализ выживаемости

Цензурирование

Цензурирование

Говорят, что имеет место цензурирование, если событие ("смерть") ненаступило до конца исследования.

Пациент все еще живПациент переехал (пропала связь с пациентом)Пациент умер от другой причины (автокатастрофа)

Пусть i — номер наблюдаемого объекта, Ti — время жизни объекта i(непрерывная или дискретная случачная величина), Ui — переменнаяцензурирования.

Xi = min(Ti ,Ui )

— цензурированное время жизни объекта i .

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 5 / 26

Page 6: Математическая статистика: Анализ выживаемости

Цензурирование

Механизмы цензурирования

Фиксированное цензурированиеВыборка из n объектов наблюдается в течение фиксированноговремени τ . Число смертей случайно, но общая продолжительностьисследования фиксирована. Каждый объект имеет максимальновозможный период наблюдения τi , i = 1, . . . , n. Вероятность того,что объект будет жив в конце исследования, равна S(τi ).Случайное цензурированиеВыборка из n объектов наблюдается столько, сколько необходимо,чтобы событие ("смерть") испытали d объектов. Число dфиксировано заранее и его можно использовать в качествепараметра. Однако время исследвания не может быть точноизвестно заранее

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 6 / 26

Page 7: Математическая статистика: Анализ выживаемости

Цензурирование

Направления цензурирования

Правосторонее цензурированиеОбусловлено выбыванием объектов из исследования илиокончанием самого исследованияНаблюдаются Xi = min(Ti ,Ui ) для каждого i и индикатор смертиδi (δi = 1, если Ti ≤ Ui , и δi = 0, если Ti > Ui )Левосторонее цензурированиеОбъект выбыл до начала исследованияНаблюдаются Yi = max(Ti ,Ui ) для каждого i и индикатор смертиδi (δi = 1, если Ti ≤ Ui , и δi = 0, если Ti > Ui

Интервальное цензурированиеНаблюдаются (Li ,Ri ) такие, что Ti ∈ (Li ,Ri )

Далее будем рассматривать только правостороннее цензурирование.

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 7 / 26

Page 8: Математическая статистика: Анализ выживаемости

Цензурирование

Независимое (неинформативное) цензурированиеUi не зависит от Ti

Конец исследования запланирован заранее (оговорены точныесроки, например, 2 года), случайное выбывание объекта (авария)Информативное цензурированиеРаспределение Ui зависит от каких-либо параметров,определяющих распределение Ti

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 8 / 26

Page 9: Математическая статистика: Анализ выживаемости

Функция выживаемости и функция риска

Функция выживаемости и функция риска

Пусть T — непрерывная случайная величина с плотностьюраспределения f (t) и функцией распределения F (t) = P{T ≤ t}.Рассмотрим функцию выживаемости

S(t) = P{T > t} = 1− F (t) =

∫ ∞t

f (x)dx (1)

— вероятность того, что исследуемое событие не наступило к моментувремени t.Так как событие ("смерть") не может произойти к моменту 0,S(0) = 1.

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 9 / 26

Page 10: Математическая статистика: Анализ выживаемости

Функция выживаемости и функция риска

Рассмотрим функцию риска — мгновенную интенсивностьосуществления события, —

λ(t) = limdt→0

P{t < T ≤ t + dt|T > t}dt

=f (t)dt

S(t)dt=

f (t)

S(t)

Заметим, что −f (t) = S ′(t), тогда

λ(t) = − d

dtlog S(t),

S(t) = exp

{−∫ t

0λ(x)dx

}.

Кумулятивный риск

Λ(t) =

∫ t

0λ(x)dx = − lnS(t)

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 10 / 26

Page 11: Математическая статистика: Анализ выживаемости

Функция выживаемости и функция риска

Функция рискаПостоянная: λ(t) ≡ C , когда Λ(t) = Ct и S(t) = e−Ct :продолжительность жизни при наличии хронического заболеванияВозрастающая: старение после 65Убывающая: продолжительнсоть жизни после операцииВаннообразная: летальность, зависящая от возраста

Функция выживаемости Функция риска

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 11 / 26

Page 12: Математическая статистика: Анализ выживаемости

Функция выживаемости и функция риска

Характеристики положения продолжительности жизни

Ожидаемая продолжительность жизни

µ =

∫ ∞0

tf (t)dt.

Медиана продолжительности жизни— τ такое, что S(τ) = 0.5На практике медиана не всегда достигается. В этом случае выюбираютнаименьшее τ , для которого S(τ) ≤ 0.5

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 12 / 26

Page 13: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска

Оценить функцию выживаемости/риска можно одним из двухспособов

установив параметрическую модель λ(t), основываясь наконкретной плотности распределения f (t)

воспользовавшись эмпирическими оценками функции выживания(непараметрические методы)

Если цензурирование отсутствует, в качестве оценки функциивыживания S(t) можно взять долю объектов со временем жизни,большим t.Если цензурирование есть, оценка S(t) является плохой оценкойистинной функции выживания S(t).

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 13 / 26

Page 14: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Параметрические методы

Некоторые параметрические законы выживнаия

Экспоненциальное распределение

f (t) = ae−at , t ≥ 0,

S(t) = e−at , λ(t) = a, Λ(t) = at

Распределение Вейбулла

f (t) = katk−1e−atk, t ≥ 0,

S(t) = e−atk, λ(t) = katk−1, Λ(t) = atk

Распределение Рэлея

λ(t) = a0 + a1(t)

Лог-нормальноеlogT ∼ нормально распределение

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 14 / 26

Page 15: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Непараметрические методы

Рассмотрим следующие непараметрические методы оценки функциивыживанаия S(t)

Оценка Каплана-МейераТаблицы жизниОценка кумулятивной функции риска

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 15 / 26

Page 16: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Оценка Каплана-Мейера

Разобьем временной промежуток исследования на интервалы так,чтобы время каждого события смерти или цензурирования попадалипо возможности в разные интервалы

S(t) = Πj :τj<trj − dj

rj= Πj :τj<t

(1−

djrj

), (2)

гдеτ1, . . . , τk — моменты времени смертей, наблюдаемые в выборкеdj — число смертей в момент τjrj — число объектов, умерших или цензурированных в момент τj илипозже. Справедливы следующие соотношения

rj = rj−1 − dj−1 − cj−1, rj =∑l≥j

(cl + dl),

где cj — число цензурированных объектов в промежутке между jтым и(j + 1)м интервалами. Объекты, цензурированные в момент τjвключаются в cj

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 16 / 26

Page 17: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Свойства оценки Каплана-Мейера

В случае отсутствия цензурирования S(t) = S(t)S(t) имеет асимптотическое нормальное распределение.S(t) является асимптотически несмещенной оценкой S(t)Дисперсия S(t) согласно формуле Гринвуда

var(S(t)

)=[S(t)

]2 ∑j :τj<t

dj(rj − dj)rj

Доверительный интервал для S(t)(S(t)− z1−α/2se[S(t)], S(t) + z1−α/2se[S(t)]

)Однако данный подход может приводить к значениям >1 или <0.

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 17 / 26

Page 18: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Предпочтительней подход с переходом к функцииL(t) = log(− log(S(t))) и построением доверительного интрвала дляL(t).Пусть L(t) = log(− log(S(t)))

var(L(t)

)=

1[S(t)

]2 ∑j :τj<t

dj(rj − dj)rj

,

тогда доверительный интервал для L(t)(L(t)− z1−α/2se[L(t)], L(t) + z1−α/2se[L(t)]

)и доверительный интервал для S(t)(

S(t)ez1−alpha/2se(L(t))

, S(t)−ez1−alpha/2se(L(t))

)

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 18 / 26

Page 19: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Таблицы жизни

Используются для группированных данных и представляют собойтабличное представление информации о функции выжимаемостиобъекта

Разобьем временной промежуток исследования на интервалы[tj−1, tj) — jй интервал, начинаются с t0cj — число цензурированных объектов в интревале jdj — число "смертей"в интревале jrj — число объектов, пришедших в интревале j

Так как данные сгруппированы, для вычисления оценок необходимоправильно учесть цензурирование:

в начале каждого интревала r ′j = rj − cj

в конце каждого интервала r ′j = rj

в середине интервала r ′j = rj − cj/2

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 19 / 26

Page 20: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Оценка функции выживаемости в момент tj

S(tj) = Πl≤j

(1− dl

r ′l

)Оценка функции риска для jго интервала

λ(tmj) =dj

(tj − tj−1)(r ′j − dj/2),

tmj - центр jго интервала.

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 20 / 26

Page 21: Математическая статистика: Анализ выживаемости

Оценка функции выживаемости и функции риска Непараметрические методы

Оценка кумулятивной функции риска

Для построения оценки кумулятивной функции риска Λ(t) разобьемвременной промежуток исследования на интервалы так, чтобы времякаждого события смерти или цензурирования попадали повозможности в разные интервалы и вычислимdj — число смертей в момент τjrj — число объектов, умерших или цензурированных в момент τj илипозжеОценка Нельсона-Аалена

ΛNA(t) =∑j :τj<t

djrj.

Оценка на основе оценки Каплана-Мейера

ΛKM = − log SKM(t)

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 21 / 26

Page 22: Математическая статистика: Анализ выживаемости

Сравнение двух функций выживаемости

Сравнение двух функций выживаемости

Предположим, что мы наблюдаем две группыГруппа 1: (X11, δ11), . . . , (X1n1 , δ1n1)Группа 0: (X01, δ01), . . . , (X0n0 , δ0n0)где Xij — цензурированное время жизни объекта j из группы i ,δij — индикатор смерти объекта j группы i .

Проверяется гипотеза о равенстве функций выживания двух группH0 : S1(t) = S0(t)

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 22 / 26

Page 23: Математическая статистика: Анализ выживаемости

Сравнение двух функций выживаемости Логранговый критерий

Логранговый критерий

Логранговый критерий основан на построении таблиц сопряженности2х2 в каждый момент "смерти"и сравнении долей смертей обеих группс учетом числа наблюдаемых объектов в соответствующий момент"смерти".

Пусть t1, . . . , tK — K упорядоченных по возрастанию моментовсмерти. В момент tj имеем следующую таблицу 2х2:

Group Die Not Total0 d0j r0j − d0j r0j1 d1j r1j − d1j r1j

Total dj rj − dj rj

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 23 / 26

Page 24: Математическая статистика: Анализ выживаемости

Сравнение двух функций выживаемости Логранговый критерий

Статистика критерия

χ2logrank =

[∑Kj=1(d0j − r0jdj/rj)

]2∑K

j=1r1j r0jdj (rj−dj )

r2j (rj−1)

(3)

В предположении о независимости всех таблиц, статистика (3) имеетасимптотическое распределение χ2 с 1 степенью свободы.Нулевая гипотеза отклоняется на уровне значимости α, есливыборочное значение статистики χ2

logrank > χ21−α(1)

Логранговый критерий применим, если- выборки независимы и случайны- функции выживаемости связаны соотношением S1(t) = [S0(t)]ψ илихотя бы они не пересекаются.

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 24 / 26

Page 25: Математическая статистика: Анализ выживаемости

Сравнение двух функций выживаемости Критерий Гехана

Критерий Гехана

Критерий Гехана представляет собой обобщение критерия Вилкоксонана случай цензурированных данных.Каждый объект Z0i группы 0 сравнивают с каждым объектом Y1j

группы 1 по времени жизни и вычисляют статистику

Uij = U{Z0i ,Y1j} =

1, если T0i > T1j или X0i ≥ T1j ;0, если T0i = T1j или объект

с наименьшим временем был цензурирован−1, если T0i < T1j или T0i ≤ X1j ;

Статистика критерия

W =

n0∑i=1

n1∑j=1

Uij (4)

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 25 / 26

Page 26: Математическая статистика: Анализ выживаемости

Сравнение двух функций выживаемости Критерий Гехана

При выполнении нулевой гипотезы статистика W имеет среднее,равное 0, и дисперсию равной

var(W ) =n0n1

(n0 + n1)(n0 + n1 − 1)

n0+n1∑i=1

n0+n1∑j=1

Uij

2

При выполнении нулевой гипотезы статистика W√var(W )

имеетасимптотическое стандартное нормальное распределение.

Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 26 / 26


Recommended