Кто-нибудь знает, в чем разница между n и strata в сурвообъекте?

Всякий раз, когда я использую survfit в R, я получаю разные значения для n и слоев: например, я получаю n: 150, 167 (добавьте 317, что является общим вводом) слои: 149, 163

На странице справки ?survival::survfit.object:

n = общее количество субъектов в каждой кривой.

strata = если имеется несколько кривых, этот компонент задает количество элементов векторов времени и т. д., соответствующих первой кривой, второй кривой и т. д. Имена элементов являются метками для кривых.

Я не понимаю, почему цифры разные.

РЕДАКТИРОВАТЬ: я думал о проблеме, связанной с повторяющимися точками данных времени, как вы можете видеть в примере базы данных, есть 9 экземпляров повторяющихся значений (всего 18). Это будет означать, что используются только 317 - 9 = 308 значений. Но страты в сумме дают: 149+163=312, а не 308. Используемый код:

library(survival)
library(survminer)
survival <- surv_fit(Surv(time = Time,event = Event)~Group,data=x, conf.int=0.95)

Обновление: это связано с повторяющимися временами в каждой группе. Если я разделю данные в группе A и группе B, будет 1 повторяющееся событие в группе A и 4 повторяющихся события в группе B. Следовательно, на графике будет 317 - 1 - 4 = 312 временных точек.

И в каждой группе будет: А: 150 - 1 = 149 Б: 167 - 4 = 163

Как показывают слои.


person Agustin    schedule 07.11.2019    source источник
comment
Воспроизводимый пример поможет прояснить это. Однако, читая описание, я бы предположил, что у вас есть несколько событий с одинаковым временем.   -  person kath    schedule 07.11.2019
comment
Обновил с примером   -  person Agustin    schedule 07.11.2019
comment
Пожалуйста, не публикуйте данные в качестве внешней ссылки, например, используйте dput или аналогичную. Вы можете прочитать больше об этом здесь   -  person kath    schedule 07.11.2019
comment
Я все еще думаю, что это повторяющиеся времена на кривой! Таким образом, несмотря на то, что в ваших полных данных есть больше повторяющихся моментов времени, при их разделении только некоторые из них остаются дублированными.   -  person kath    schedule 07.11.2019
comment
Да, это правильно. Я только что попробовал это. Вы хотите добавить это как ответ?   -  person Agustin    schedule 07.11.2019
comment
Теперь вы можете ответить на него сами ;)   -  person kath    schedule 07.11.2019
comment
Я также посмотрю, как правильно добавлять данные, я никогда раньше этого не делал. Спасибо!   -  person Agustin    schedule 07.11.2019


Ответы (1)


Спасибо @kath за помощь.

n относится к количеству образцов в каждой группе.

страты относятся к количеству различных временных элементов в каждой группе, т. е. к удалению дубликатов внутри каждой группы.

person Agustin    schedule 07.11.2019