我是生存曲线的新手,并试图用R来绘制它们。我的Excel文件中有以下列:样品(实验或对照)、年龄(老年或年轻)、性别(男性或女性)、细菌状态(阳性或阴性)和第0-20天(21个单独的列);参见下面的示例。我的生存期为20天,从第0天开始。第0天最多,我的样本全部死亡,并且可以在第20天之前结束(n=0),有时在最后一天还有一些剩余。然后,我希望x轴=天,y轴=存活概率,并使用**Log-Rank(Mantel-Cox)检验比较实验组与对照组、性别、年龄和细菌状态。
| 性别|扬|细菌状态|第0天|第一天|第二天| Day 2 |
| --|--|--|--|--|--| ------------ |
| 男性|扬|阳性|三十五|三十四|三十三| 33 |
| 母头|老|阴性|三十五|三十五|三十五| 35 |
1条答案
按热度按时间tf7tbtn21#
尝试“survival”,“survminer”,“condSURV”包,“ggsurvfit”绘图。您需要正确地格式化数据,以便创建一个新的数据集。当有人死了,你需要做一行3列最低:天,生存,组。
所以如果有人在第一天死亡,你输入1代表天,1代表生存(他们死亡),“感染”或群体,假设他们被感染了。如果第10天有4个人,那就是4个单独的行,每个行在天列中有10个,在生存列中有1个(他们都死了),在组列中有他们各自的组。感染或未感染。
然后只需要在数据上使用生存分析代码,例如比较各组的生存率:
字符串
对于成对版本,其:
型
或者绘制生存曲线:
型