我正在寻找Harrell's c-index
(索引)的python/sklearn/lifelines/whatever实现,这在random survival forests中提到。
使用以下步骤计算C指数:
1.在数据上形成所有可能的案例对。
1.忽略那些生存时间较短的对,如果Ti=Tj
,则忽略对i和j,除非至少有一个是死亡的。设Permissible
表示允许对的总数。
1.对于Ti
和Tj
不相等的每个允许的配对,如果较短的生存时间具有较差的预测结果,则计数1;如果预测结果相同,则计数0.5。对于每个允许的配对,其中Ti=Tj
和两者都是死亡,如果预测结果相同,则计数1。否则,计数0.5。对于Ti=Tj
(但不是两者都是死亡)的每个允许对,如果死亡具有更差的预测结果,则计数1;否则,计数0.5。让一致性表示所有允许对的总和。
- C索引
C
由C=Concordance/Permissible
定义。
注意:nltk
有一个ConcordanceIndex
方法,它有不同的含义:(
3条答案
按热度按时间bejyjqdl1#
LifeLines包现在已经实现了c-index或concordance-index
6rvt4ljy2#
LifeLine软件包可以实现一致性索引。
第一个月
或
conda install -c conda-forge lifelines
个范例:
字符串
polhcujo3#
Lifelines是一个很好的工具,可以在Python中进行生存分析。我还不能发表评论,但重要的是要注意,如果“predictions”参数乘以(-1),Lifelines
concordance_index()
只匹配scikit-survival的concordance_index_censored()
。这只是归结为两个包之间对预期预测(或“风险分数”)的不同解释。