numpy Python中的索引

oymdgrw7  于 11个月前  发布在  Python
关注(0)|答案(3)|浏览(112)

我正在寻找Harrell's c-index(索引)的python/sklearn/lifelines/whatever实现,这在random survival forests中提到。
使用以下步骤计算C指数:
1.在数据上形成所有可能的案例对。
1.忽略那些生存时间较短的对,如果Ti=Tj,则忽略对i和j,除非至少有一个是死亡的。设Permissible表示允许对的总数。
1.对于TiTj不相等的每个允许的配对,如果较短的生存时间具有较差的预测结果,则计数1;如果预测结果相同,则计数0.5。对于每个允许的配对,其中Ti=Tj和两者都是死亡,如果预测结果相同,则计数1。否则,计数0.5。对于Ti=Tj(但不是两者都是死亡)的每个允许对,如果死亡具有更差的预测结果,则计数1;否则,计数0.5。让一致性表示所有允许对的总和。

  1. C索引CC=Concordance/Permissible定义。
    注意:nltk有一个ConcordanceIndex方法,它有不同的含义:(
bejyjqdl

bejyjqdl1#

LifeLines包现在已经实现了c-index或concordance-index

6rvt4ljy

6rvt4ljy2#

LifeLine软件包可以实现一致性索引。
第一个月

conda install -c conda-forge lifelines
范例:

from lifelines.utils import concordance_index
cph = CoxPHFitter().fit(df, 'T', 'E')
concordance_index(df['T'], -cph.predict_partial_hazard(df), df['E'])

字符串

polhcujo

polhcujo3#

Lifelines是一个很好的工具,可以在Python中进行生存分析。我还不能发表评论,但重要的是要注意,如果“predictions”参数乘以(-1),Lifelines concordance_index()只匹配scikit-survival的concordance_index_censored()
这只是归结为两个包之间对预期预测(或“风险分数”)的不同解释。

相关问题