我有一个来自组织切片数据集的 Dataframe ,其中包含以下列
- 图像
- 姓名
- tumor_stroma_epi_nsclc_v2:上皮%
- tumor_stroma_epi_nsclc_v2:上皮面积µm^2
- tumor_stroma_epi_nsclc_v2:坏死%
- tumor_stroma_epi_nsclc_v2:坏死面积µm^2
- tumor_stroma_epi_nsclc_v2:基质%
- tumor_stroma_epi_nsclc_v2:基质面积µm^2
- tumor_stroma_epi_nsclc_v2:肿瘤%
- tumor_stroma_epi_nsclc_v2:肿瘤面积µm^2
- Area µm^2
列的nsclc_v2成分在多个不同的数据集上是可变的,具体取决于不同的组织类型。我想创建一个正则表达式来删除%列,它可以识别所有格式相同但组织类型不同的列。到目前为止,这是我所能想到的全部内容。
tumor_temp.drop(columns=['Image','Name',
'^tumor_stroma_epi_[a-z0-9_]: Epithelium %$',
'^tumor_stroma_epi_[a-z0-9_]: Necrosis %$',
'^tumor_stroma_epi_[a-z0-9_]: Stroma %$',
'^tumor_stroma_epi_[a-z0-9_]: Tumor %$',
'Area µ?m^2'], inplace=True)
如果这是一个基本的,我道歉,我大多有一个R背景。
1条答案
按热度按时间42fyovps1#
你可以使用pandas中的
filter()
函数: