我有一个包含许多列的数据框,但我只显示相关列
IGV_table[["Revel_Transcripts", "Ensembl"]].head(30).to_dict()
# Converted to dict so that you can use this two-column dataframe
{'Revel_Transcripts': {0: 'ENST00000438426',
1: 'ENST00000438426',
2: 'ENST00000438426',
3: 'ENST00000438426',
4: 'ENST00000438426',
5: 'ENST00000438426',
6: 'ENST00000438426',
7: 'ENST00000438426',
8: 'ENST00000438426',
9: 'ENST00000438426',
10: 'ENST00000438426',
11: 'ENST00000438426',
12: 'ENST00000438426',
13: 'ENST00000438426',
14: 'ENST00000438426',
15: 'ENST00000438426',
16: 'ENST00000438426',
17: 'ENST00000438426',
18: 'ENST00000438426',
19: 'ENST00000438426',
20: 'ENST00000438426',
21: 'ENST00000438426;ENST00000318560',
22: 'ENST00000438426;ENST00000318560',
23: 'ENST00000438426;ENST00000318560',
24: 'ENST00000438426;ENST00000318560',
25: 'ENST00000438426;ENST00000318560',
26: 'ENST00000438426;ENST00000318560',
27: 'ENST00000438426;ENST00000318560',
28: 'ENST00000438426;ENST00000318560',
29: 'ENST00000438426;ENST00000318560'},
'Ensembl': {0: 'ENST00000318560',
1: 'ENST00000318560',
2: 'ENST00000318560',
3: 'ENST00000318560',
4: 'ENST00000318560',
5: 'ENST00000318560',
6: 'ENST00000318560',
7: 'ENST00000318560',
8: 'ENST00000318560',
9: 'ENST00000318560',
10: 'ENST00000318560',
11: 'ENST00000318560',
12: 'ENST00000318560',
13: 'ENST00000318560',
14: 'ENST00000318560',
15: 'ENST00000318560',
16: 'ENST00000318560',
17: 'ENST00000318560',
18: 'ENST00000318560',
19: 'ENST00000318560',
20: 'ENST00000318560',
21: 'ENST00000318560',
22: 'ENST00000318560',
23: 'ENST00000318560',
24: 'ENST00000318560',
25: 'ENST00000318560',
26: 'ENST00000318560',
27: 'ENST00000318560',
28: 'ENST00000318560',
29: 'ENST00000318560'}}
我想保留Ensembl中的值在列Revel_Transcripts中找到的行。Revel_Transcripts可以有一个或多个值,由“”分隔;“而Ensembl列只有一个值,如ENST 00000318560
预期结果
Revel_Transcripts Ensembl
21 ENST00000438426;ENST00000318560 ENST00000318560
22 ENST00000438426;ENST00000318560 ENST00000318560
23 ENST00000438426;ENST00000318560 ENST00000318560
24 ENST00000438426;ENST00000318560 ENST00000318560
25 ENST00000438426;ENST00000318560 ENST00000318560
26 ENST00000438426;ENST00000318560 ENST00000318560
27 ENST00000438426;ENST00000318560 ENST00000318560
28 ENST00000438426;ENST00000318560 ENST00000318560
29 ENST00000438426;ENST00000318560 ENST00000318560
2条答案
按热度按时间dsekswqp1#
如果需要测试每行的成员资格,使用
Series.str.split
和expand=True
,按DataFrame.eq
进行比较,并测试DataFrame.any
中是否至少有一个值匹配,并按boolean indexing
进行过滤:或者使用列表解析来测试按列
Ensembl
拆分的值:w8f9ii692#
您可以用途:
输出: