我在 Dataframe 的两列中有标识符,但结构不同。它看起来像这样:
Description1 Description2
1 A0A2H1CVW1_FASHEprotein1 tr|A0A2H1CVW1|A0A2H1CVW1_FASHEprotein1
2 A0A4E0RAA2_FASHEprotein2 tr|A0A2H1BSG1|A0A2H1BSG1_FASHEprotein3
3 A0A2H1CFJ4_FASHEprotein4 tr|A0A2H1CFJ4|A0A2H1CFJ4_FASHEprotein4
如何识别两列之间的不同标识符,例如第2行中的标识符?
1条答案
按热度按时间qojgxg4l1#
可以使用
stringr
软件包中的str_detect
来确定是否可以在Description2中找到Description1数据为可复制格式