我有两个 Dataframe ,我想根据正则表达式追加。如果df1的"code"列中的值(例如R93)与df2的"ICD_CODE"(例如R93)匹配,则将"code"列值追加到df2。
df1
code
R93.2
S03
df2
ICD_CODE ICD_term MDR_code MDR_term
R93.1 Acute abdomen 10000647 Acute abdomen
K62.4 Stenosis of anus and rectum 10002581 Anorectal stenosis
S03.1 Hand-Schüller-Christian disease 10053135 Hand-Schueller-Christian disease
预期输出为:
code ICD_CODE ICD_term MDR_code MDR_term
R93.2 R93.1 Acute abdomen 10000647 Acute abdomen
S03 S03.1 Hand-Schüller-Christian disease 10053135 Hand-Schueller-Christian disease
任何帮助都是高度赞赏!
2条答案
按热度按时间yhqotfr81#
保留每个代码列的左侧部分(点之前)作为
merge
键:bqf10yzr2#
一个可能的 * 解决方案 * 是从fuzzywuzzy使用
process.extractOne
。输出: