我正在使用Stanza Biomedical i2b2处理器识别药物数据中的问题、治疗和测试实体。
Python代码如下:
import stanza
stanza.download(
"en",
package="mimc",
processors={"ner": ["i2b2"]},
verbose=False,
)
nlp = stanza.Pipeline(
"en",
package="mimc",
processors={"ner": ["i2b2"]},
verbose=False,
)
parsed_row = nlp("Prevention of phototoxicity in adult patients with erythropoietic protoporphyria (EPP).")
for ent in parsed_row.entities:
print(f"{ent.text}\t{ent.type}")
净输出
phototoxicity PROBLEM
erythropoietic protoporphyria PROBLEM
我正在阅读关于使用brat来可视化节NER注解的页面https://brat.nlplab.org/embed.html,但是我完全迷路了。有人能帮我填充这些点吗?谢谢
1条答案
按热度按时间bvn4nwqk1#
经过大量的实验,我确实找到了一种方法,它工作得很好,虽然下面的代码一点也不健壮,只是一个概念证明:
https://github.com/rjalexa/stanza2brat