jieba 研究发现,5-HT功能活动降低与抑郁症患者的抑郁心境、食欲减退、失眠、昼夜节律紊乱、内分泌功能紊乱、性功能障碍、焦虑不安、不能应付应激、活动减少等密切相关;而5-HT功能增高与躁狂症的发病有关。

des4xlb0  于 5个月前  发布在  其他
关注(0)|答案(5)|浏览(42)

使用:
jieba.add_word("5-HT功能", freq=True, tag='n')
jieba.add_word("食欲减退", freq=True, tag='n')
jieba.add_word("昼夜节律紊乱", freq=True, tag='n')
然后分词处理:
print("/".join(jieba.cut(sta, HMM=True)))
发现结果为:
研究/发现/,/5/-/HT/功能/活动/降低/与/抑郁症/患者/的/抑郁/心境/、/食欲减退/、/失眠/、/昼夜节律紊乱/、/内分泌/功能/紊乱/、/性功能
障碍/、/焦虑不安/、/不能/应付/应激/、/活动/减少/等/密切相关/;/而/5/-/HT/功能/增高/与/躁狂症/的/发病/有关/。
预计结果是:
研究/发现/,/5-HT功能/活动/降低/与/抑郁症/患者/的/抑郁/心境/、/食欲减退/、/失眠/、/昼夜节律紊乱/、/内分泌/功能/紊乱/、/性功能
障碍/、/焦虑不安/、/不能/应付/应激/、/活动/减少/等/密切相关/;/而/5-HT功能/增高/与/躁狂症/的/发病/有关/。
“5-HT功能”,为什么没有用?

tuwxkamq

tuwxkamq1#

因为有“-”,所以对两边的数据进行了切分

wnvonmuf

wnvonmuf2#

那怎么解决这个问题。因为有些专业名里面包含这种“-” liwy@futongdf.com.cn 发件人: LuoZe 发送时间: 2018-09-06 21:22 收件人: fxsjy/jieba 抄送: lwy1111111; Author 主题: Re: [fxsjy/jieba] 研究发现,5-HT功能活动降低与抑郁症患者的抑郁心境、食欲减退、失眠、昼夜节律紊乱、内分泌功能紊乱、性功能障碍、焦虑不安、不能应付应激、活动减少等密切相关;而5-HT功能增高与躁狂症的发病有关。 (#666) 因为有“-”,所以对两边的数据进行了切分 — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or mute the thread.

hs1ihplo

hs1ihplo3#

from pyhanlp import *

CustomDictionary.insert('5-HT功能', '医疗术语 10')
print(HanLP.segment('研究发现,5-HT功能活动降低与抑郁症患者的抑郁心境'))
[研究/vn, 发现/v, ,/w, 5-HT功能/医疗术语, 活动/vn, 降低/v, 与/cc, 抑郁症/nhd, 患者/n, 的/ude1, 抑郁/a, 心境/n]
axzmvihb

axzmvihb4#

谢谢,但是我问的是结巴的解决方法!

9rnv2umw

9rnv2umw5#

谢谢,但是我问的是结巴的解决方法!

之前有帖子写了,特殊字符,可以考虑修改
jieba.re_han_default = re.compile(r'([\u4e00-\u9fa5a-zA-Z0-9+#&._%/-]+)', re.UNICODE)

相关问题