用结巴对文本分完词之后,由于词语是以Unicode形式存在,每当我要将其导出为txt或CSV文件,就会存在编码的问题。我想了一个本办法,把打印出来的结果直接复制粘贴,可是对于有几万行的输出,有什么别的办法吗?
iklwldmw1#
编一下码不就好了么?比如:data.encode("utf-8")
1条答案
按热度按时间iklwldmw1#
编一下码不就好了么?比如:data.encode("utf-8")