描述bug
函数partition_text移除负号。
重现问题
from unstructured.partition.text import partition_text
text = '''
net amount
-4,391,082,054.12
rate is -10%
'''
print(text)
data = partition_text(text=text)
for d in data:
print(d.text)
print('-' * 10)
预期行为
net amount
-4,391,082,054.12
rate is -10%
net amount
----------
-4,391,082,054.12
----------
rate is
----------
-10%
----------
截图
3条答案
按热度按时间lc8prwob1#
这似乎是因为该符号被识别为无序列表中的项目符号。
b5lpy0ml2#
我们会尽快修复这个问题。
nzkunb0c3#
有人在修复这个问题吗?