python 用Py三角形抽取png中的部分文本

mxg2im7a  于 2023-04-19  发布在  Python
关注(0)|答案(1)|浏览(87)

我试着提取每张卡片的文本,

到目前为止,我试着简单地阅读图像并使用pytesseract提取文本,但我只返回图像中所有文本的1个单词:(火的精神i Suzumebochity
MOMOMO代码:

im=cv2.imread(impath)
text=pytesseract.image_to_string(im)
print(text)

有人有任何想法,我可以做些什么来改善它?也许一些建议,什么改变,也许是一个如何我可以正确地提取文本为每张卡

bvhaajcl

bvhaajcl1#

来自文档:https://pypi.org/project/pytesseract/
这表明您缺少BGR到RGB的转换,即

import cv2

img_cv = cv2.imread(r'/<path_to_image>/digits.png')

# By default OpenCV stores images in BGR format and since pytesseract assumes RGB format,
# we need to convert from BGR to RGB format/mode:
img_rgb = cv2.cvtColor(img_cv, cv2.COLOR_BGR2RGB)
print(pytesseract.image_to_string(img_rgb))
# OR
img_rgb = Image.frombytes('RGB', img_cv.shape[:2], img_cv, 'raw', 'BGR', 0, 0)
print(pytesseract.image_to_string(img_rgb))

相关问题