python把图片识别成文字

识图

weixin_39430584

2579人浏览 · 2022-11-04 16:52:50

weixin_39430584 · 2022-11-04 16:52:50 发布

先上代码：

import pytesseract
from PIL import Image

# 打开图片
image = Image.open('011.png')
# 转为灰度图片
imgry = image.convert('L')
# 二值化，采用阈值分割算法，threshold为分割点,根据图片质量调节
threshold =165 #150
table = []
for j in range(256):
    if j < threshold:
        table.append(0)
    else:
        table.append(1)

temp = imgry.point(table, '1')

# OCR识别：lang指定中文,--psm 6 表示按行识别，有助于提升识别准确率
text = pytesseract.image_to_string(temp, lang="chi_sim+eng", config='--psm 6')

# 打印识别后的文本
print(text)

除了装pytesseract和PIL库外，还需要：

1）安装Tesseract-OCR ，安装完成后加入到环境变量里面；

2）安装支持语言种类如chi,sim ,eng

3)每次使用替换掉图片位置和名称，可以通过调整threshold的值来提高图片的识别率

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

AI PPT免费使用技巧盘点：如何快速制作专业PPT？

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手