easyocr

EasyOCR可用于将图像中的文本识别为可编辑文本。它使用深度学习模型和计算机视觉技术来实现高效的文本识别,支持多种语言的OCR识别,包括中文、英文、日语、韩语等。EasyOCR可以在多种场景下应用,例如扫描文档、车牌识别、人脸识别等领域,具有广泛的应用价值。

安装

pip install easyocr

使用

以下是一个简单的示例:

import easyocr
reader = easyocr.Reader(['ch_sim', 'en'], gpu=False) # 选择需要识别的语言
result = reader.readtext('img.png') # 读取图像并进行文本识别
print(result)

第一次运行会下载该库所依赖的模型,输出:

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.

Downloading detection model, please wait. This may take several minutes depending upon your network connection.

分析结束后返回带有元组的列表,可以调用元组的第二个元素即可返回检测结果

easyocr.Reader会检测是否有CUDA,如果有CUDA可以手动开启,将`gpu`这个形参赋值为`True`即可。例如:

reader = easyocr.Reader(['ch_sim', 'en'], gpu=True) # 选择需要识别的语言

识别语言代号

下面是EasyOCR常用的语言代号:

  • ch_sim:简体中文

  • ch_tra:繁体中文

  • en:英语

  • ja:日语

  • ko:韩语

  • de:德语

  • fr:法语

  • es:西班牙语

  • pt:葡萄牙语

ddddocr

用于识别图片验证码的库,名称叫带带弟弟ocr。

安装

pip install ddddocr

使用

以下是一个简单的示例:

import ddddocr
ocr = ddddocr.DdddOcr()
with open('img.png', 'rb') as f:
    img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)

文章作者: Vsoapmac
版权声明: 本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 soap的会员制餐厅
python 第三方库 个人分享
喜欢就支持一下吧