PaddlePaddle飞浆搭建和机器学习文字识别

官网:https://www.paddlepaddle.org.cn/
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

安装 PaddlePaddle 对python版本是有要求,2022年11月21日15:04:36最新的PaddlePaddle(2.3.2)不能用最新python安(3.11.0)装。可以使用3.7、3.8、3.9的python版本安装,其他版本我没测试,这里用的py3.9.13 下面的python版本为3.9.13 window install版

cmd执行安装飞浆

# 配置阿里云镜像
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

python -m pip install paddlepaddle==2.3.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

image-1669014423651

安装中
image-1669014438349

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
安装PaddleOCR
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/quickstart.md

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

安装PaddleOCR whl,用于调用

pip install "paddleocr>=2.3.2"

等待它安装完毕
image-1669014501408

图片识别
在Win+R的cmd执行,否则会找不到命令

paddleocr --image_dir ./Desktop/picture/微信图片_20220425094332.jpg --use_angle_cls true --use_gpu false

中英文检查:检测+方向分类器+识别全流程:
–use_angle_cls true设置使用方向分类器识别180度旋转文字,
–use_gpu false设置不使用GPU
image-1669014546924

在py代码中识别
idea安装了插件,创建一个项目
image-1669014619606

编写识别代码

from paddleocr import PaddleOCR, draw_ocr

# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = './微信图片_20220425094332.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):
    res = result[idx]
    for line in res:
        print(line)

# 显示结果
from PIL import Image
result = result[0]
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='C:\\Windows\\Fonts\\simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

需要安装一些包
image-1669014635545
执行完毕
image-1669014640416

image-1669014651560