百度PaddleOCR安装

By | 2023/12/12

看到PaddleOCR的ocr识别率挺高,而且还有webjs的版本,所以打算测试下,看了多如牛毛的官方文档,直接一头雾水懵了。这里简单记录下自己的安装方式:

0、环境要求

使用gpu的话,要安装对应的驱动;使用cpu的话需要支持avx,要不在第一步安装完成后,就报内核错误;通过cat /proc/cpuinfo | grep -i avx 查看flags,只要里面有avx就可以安装了;另外尽量使用python3.7-9的版本,别太新,后面磨难重重(一开始使用了3.11都快崩溃了)。

1、安装PaddlePaddle(飞桨)

这一步相当于安装ocr的运行环境,github上的安装手册版本比较老,大家可以根据飞桨快速安装,选择自己合适的方式安装,在这里可以根据飞桨版本、操作系统(windows/macos/linux)、安装方式(pip/conda/docker/编译)、计算平台(cpu/gpu),得到不同的安装指令。

这里的注意事项是,一定要用页面最后的验证方式进行验证下,如果环境有问题,先解决环境问题。

安装完成后您可以使用 python 或 python3 进入 python 解释器,输入import paddle ,再输入 paddle.utils.run_check(),如果出现PaddlePaddle is installed successfully!,说明您已成功安装。

2、安装PaddleOCR whl包

ocr有两种安装方式,可以直接git官方源,也可以通过安装包的方式。因为不打算开发,这里使用后者。直接运行下面的命令就行了,这个命令会执行好久。下面的三条命令是一样的,根据需要进行选择。

# 推荐使用2.0.1+版本
pip install "paddleocr>=2.0.1" -i https://mirror.baidu.com/pypi/simple 

#使用python3.11版本,如果遇到PyMuPDF错误,可以指定版本
pip install "paddleocr>=2.0.1" --upgrade PyMuPDF==1.21.1 -i https://mirror.baidu.com/pypi/simple

#上面指定pymupdf版本的语句,会安装2.6版本的paddleocr,导致不支持最新的PP-OCRv4。

3、测试

随便找一张带文字的图片,使用paddleocr –image_dir 0.bmp –use_gpu false进行测试,如果正常输出就ok了。但……

4、其他

问题1:ImportError: libGL.so.1: cannot open shared object file: No such file or directory

因为我使用的是centos环境,使用yum install mesa-libGL安装依赖。

问题2:AttributeError: module ‘numpy’ has no attribute ‘int’.

numpy的版本太新了,降低版本。pip3 install numpy==1.23.5

问题3:ModuleNotFoundError: No module named ‘pip._internal.cli.main’

pip版本太低,直接更新即可。python3 -m pip install –upgrade pip

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据