看到PaddleOCR的ocr识别率挺高,而且还有webjs的版本,所以打算测试下,看了多如牛毛的官方文档,直接一头雾水懵了。这里简单记录下自己的安装方式:
0、环境要求
使用gpu的话,要安装对应的驱动;使用cpu的话需要支持avx,要不在第一步安装完成后,就报内核错误;通过cat /proc/cpuinfo | grep -i avx 查看flags,只要里面有avx就可以安装了;另外尽量使用python3.7-9的版本,别太新,后面磨难重重(一开始使用了3.11都快崩溃了)。
1、安装PaddlePaddle(飞桨)
这一步相当于安装ocr的运行环境,github上的安装手册版本比较老,大家可以根据飞桨快速安装,选择自己合适的方式安装,在这里可以根据飞桨版本、操作系统(windows/macos/linux)、安装方式(pip/conda/docker/编译)、计算平台(cpu/gpu),得到不同的安装指令。
这里的注意事项是,一定要用页面最后的验证方式进行验证下,如果环境有问题,先解决环境问题。
2、安装PaddleOCR whl包
ocr有两种安装方式,可以直接git官方源,也可以通过安装包的方式。因为不打算开发,这里使用后者。直接运行下面的命令就行了,这个命令会执行好久。下面的三条命令是一样的,根据需要进行选择。
# 推荐使用2.0.1+版本
pip install "paddleocr>=2.0.1" -i https://mirror.baidu.com/pypi/simple
#使用python3.11版本,如果遇到PyMuPDF错误,可以指定版本
pip install "paddleocr>=2.0.1" --upgrade PyMuPDF==1.21.1 -i https://mirror.baidu.com/pypi/simple
#上面指定pymupdf版本的语句,会安装2.6版本的paddleocr,导致不支持最新的PP-OCRv4。
3、测试
随便找一张带文字的图片,使用paddleocr –image_dir 0.bmp –use_gpu false进行测试,如果正常输出就ok了。但……
4、其他
问题1:ImportError: libGL.so.1: cannot open shared object file: No such file or directory
因为我使用的是centos环境,使用yum install mesa-libGL安装依赖。
问题2:AttributeError: module ‘numpy’ has no attribute ‘int’.
numpy的版本太新了,降低版本。pip3 install numpy==1.23.5
问题3:ModuleNotFoundError: No module named ‘pip._internal.cli.main’
pip版本太低,直接更新即可。python3 -m pip install –upgrade pip