离线视频ocr识别

开源代码
2025-08-13 02:09:03

sudo apt-get install libleptonica-dev libtesseract-dev sudo apt-get install tesseract-ocr-chi-sim python -m pip install video-ocr

windows安装方法：下载安装 digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.3.20231005.exe

下载

wget github /simonflueckiger/tesserocr-windows_build/releases/download/tesserocr-v2.6.0-tesseract-5.3.1/tesserocr-2.6.0-cp311-cp311-win_amd64.whl pip install tesserocr-2.6.0-cp311-cp311-win_amd64.whl git clone github /PinkFloyded/video-ocr.git cd video-ocr notepad setup.py

去掉版本依赖，修改如下：

install_requires=[ "tesserocr", "scipy", "opencv-python", "numpy", "tqdm", "click", "Pillow", ],

之后安装

python setup.py install

如果遇到

RuntimeError: Failed to init API, possibly an invalid tessdata path: ./

则需要设置环境变量TESSDATA_PREFIX为C:\Program Files\Tesseract-OCR\tessdata\

默认只能识别英文，所以要把包改掉

查看默认位置：

Python 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>> import video_ocr >>> video_ocr.__file__ '/home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py' >>> nano /home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py

修改124行添加lang=chi_sim 参数。

def _ocr(frame): pil_image = Image.fromarray(frame.image) text = tesserocr.image_to_text(pil_image,lang="chi_sim") #这行 frame.text = text pbar.update() return frame

之后使用

video-ocr --sample_rate 10 1.mp4

即可识别。效果：

使用--sample_rate 参数可以提高精度数字越大越好

标签：

离线视频ocr识别由讯客互联开源代码栏目发布，感谢您对讯客互联的认可，以及对我们原创作品以及文章的青睐，非常欢迎各位朋友分享到个人网站或者朋友圈，但转载请说明文章出处“离线视频ocr识别”

上一篇
初始MySQL(五)(自我复制数据,合并查询,外连接,MyS

下一篇
TensorFlow的基本概念和使用场景