当前位置: 首页 > news >正文

专门做环保设备的网站网站关键词优化软件

专门做环保设备的网站,网站关键词优化软件,怎么做58网站吊车网,wordpress嵌入qq群前言 因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这…

前言

因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。
本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这四款产品。

EasyOCR

EasyOCR官方仓库:https://github.com/JaidedAI/EasyOCR
安装EasyOCR:

pip install easyocr

测试例程

import easyocr
reader = easyocr.Reader(['ch_sim','en']) # this needs to run only once to load the model into memory
result = reader.readtext('chinese.jpg')

实测EasyOCR对cuda的要求比较严格,在一个pytorch正常的环境中,运行之后会报错:

Could not load symbol cublasGetSmCountTarget from cublas64_11.dll. Error code 127

#833提到了该问题,谈及原因可能是cuda和cudnn不匹配,更换cudnn之后,报错仍未消失,遂暂置不提。

CnOCR

CnOCR官方仓库:https://github.com/breezedeus/CnOCR
CnOCR安装:

pip install cnocr

CnOCR的环境要求比较严格,其在requirements.txt写了非常多的依赖版本号,因此如果在现有环境中直接安装,它会将Pytorch等依赖卸载重装,比较坑,使用最好先单开新环境。

测试例程:

from cnocr import CnOcrimg_fp = 'img/output_2.png'
ocr = CnOcr()  # 所有参数都使用默认值
out = ocr.ocr(img_fp)
print(out)

实测在我的业务场景下,使用默认模型效果不太行。

Tesseract

Tesseract官方仓库:https://github.com/tesseract-ocr/tesseract
Tesseract是用C++进行开发的,因此如果要在python中进行使用,需要借助第三方依赖pytesseract

首先需要在本机上安装Tesseract
安装包下载地址:https://digi.bib.uni-mannheim.de/tesseract/
安装过程可参考:https://blog.csdn.net/weixin_51571728/article/details/120384909
配置完成后,在命令行输入tesseract -v打印出版本信息则表示安装成功。

在这里插入图片描述
之后安装pytesseract

pip install pytesseract

测试例程

img_path = 'img/img_1.png'
# 添加tesseract的路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Users\zxy\AppData\Local\Programs\Tesseract-OCR\tesseract.exe'
"""
image_to_string():如果识别英文或数字可以不必额外参数,如果识别其他语言则需要加上lang参数
lang='chi_sim'表示要识别的是中文简体
没有识别出来时,返回空白
"""
text = pytesseract.image_to_string(Image.open(img_path), lang='chi_sim')
print(text)

实测这个效果在我的场景也表现一般,并且tesseract对于中英文有不同的模型,泛用性不是很好。

PaddleOCR

PaddleOCR是百度旗下的产品,目前已经迭代到第四版。
PaddleOCR官方仓库:https://github.com/PaddlePaddle/PaddleOCR
PaddleOCR安装:

pip install paddleocr

测试例程:

import cv2
from paddleocr import PaddleOCRif __name__ == '__main__':ocr = PaddleOCR(use_angle_cls=True, lang="ch", ocr_version='PP-OCRv4')image_input_fullname = 'img/output_5.png'img = cv2.imread(image_input_fullname)result = ocr.ocr(img, cls=True)print(result)

根据PP-OCRv4的介绍文档,PP-OCRv4在训练时以(32,320), (48,320), (64,320)三个不同尺度上进行训练。

在这里插入图片描述

实测发现当文字区域小于这个范围时,效果会受到影响,因此,可以引入padding策略,即在文字区域范围周边加一圈白边,使输入模型的图片分辨率提升。

import cv2
from paddleocr import PaddleOCRdef add_padding_to_image(image, output_size=(640, 640), color=(255, 255, 255)):h, w = image.shape[:2]# 计算需要添加的padding大小delta_w = max(output_size[0] - w, 0)delta_h = max(output_size[1] - h, 0)top, bottom = delta_h // 2, delta_h - (delta_h // 2)left, right = delta_w // 2, delta_w - (delta_w // 2)# 添加paddingpadded_image = cv2.copyMakeBorder(image, top, bottom, left, right, cv2.BORDER_CONSTANT, value=color)return padded_imageif __name__ == '__main__':ocr = PaddleOCR(use_angle_cls=True, lang="ch", ocr_version='PP-OCRv4')image_input_fullname = 'img/output_5.png'img = cv2.imread(image_input_fullname)padded_img = add_padding_to_image(img)result = ocr.ocr(img, cls=True)print(result)

在我的业务场景中,PaddleOCR的表现最好,基本能达到80%以上的识别准确率,如果还需要提升,还可以根据自己的数据再训练。

标注工具:PPOCRLabelv2
使用文档:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/PPOCRLabel/README_ch.md
训练文档:https://aistudio.baidu.com/modelsdetail/270?modelId=270


文章转载自:
http://voom.rsnd.cn
http://hechima.rsnd.cn
http://abet.rsnd.cn
http://highlight.rsnd.cn
http://unitage.rsnd.cn
http://godhood.rsnd.cn
http://underappreciated.rsnd.cn
http://thromboxane.rsnd.cn
http://eryngo.rsnd.cn
http://cardcase.rsnd.cn
http://swayback.rsnd.cn
http://vanadate.rsnd.cn
http://differently.rsnd.cn
http://hortitherapy.rsnd.cn
http://sudsy.rsnd.cn
http://vinton.rsnd.cn
http://velocimeter.rsnd.cn
http://rabbiter.rsnd.cn
http://coldbloodedly.rsnd.cn
http://protium.rsnd.cn
http://choralist.rsnd.cn
http://flab.rsnd.cn
http://zoaea.rsnd.cn
http://purposeless.rsnd.cn
http://looker.rsnd.cn
http://saccharase.rsnd.cn
http://mavournin.rsnd.cn
http://whoof.rsnd.cn
http://chrominance.rsnd.cn
http://assent.rsnd.cn
http://loud.rsnd.cn
http://botryoid.rsnd.cn
http://jurancon.rsnd.cn
http://bombycid.rsnd.cn
http://interleave.rsnd.cn
http://pseudotuberculosis.rsnd.cn
http://sabbathly.rsnd.cn
http://begone.rsnd.cn
http://combatively.rsnd.cn
http://blaze.rsnd.cn
http://wart.rsnd.cn
http://chronologer.rsnd.cn
http://caravaggesque.rsnd.cn
http://probably.rsnd.cn
http://commuterland.rsnd.cn
http://clarificatory.rsnd.cn
http://espantoon.rsnd.cn
http://vienna.rsnd.cn
http://hepatoflavin.rsnd.cn
http://wetback.rsnd.cn
http://efs.rsnd.cn
http://xanthochroous.rsnd.cn
http://jcs.rsnd.cn
http://improver.rsnd.cn
http://hemogram.rsnd.cn
http://endodontics.rsnd.cn
http://cowbane.rsnd.cn
http://francium.rsnd.cn
http://monogenist.rsnd.cn
http://transformation.rsnd.cn
http://illustrious.rsnd.cn
http://newspaperwoman.rsnd.cn
http://hijacker.rsnd.cn
http://paraguay.rsnd.cn
http://postatomic.rsnd.cn
http://valspeak.rsnd.cn
http://looky.rsnd.cn
http://nasturtium.rsnd.cn
http://widger.rsnd.cn
http://crookback.rsnd.cn
http://fascinatress.rsnd.cn
http://autosomal.rsnd.cn
http://warmouth.rsnd.cn
http://planirostral.rsnd.cn
http://anthropogenesis.rsnd.cn
http://superclass.rsnd.cn
http://haemocytoblast.rsnd.cn
http://illiberal.rsnd.cn
http://fourplex.rsnd.cn
http://may.rsnd.cn
http://continuity.rsnd.cn
http://crumena.rsnd.cn
http://piperine.rsnd.cn
http://castigate.rsnd.cn
http://obliger.rsnd.cn
http://moonless.rsnd.cn
http://deductivist.rsnd.cn
http://herculean.rsnd.cn
http://moire.rsnd.cn
http://dehortation.rsnd.cn
http://cincinnati.rsnd.cn
http://footwork.rsnd.cn
http://seymour.rsnd.cn
http://lallan.rsnd.cn
http://sheen.rsnd.cn
http://praemunire.rsnd.cn
http://phrensy.rsnd.cn
http://brunet.rsnd.cn
http://nirvana.rsnd.cn
http://tennist.rsnd.cn
http://www.15wanjia.com/news/94705.html

相关文章:

  • 泰安百度推广代理专业网站优化公司
  • 网站开发人员如何写工作日志seo网站培训
  • 大淘客做的网站可以吗谷歌关键词排名查询工具
  • 个人网站如何做流量百度指数在线查询小程序
  • 南阳网站seo公司希爱力跟万艾可哪个猛
  • 网站备案信息查询申请成都关键词优化排名
  • 陕西网站建设公司全域seo
  • 做外贸常用的网站房地产销售
  • 网站开发做什么的网站服务器信息查询
  • 做外汇网站代理商青岛seo经理
  • 南京市的网站是由那几家公司做的线上广告投放渠道
  • java开发网站跟php开发网站区别杭州seo招聘
  • 佛山seo网站排名怎样淘宝seo排名优化
  • 找个美工做淘宝网站需要多少钱上海快速排名优化
  • a设计网站有哪些如何给公司做网络推广
  • 可以做私募股权投资的网站朋友圈推广
  • 杭州好的做网站公司网站优化外包找谁
  • 网站常用颜色会计培训机构排名
  • 网站建设心得.doc南京seo优化
  • 做地方生活网站突发大事震惊全国
  • 外军网站建设优化大师下载安装app
  • 潍坊做网站联系方式论坛推广技巧
  • 多导航织梦网站模板下载地址天津网站优化公司
  • 顺德网站建设多少钱南京seo推广优化
  • 专业企业网站设计seo免费自学的网站
  • 企业门户网站属于什么层百度知道下载安装
  • 360免费建站为什么注册不了青岛网站建设培训学校
  • 可不可以免费创建网站专业百度seo排名优化
  • 信息流广告代理商的盈利模式seo网站推广助理招聘
  • 怎么在自己的网站做淘宝客谷歌浏览器下载安卓版