Skip to content

ocr_识别路径

函数简介

OcrDetectFile传入图片路径返回识别结果(成功Ocr_加载模型后才能使用本函数)

函数原型

cpp
BSTR OcrDetectFile(ImgFile, Confidence, Ret, Padding, MaxSideLen, BoxScoreThresh, BoxThresh, UnClipRatio, DoAngle, MostAngle)

参数定义

ImgFile: 图片文件所在路径

Confidence: 置信度,范围0-1,传0显示所有结果

Ret: 填入文本型变量接收返回的结果文本(带坐标、置信度)。从左到右的内容分别为文本|x1|y1|x2|y2|x3|y3|x4|y4|w|h|confidence,每个参数以|fenge|隔开,每个结果以|huanghang|隔开,如:高火插件接口文档|fenge|3|fenge|2|fenge|102|fenge|2|fenge|102|fenge|19|fenge|3|fenge|19|fenge|99|fenge|17|fenge|0.815578|huanhang|

Padding: 默认请传入50,图像预处理,在图片外周添加白边,用于提升识别率,文字框没有正确框住所有文字时,增加此值。

MaxSideLen: 默认请传入1024,按图片最长边的长度,此值为0代表不缩放,例:1024,如果图片长边大于1024则把图像整体缩小到1024再进行图像分割计算,如果图片长边小于1024则不缩放,如果图片长边小于32,则缩放到32。

BoxScoreThresh: 默认请传入0.5,文字框置信度门限,文字框没有正确框住所有文字时,减小此值。

BoxThresh: 请传入0.3,只在程序内部使用,不需要更改。(这个只是中间运算步骤的一个门限值,大概是图片dbnet之后,把彩色图3通道转换为黑白1通道,文字所在区域转换成黑色的区域,白色区域就是不含文字的部分,这个参数用途是过滤掉太小的黑色区域,或者说是噪点)

UnClipRatio: 默认请传入1.6,单个文字框大小倍率,越大时单个文字框越大。此项与图片的大小相关,越大的图片此值应该越大。

DoAngle: 默认请传入1,启用(1)/禁用(0) 文字方向检测,只有图片倒置的情况下(旋转90~270度的图片),才需要启用文字方向检测。

MostAngle: 默认请传入1,启用(1)/禁用(0) 角度投票(整张图片以最大可能文字方向来识别),当禁用文字方向检测(DoAngle)时,此项也不起作用。

返回值

返回识别的文本结果(不带坐标、置信度)

“-88”: 未注册插件,无法调用本函数

易语言调用例子


主题切换
 全屏
复制代码

离火插件易语言模块源码


主题切换
 全屏
复制代码

离火AI插件官方网址 https://www.lihuochajian.com