Appearance
图色_OCR模型识别
函数简介
LhOcrDetect
本命令必须搭配"后台_绑定窗口"使用.使用本接口前请先加载ocr模型,“ocr_加载模型_从路径”
函数原型
cpp
BSTR LhOcrDetect(x1, y1, x2, y2, Confidence, mode, Padding, MaxSideLen, BoxScoreThresh, BoxThresh, UnClipRatio, DoAngle, MostAngle)
参数定义
x1
: 查找区域范围的左上角坐标,区域范围全为0时表示全屏查找。
y1
: 查找区域范围的左上角坐标,区域范围全为0时表示全屏查找。
x2
: 查找区域范围的右下角坐标,区域范围全为0时表示全屏查找。
y2
: 查找区域范围的右下角坐标,区域范围全为0时表示全屏查找。
Confidence
: 置信度,范围0-1,传0显示所有结果
mode
: 默认请传入0。
- 0:返回识别的文字
- 1:返回结果中带文本结果、4点坐标、宽度、高度、相似度
Padding
: 默认请传入50,图像预处理,在图片外周添加白边,用于提升识别率,文字框没有正确框住所有文字时,增加此值。
MaxSideLen
: 默认请传入1024,按图片最长边的长度,此值为0代表不缩放,例:1024,如果图片长边大于1024则把图像整体缩小到1024再进行图像分割计算,如果图片长边小于1024则不缩放,如果图片长边小于32,则缩放到32。
BoxScoreThresh
: 默认请传入0.5,文字框置信度门限,文字框没有正确框住所有文字时,减小此值。
BoxThresh
: 请传入0.3,只在程序内部使用,不需要更改。(这个只是中间运算步骤的一个门限值,大概是图片dbnet之后,把彩色图3通道转换为黑白1通道,文字所在区域转换成黑色的区域,白色区域就是不含文字的部分,这个参数用途是过滤掉太小的黑色区域,或者说是噪点)
UnClipRatio
: 默认请传入1.6,单个文字框大小倍率,越大时单个文字框越大。此项与图片的大小相关,越大的图片此值应该越大。
DoAngle
: 默认请传入1,启用(1)/禁用(0) 文字方向检测,只有图片倒置的情况下(旋转90~270度的图片),才需要启用文字方向检测。
MostAngle
: 默认请传入1,启用(1)/禁用(0) 角度投票(整张图片以最大可能文字方向来识别),当禁用文字方向检测(DoAngle)时,此项也不起作用。
返回值
返回识别的文本结果
“-88”: 未注册插件,无法调用本函数
“-2”: 内部没有截图成功
“-10”: 坐标越界,请检查x1,y1,x2,y2是否正确
离火插件易语言模块源码
主题切换
全屏复制代码