图色_OCR模型识别

LhOcrDetect本命令必须搭配"后台_绑定窗口"使用.使用本接口前请先加载ocr模型,“ocr_加载模型_从路径”

cpp

BSTR LhOcrDetect(x1, y1, x2, y2, Confidence, mode, Padding, MaxSideLen, BoxScoreThresh, BoxThresh, UnClipRatio, DoAngle, MostAngle)

x1: 查找区域范围的左上角坐标,区域范围全为0时表示全屏查找。

y1: 查找区域范围的左上角坐标,区域范围全为0时表示全屏查找。

x2: 查找区域范围的右下角坐标,区域范围全为0时表示全屏查找。

y2: 查找区域范围的右下角坐标,区域范围全为0时表示全屏查找。

Confidence: 置信度，范围0-1，传0显示所有结果

mode: 默认请传入0。

Padding: 默认请传入50，图像预处理，在图片外周添加白边，用于提升识别率，文字框没有正确框住所有文字时，增加此值。

MaxSideLen: 默认请传入1024，按图片最长边的长度，此值为0代表不缩放，例：1024，如果图片长边大于1024则把图像整体缩小到1024再进行图像分割计算，如果图片长边小于1024则不缩放，如果图片长边小于32，则缩放到32。

BoxScoreThresh: 默认请传入0.5，文字框置信度门限，文字框没有正确框住所有文字时，减小此值。

BoxThresh: 请传入0.3，只在程序内部使用，不需要更改。（这个只是中间运算步骤的一个门限值，大概是图片dbnet之后，把彩色图3通道转换为黑白1通道，文字所在区域转换成黑色的区域，白色区域就是不含文字的部分，这个参数用途是过滤掉太小的黑色区域，或者说是噪点）

UnClipRatio: 默认请传入1.6，单个文字框大小倍率，越大时单个文字框越大。此项与图片的大小相关，越大的图片此值应该越大。

DoAngle: 默认请传入1，启用(1)/禁用(0) 文字方向检测，只有图片倒置的情况下(旋转90~270度的图片)，才需要启用文字方向检测。

MostAngle: 默认请传入1，启用(1)/禁用(0) 角度投票(整张图片以最大可能文字方向来识别)，当禁用文字方向检测(DoAngle)时，此项也不起作用。

返回识别的文本结果

“-88”: 未注册插件，无法调用本函数

“-2”: 内部没有截图成功

“-10”: 坐标越界，请检查x1,y1,x2,y2是否正确

主题切换

全屏

复制代码

图色_OCR模型识别 ​