Halcon OCR字符识别

create_text_model_reader创建一个文本模型描述要用于分割的文本find_text.

的parameter value文本分段方法的值为'自动''手动'.

通常,参数模式应设置为'自动'因为这种模式更稳定,需要更少 配置工作量。请注意,在这种情况下,还有一个 OCR 分类器 必须传入OCRClassifierMLP.仅当 以下限制适用,模式必须设置为'手动':

  • 需要对点阵进行分割。

  • 文本的分段,其中 极性是必需的。例如,由于反射,雕刻的文本经常 具有很强的局部差异。

  • 没有合适的基于 MLP 的 OCR 分类器可用(见下文)。

如果模式 = '自动',find_text能够提取任意大小的文本。可以限制 搜索到具有特定属性的字符,请参阅set_text_model_param了解详情。 此外,必须传入 OCR 分类器OCRClassifierMLP. 此 OCR 分类器必须基于多层感知器 (MLP)。此外 强烈建议使用提供拒绝的 OCR 分类器 类(请参阅set_rejection_params_ocr_class_mlp) 并接受过培训 使用正则化参数(请参阅set_regularization_params_ocr_class_mlp).合适的 OCR classifier 可以使用create_ocr_class_mlp或read_ocr_class_mlp.也可以传递 包含已存储的 OCR 分类器路径的字符串 跟write_ocr_class_mlp.

在以下情况下启用文本分段模式 = '手动', 文本模型的合理参数,包括预期的 字符高度和宽度,必须使用set_text_model_param.在这种情况下,OCRClassifierMLP被忽略。

文本模型可以使用set_text_model_param和get_text_model_param.

由于在调用create_text_model_reader在以下操作中, model 应由运算符显式释放clear_text_model如 一旦它不再使用。

read_image (Image, 'E:/项目/电容/Image_20240311160353328.bmp')

gen_rectangle1 (ROI_0, 967.743, 3347.29, 1342.24, 3829.91)
dev_get_window (WindowHandle)
reduce_domain (Image, ROI_0, ImageReduced)
text_line_orientation (ROI_0, ImageReduced, 30, rad(-30), rad(30), OrientationAngle)
rotate_image (ImageReduced, ImageRotate, deg(-OrientationAngle+rad(180)), 'constant')

gen_rectangle1 (ROI_0, 2438.7, 1691.79, 2582.98, 1856.02)
reduce_domain (ImageRotate, ROI_0, ImageReduced1)
crop_domain (ImageReduced1, ImagePart)

get_image_size (ImagePart, Width, Height)
emphasize (ImagePart, ImageEmphasize, 17, 17, 3)
threshold (ImageEmphasize, Region, 0, 120)
region_to_bin (Region, BinImage, 0, 255, Width, Height)

create_text_model_reader ('auto', 'Universal_0-9A-Z+_Rej.occ', TextModel)
set_text_model_param (TextModel, 'min_stroke_width',3)
set_text_model_param (TextModel, 'min_char_height',20)
find_text (BinImage, TextModel, TextResultID)
get_text_object (Characters, TextResultID, 'all_lines')
get_text_result (TextResultID, 'class', Classes)

area_center (Characters, Area, Row, Column)
query_font (WindowHandle, Font)
* Specify font name and size
FontWithSize := Font[0]+'-40'set_font (WindowHandle, FontWithSize)
disp_message (WindowHandle, Classes, 'image', Row-30, Column , 'green', 'false')

例2:

read_ocr_class_mlp读取已 存储于write_ocr_class_mlp.由于训练了 OCR 分类器可以消耗比较长的时间,分类器是 通常在离线进程中训练,并写入具有write_ocr_class_mlp.在在线流程中,分类器 读取 并随后用于 classification 替换为read_ocr_class_mlpdo_ocr_single_class_mlp或do_ocr_multi_class_mlp.

do_ocr_multi_class_mlp计算每个 区域给出的字符字符和灰色 值图像使用 OCR 分类器OCR汉德尔和 返回类和相应的 中类的置信度(概率)信心. 与do_ocr_single_class_mlp,do_ocr_multi_class_mlp可以对多个字符进行分类 一次调用,因此通常比使用do_ocr_single_class_mlp对单个字符进行分类。 然而do_ocr_multi_class_mlp只能返回最好的 class 的 class 的 intent 值。因为置信度可以被解释 作为概率(参见classify_class_mlp和evaluate_class_mlp),因此很容易检查 一个角色是否被归类为不确定性太大, 这通常不是缺点,除非 类重叠如此之多,以至于在许多情况下,第二好的类 必须进行检查才能决定字符的类别。 在这些情况下,do_ocr_single_class_mlp应该使用。 调用do_ocr_multi_class_mlp,则分类器必须为 训练trainf_ocr_class_mlp.

read_image (Image12, 'E:/Halcon数据/测量程序/OCR识别/12.png')

dev_get_window (WindowHandle)
gen_rectangle1 (ROI_0, 140.933, 176.767, 286.107, 660.934)
reduce_domain (Image12, ROI_0, ImageReduced)
threshold (ImageReduced, Region, 0, 100)
connection (Region, ConnectedRegions)
read_ocr_class_mlp ('DotPrint_NoRej', OCRHandle)
do_ocr_multi_class_mlp (ConnectedRegions, Image12, OCRHandle, Class, Confidence)
smallest_rectangle1 (ConnectedRegions, Row11, Column1, Row2, Column21)
query_font (WindowHandle, Font)
FontWithSize := Font[0]+'-60'
set_font (WindowHandle, FontWithSize)
disp_message (WindowHandle, Class, 'image', Row2+50, Column1, 'green', 'false')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1559713.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

tp6发送邮件功能如何实现?tp6的使用教程?

tp6发送邮件有哪些技巧?tp6发送邮件步骤与设置指南? tp6(ThinkPHP 6)作为一款流行的PHP框架,提供了强大的邮件发送功能,使得开发者能够轻松实现这一需求。AokSend将详细介绍如何在tp6中实现邮件发送功能。…

2024-10-10 问AI: [AI面试题]激活函数在神经网络中的作用是什么?

文心一言 激活函数在神经网络中扮演着至关重要的角色。它们的主要作用包括: 引入非线性: 神经网络中的每一层通常是由线性变换(如权重矩阵乘以输入向量再加上偏置)构成的。如果没有激活函数,多层神经网络将仅仅是一个…

google标签/注册页面/登录页面

1.怎么制作如下谷歌标签&#xff1f; HTML_code: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>D…

扭矩在各行各业的应用_SunTorque

【大家好&#xff0c;我是唐Sun&#xff0c;唐Sun的唐&#xff0c;唐Sun的Sun。一站式数智工厂解决方案服务商】 扭矩在众多行业中都有着广泛且重要的应用&#xff0c;以下为您列举一些&#xff1a; 在汽车行业&#xff0c;扭矩是衡量发动机性能的关键指标之一。发动机输出的扭…

Unity网络开发基础

概述 基础知识 网络开发必备理论 网络基本概念 IP、端口、Mac地址 客户端和服务器 数据通信模型 网络协议 网络协议概述 OSI模型 TCP/IP协议 TCP/IP协议 TCP和UDP 网络通信 网络游戏通信方案概述 通信前的必备知识 IP地址和端口类 域名解析 序列化和反序列化2进制 概述 字符编码…

linux 搭建sentinel

1.下载 linux执行下面的命令下载包 wget https://github.com/alibaba/Sentinel/releases/download/1.8.6/sentinel-dashboard-1.8.6.jar2.启动 nohup java -Dserver.port9090 -Dcsp.sentinel.dashboard.serverlocalhost:9090 -Dproject.namesentinel-dashboard -jar sentin…

【免费可视化仪表盘】轻松实现静态/动态数据可视化图表—积木仪表盘

在当今信息爆炸的时代&#xff0c;如何从海量数据中快速提取关键信息&#xff0c;实现高效决策&#xff0c;成为了企业和个人面临的重大挑战。而积木仪表盘&#xff0c;就如同一位智慧的导航者&#xff0c;为你轻松开启数据可视化的精彩之旅。 代码下载 https://github.com/je…

elementui+vue 多行数据的合并单元格

多行的合并&#xff0c;可以参考&#xff0c;改改就能用 html <template><el-table :data"students" :span-method"objectSpanMethod"><el-table-column prop"grade" label"年级"></el-table-column><el-…

BMS-绝缘检测

一、为什么要进行绝缘检测 前言&#xff1a;BMS绝缘检测是指对电池组与车体之间的绝缘状态进行实时监测和检测。为了确保电池组与车体之间的绝缘性能良好&#xff0c;防止漏电和短路等安全隐患&#xff0c;BMS绝缘检测系统能够及时发现绝缘故障&#xff0c;并采取相应的措施进…

MySQL 联合索引底层存储结构及索引查找过程解读

前言 大家好&#xff0c;我是 Lorin &#xff0c;联合索引&#xff08;Composite Index&#xff09;又称复合索引&#xff0c;它包括两个或更多列。与单列索引不同&#xff0c;联合索引可以覆盖多个列&#xff0c;这有助于加速复杂查询和过滤条件的检索。联合索引的列顺序非常…

接口测试-day3-jmeter-2组件和元件

组件和元件&#xff1a; 组件&#xff1a;组件指的是jmeter里面任意一个可以使用的功能。比如说查看结果树或者是http请求 元件&#xff1a;元件指是提对组件的分类 组件的作用域&#xff1a;组件放的位置不一样生效也不一样。 作用域取决于组件的的层级结构并不取决于组件的…

GIS前端工程师岗位职责、技术要求和常见面试题

文章来源&#xff1a;https://blog.csdn.net/eqmaster/article/details/141891186 GIS 前端工程师负责运用前端技术实现地理信息系统的可视化交互界面&#xff0c;以提升用户对地理数据的操作体验和分析能力。 GIS 后端工程师岗位职责 界面开发 负责 GIS 应用的前端界面设计…

打造智能洗衣店:Spring Boot订单管理系统

1系统概述 1.1 研究背景 如今互联网高速发展&#xff0c;网络遍布全球&#xff0c;通过互联网发布的消息能快而方便的传播到世界每个角落&#xff0c;并且互联网上能传播的信息也很广&#xff0c;比如文字、图片、声音、视频等。从而&#xff0c;这种种好处使得互联网成了信息传…

Ubuntu安装nvidia显卡驱动

一、安装依赖 1、更新 sudo apt update sudo apt upgrade -y 2、基础工具 sudo apt install -y build-essential cmake 图形界面相关 sudo apt install -y lightdm 注:在弹出对话框选择"lightdm" 下载nvidia驱动&#xff1a; 进入如下网址&#xff1a;http…

机器人末端的负载辨识

关节处的摩擦力变小了&#xff0c;导致系统的参数辨识精度会变高&#xff0c;因为动力学方程中的摩擦力项占的比例会变小。 为什么要有一个负载的参数辨识&#xff0c;因为对于整个系统来说&#xff0c;除了负载哈&#xff0c;其他关节都是不变的&#xff0c;出厂时都设置好了&…

Java基础-知识点

文章目录 数据类型包装类型缓存池 String概述不可变的含义不可变的好处String、StringBuffer、StringBuilderString.intern() 运算参数传递float与double隐式类型转换switch 继承访问权限抽象类与接口super重写与重载**1. 重写(Override)****2. 重载(Overload)** Object类的通用…

FFMPEG数据封装格式、多媒体传输协议、音视频编解码器

FFMPEG堪称自由软件中最完备的一套多媒体支持库&#xff0c;它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器&#xff0c;提供了录制、转换以及流化音视频的完整解决方案。 ffmpeg命令行参数解释 ffmpeg -i [输入文件名] [参数选项] -f [格式] [输出…

速通!腾讯发布《2024大模型十大趋势》

【写在前面】 腾讯发布的《2024大模型十大趋势》报告在2024世界人工智能大会上引起了广泛关注。该报告深入分析了人工智能领域的最新进展&#xff0c;特别是大模型技术在不同应用场景中的潜力和影响&#xff0c;并预测了未来人工智能的发展方向。 “大模型技术发展方向 大模型…

深入理解HTTP Cookie

&#x1f351;个人主页&#xff1a;Jupiter. &#x1f680; 所属专栏&#xff1a;Linux从入门到进阶 欢迎大家点赞收藏评论&#x1f60a; 目录 HTTP Cookie定义工作原理分类安全性用途 认识 cookie基本格式实验测试 cookie 当我们登录了B站过后&#xff0c;为什么下次访问B站就…

光伏电站灰尘监测系统的工作原理

型号&#xff1a;TH-HS1】光伏电站灰尘监测系统是一种专门用于监测光伏电站内部灰尘积累情况的系统&#xff0c;通过安装在太阳能电池板表面的传感器&#xff0c;实时收集电池板表面的灰尘信息&#xff0c;包括灰尘厚度、污染比、洁净比等&#xff0c;并将这些数据发送到中央处…