Halcon深度学习网络模型简介

        HALCON为分类和语义分割提供了预训练的神经网络。当训练自定义网络时,这些神经网络是很好的起点。它们已经在一个大型图像数据集上进行了预训练。对于异常检测,HALCON提供了初始模型。

     

用于 3D 抓取点检测的模型

       为 3D 抓取点检测提供了以下网络:

'pretrained_dl_3d_gripping_point.hdl'

       网络最多需要 5 个类型的图像 :real

       'image':强度(灰度值)图像

       'x':X 图像(值需要从左到右增加)

       'y':Y 图像(值需要从上到下增加)

       ‘z’: z图像(值需要从靠近传感器的点增加到远点;例如,如果数据是在相机坐标系中给出的情况)

       ' normals':2D 映射

       此外,网络需要某些图像属性(对于上面提到的所有输入图像)。可以使用get_dl_model_param检索相应的值。默认值:

       “image_width”: 640

       “image_height”: 480

       网络架构允许对图像尺寸进行更改。

异常检测模型

      异常检测主要检测数据中的离群点,异常数据的特征值与正常数据的特征值距离较远。

      提供了以下网络用于异常检测:

'initial_dl_anomaly_medium.hdl'

      此神经网络旨在提高内存和运行时效率。

      网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:       

      “image_width”:480

      “image_height”: 480

      “image_num_channels”: 3

      “image_range_min”: -2

      “image_range_max”: 2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是32像素的倍数,因此最少为32像素

'initial_dl_anomaly_large.hdl'

      这种神经网络被认为更适合于更复杂的异常检测任务。这样做的代价是需要更多的时间和内存。

    网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:  

      “image_width”: 480

      “image_height”: 480

      “image_num_channels”: 3

      “image_range_min”: -2

      “image_range_max”: 2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是32像素的倍数,因此最少为32像素。

全局上下文异常检测模型

       “全局上下文异常值检测”是一种独一无二的技术,能够“理解”整个图像的逻辑内容。 与 HALCON 先前异常值检测功能一样,新的“全局上下文异常检测”只需要训练无缺陷图像,无需数据标记。 这项技术可以检测组件缺失、变形或者排布错位等异常,在半导体生产中的印刷电路板检测场景、印刷痕迹的检测场景也有非常优秀的表现。

      为全局上下文异常检测提供了以下网络:

“pretrained_dl_anomaly_global_context.hdl”

      网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:256

      “image_height”:256

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

分类模型:

      提供以下预训练神经网络用于分类,并可作为检测的骨干:

'pretrained_dl_classifier_alexnet.hdl':

      这个神经网络是为简单的分类任务而设计的。它的特点是第一层卷积核比其他具有类似分类性能的网络(例如pretrained_dl_classifier_compact.hdl)中的卷积核要大。这可能有利于特征提取。

      此分类器期望图像属于该类型。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”: 224

      “image_height”: 224

      “image_num_channels”: 3

      “image_range_min”: -127.0

      “image_range_max”: 128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于29像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。改变图像大小将重新初始化完全连接层的权重,因此需要重新训练。

      请注意,可以通过融合卷积层和ReLU层来改善该网络的运行时间,参见set_dl_model_param和参数‘fuse_conv_relu’。

“pretrained_dl_classifier_compact.hdl”:

      这种神经网络被设计成具有更高的内存和运行效率。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      该网络不包含任何完全连接的层。网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于15像素。

“pretrained_dl_classifier_enhanced.hdl”:

      这个神经网络比pretrained_dl_classifier_compact有更多的隐藏层。因此被认为更适合于更复杂的分类任务。这样做的代价是需要更多的时间和内存。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于47像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。改变图像大小将重新初始化完全连接层的权重,因此需要重新训练。

'pretrained_dl_classifier_mobilenet_v2.hdl':

      这个分类器是一个小而低功耗的模型,因为什么原因它更适合于移动和嵌入式视觉应用。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。

      在GPU上,网络架构可以从特殊的优化中受益匪浅,没有这些优化,网络就会明显变慢。

'pretrained_dl_classifier_resnet18.hdl':

      随着神经网络pretrained_dl_classifier_enhanced。这个分类器适用于更复杂的任务。然而,由于其特殊的结构,它提供了使训练更稳定和内部更鲁棒的优势。与神经网络pretrained_dl_classifier_resnet50相比。它不那么复杂,推理时间也更快。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。尽管是完全连接层,图像大小的改变并不会导致权重的重新初始化。

'pretrained_dl_classifier_resnet50.hdl':

        随着神经网络pretrained_dl_classifier_enhanced。这个分类器适用于更复杂的任务。然而,由于其特殊的结构,它提供了使训练更稳定和内部更鲁棒的优势。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。尽管是完全连接层,图像大小的改变并不会导致权重的重新初始化。

语义分割模型

      语义分割结合了图像分类、目标检测和图像分割,通过一定的方法将图像分割成具有一定语义含义的区域块,并识别出每个区域块的语义类别,实现从底层到高层的语义推理过程,最终得到一幅具有逐像素语义标注的分割图像。

      以下预训练神经网络用于语义 分割:

'pretrained_dl_edge_extractor.hdl':

      该神经网络是为边缘提取而设计和预训练的。因此,该模型适用于两类问题,一类用于边缘,一类用于背景。

      该网络期望图像是该类型的。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:512

      “image_height”:512

      “image_num_channels”:1

      “image_range_min”:-127.0

      “image_range_max”:128.0

      “num_classes”:2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是16像素的倍数,因此最少为16像素。

“pretrained_dl_segmentation_compact.hdl”:

      该神经网络设计用于处理具有详细结构的分割任务,并且仅使用少量内存并且运行时效率高。

      网络架构允许更改图像尺寸,但要求最小的“image_width”和“image_height”为21像素。

“pretrained_dl_segmentation_enhanced.hdl”:

      ​​​​​​​ 这个神经网络比pretrained_dl_segmentation_compact有更多的隐藏层。因此更适合于包括更复杂场景在内的分割任务。

      网络架构允许更改图像尺寸,但要求最小的image_width和image_height为47像素。

Deep OCR 模型

      为 Deep OCR 提供了以下预训练神经网络:

'pretrained_deep_ocr_recognition.hdl':

      该神经网络是深度OCR模型的预训练识别组件。它被设计用来识别被裁剪成单个单词的图像上的单词。这是深度OCR的识别部分,可以再训练。

      该网络期望图像是该类型的。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:120

      “image_height”:32

      “image_num_channels”:1

      “image_range_min”:-1.0

      “image_range_max”:1.0

      网络架构允许改变图像宽度‘image_width’。图像高度‘image_height’不能更改。参数‘image_width’非常重要:它的值可以减少或增加以适应单词的预期长度,例如,由于每个字符的平均宽度。更大的image_width将消耗更多的时间和内存资源。图像宽度‘image_width’可以在训练后更改。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/14147.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

破解企业数字化转型之道:数字化?转型?

在当今的商业浪潮中,企业纷纷踏上了数字化转型之路,然而,真正洞悉数字化转型的深层含义者寥寥无几。笔者前面发过一篇文章>>数字化转型,90%都是吹牛,引起热议。文章指出多数企业的数字化转型仅是随波逐流&#x…

HTML学习

一、HTML的基本构成 <!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>星星(xingxing.com)</title> </head> <body><h1>我的第一个标题</h1><p>我的第一个段落。</p><a h…

为什么人们仍然对云安全感到困惑?

云安全服务商公司的一份报告发现&#xff0c;接受调查的公司中有74%暴露了存储或其他错误配置。这为网络罪犯打开了一扇危险的大门。总的来说&#xff0c;云安全越来越糟糕。安全工具的可用性和质量越来越好&#xff0c;但确认云计算基础设施的人却越来越笨。有些东西必须要放弃…

计算机网络基础(3)_应用层自定义协议与序列化

个人主页&#xff1a;C忠实粉丝 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 C忠实粉丝 原创 计算机网络基础(3)_应用层自定义协议与序列化 收录于专栏【计算机网络】 本专栏旨在分享学习计算机网络的一点学习笔记&#xff0c;欢迎大家在评论区交流讨论&a…

前言 --- 《跟着小王学Python》

前言 《跟着小王学Python》 是一套精心设计的Python学习教程&#xff0c;适合各个层次的学习者。本教程从基础语法入手&#xff0c;逐步深入到高级应用&#xff0c;以实例驱动的方式&#xff0c;帮助学习者逐步掌握Python的核心概念。通过开发游戏、构建Web应用、编写网络爬虫、…

【C#设计模式(8)——过滤器模式(Adapter Pattern)】

前言 滤液器模式可以很方便地实现对一个列表中的元素进行过滤的功能&#xff0c;能方便地修改滤器的现实&#xff0c;符合开闭原则。 代码 //过滤接口public interface IFilter{List<RefuseSorting> Filter(List<RefuseSorting> refuseList);}//垃圾分类public cla…

开源共建 | 长安链开发常见问题及规避

长安链开源社区鼓励社区成员参与社区共建&#xff0c;参与形式包括不限于代码贡献、文章撰写、社区答疑等。腾讯云区块链王燕飞在参与长安链测试工作过程中&#xff0c;深入细致地总结了长安链实际开发应用中的常见问题及其有效的规避方法&#xff0c;相关内容多次解答社区成员…

什么是RAG? LangChain的RAG实践!

1. 什么是RAG RAG的概念最先在2020年由Facebook的研究人员在论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出来。在这篇论文中他们提出了两种记忆类型&#xff1a; 基于预训练模型&#xff08;当时LLM的概念不像现在这么如日中天&#xff0…

第二十一章、Qt对XML文件进行读写操作详解

目录 一、XML文件的简介 二、QXML的接口介绍 三、XML示例 四、QXML的介绍 5.1、QDomDocument详解 5.2、QDomElement详解 5.3、QDomAttr详解 六、使用QXML解析XML示例 七、构建并保存xml 一、XML文件的简介 可扩展标记语言 (Extensible Markup Language, XML) ,标准通…

03-axios常用的请求方法、axios错误处理

欢迎来到“雪碧聊技术”CSDN博客&#xff01; 在这里&#xff0c;您将踏入一个专注于Java开发技术的知识殿堂。无论您是Java编程的初学者&#xff0c;还是具有一定经验的开发者&#xff0c;相信我的博客都能为您提供宝贵的学习资源和实用技巧。作为您的技术向导&#xff0c;我将…

小小的mfc100u.dll文件到底是什么?mfc100u.dll丢失的解决方法有哪些?

对于许多电脑用户来说&#xff0c;软件突然无法启动并显示“mfc100u.dll丢失”是一件非常头疼的事情。你可能正急于完成一份重要的文档&#xff0c;或者沉浸在紧张刺激的游戏关卡中&#xff0c;而这个错误提示就像一盆冷水&#xff0c;无情地浇灭了你的热情。这个小小的mfc100u…

华为eNSP:MSTP

一、什么是MSTP&#xff1f; 1、MSTP是IEEE 802.1S中定义的生成树协议&#xff0c;MSTP兼容STP和RSTP&#xff0c;既可以快速收敛&#xff0c;也提供了数据转发的多个冗余路径&#xff0c;在数据转发过程中实现VLAN数据的负载均衡。 2、MSTP可以将一个或多个VLAN映射到一个Inst…

使用cloudflare搭建私人docker镜像站

背景 大家是否也有docker镜像拉取速度慢&#xff0c;甚至直接拉不下来的情况&#xff0c;我们可以使用cloudflare加速拉取镜像。 申请域名 开始前需要准备cloudflare账号并自购一个域名。域名可以在云厂商购买&#xff0c;可以看到非主流域名比较实惠。 购买完成后在域名控…

晶振选择指南:应对温度波动的关键因素

晶振的选择对于电子设备来说至关重要&#xff0c;尤其是在面对温度波动的情况下。晶振作为时钟信号源&#xff0c;其性能直接影响到设备的稳定性和可靠性。因此&#xff0c;在选择晶振时&#xff0c;需要根据实际应用场景以及对时钟精度的要求来进行。以下是一些建议&#xff1…

gpu-V100显卡相关知识

一、定义 RuntimeError: FlashAttention only supports Ampere GPUs or newer.torch attention注意力接口学习V100 架构是什么&#xff1f; 二、实现 RuntimeError: FlashAttention only supports Ampere GPUs or newer. 报错原因分析&#xff1a; GPU机器配置低&#xff0c;…

【go从零单排】HTTP客户端和服务端

&#x1f308;Don’t worry , just coding! 内耗与overthinking只会削弱你的精力&#xff0c;虚度你的光阴&#xff0c;每天迈出一小步&#xff0c;回头时发现已经走了很远。 &#x1f4d7;概念 在 Go 语言中&#xff0c;net/http 包提供了强大的 HTTP 客户端和服务器功能。 &…

从Web2到Web3:区块链推动的数字进化之路

互联网的演变从最初的Web1到如今的Web3&#xff0c;代表了技术和用户需求的深刻变化。Web3是一个基于区块链技术的全新互联网架构&#xff0c;旨在解决传统互联网&#xff08;即Web2&#xff09;中数据集中化和隐私保护等问题。通过去中心化的机制&#xff0c;Web3不仅能够增强…

vue自定义计算器组件

自定义组件实现以下简单的计算器功能&#xff1a; 创建计算器组件文件calculator.vue&#xff0c;代码如下&#xff1a; <template><div class"calculator"><!-- 当前运算过程显示区域 --><div class"expression">{{ currentExpr…

希音面试:亿级用户 日活 月活,如何统计?(史上最强 HyperLogLog 解读)

本文原文链接 尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50)中&#xff0c;最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格&#xff0c;遇到很多很重要的面试题&#xff1a; 如何 统计一个 网站 的日活、月活数&a…

2023年MathorCup数学建模B题城市轨道交通列车时刻表优化问题解题全过程文档加程序

2023年第十三届MathorCup高校数学建模挑战赛 B题 城市轨道交通列车时刻表优化问题 原题再现&#xff1a; 列车时刻表优化问题是轨道交通领域行车组织方式的经典问题之一。列车时刻表规定了列车在每个车站的到达和出发&#xff08;或通过&#xff09;时刻&#xff0c;其在实际…