1、数据增强
2、指标
3、vit 、swint
ViT算法,创新性地将图像划分成一个个patch,并将每个patch展平为一个向量,使得图像数据转化为序列化数据,之后输入到Transformer模型中,实现了Transformer在图像分类任务中的应用。
Swin Transformer是基于Transformer的视觉模型,采用滑动窗口和分层结构,适用于图像分类和目标检测任务。
4、一阶段、二阶段算法:
5、NMS
6 、transform
7、 yolov5
ViT算法,创新性地将图像划分成一个个patch,并将每个patch展平为一个向量,使得图像数据转化为序列化数据,之后输入到Transformer模型中,实现了Transformer在图像分类任务中的应用。
Swin Transformer是基于Transformer的视觉模型,采用滑动窗口和分层结构,适用于图像分类和目标检测任务。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/35477.html
如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!