道路驾驶视角人车检测数据集 16000张 带标注 voc yolo

随着智能驾驶技术和车辆辅助系统的快速发展,道路驾驶视角下的多目标检测成为了保障行车安全的关键技术之一。为了提高自动驾驶车辆以及辅助驾驶系统的性能,需要大量的高质量标注数据来训练这些系统。本数据集旨在为道路驾驶视角下的人车检测提供高质量的标注数据,支持自动化检测系统的开发与应用。

数据集概述:
  • 名称:道路驾驶视角人车检测数据集
  • 规模:共计16,000张图像
  • 类别:七种目标类别,“0”表示摩托车(Motorcycle), “1”表示行人(Pedestrian), “2”表示汽车(Car), “3”表示自行车(Bicycle), “4”表示公交车(Bus), “5”表示交通信号灯(Traffic Light), “6”表示卡车(Truck)
  • 标注格式:支持VOC和YOLO格式的标注文件,可以直接用于模型训练
数据集特点:
  1. 全面性:涵盖道路驾驶视角中常见的多种目标类型,确保数据集的多样性和实用性。
  2. 高质量标注:每张图像都已详细标注,确保数据的准确性和可靠性。
  3. 适用范围广:支持多种标注格式(VOC、YOLO),方便科研人员和开发者直接使用。
  4. 标准格式:采用广泛使用的标注文件格式,方便导入不同的检测框架。
数据集内容:

  • 摩托车(Motorcycle):标注了道路上行驶的摩托车。
  • 行人(Pedestrian):标注了道路上行走的行人。
  • 汽车(Car):标注了道路上行驶的汽车。
  • 自行车(Bicycle):标注了道路上骑行的自行车。
  • 公交车(Bus):标注了道路上行驶的公交车。
  • 交通信号灯(Traffic Light):标注了道路上的交通信号灯。
  • 卡车(Truck):标注了道路上行驶的卡车。
数据集用途:

  1. 目标检测:可用于训练和评估深度学习模型,特别是在道路驾驶视角下的人车检测方面。
  2. 智能驾驶:帮助实现自动驾驶车辆的智能感知,减少交通事故的发生。
  3. 科研与教育:为道路驾驶视角下的人车检测领域的研究和教学提供丰富的数据支持。
使用场景:
  1. 实时监控:在智能交通系统中,利用该数据集训练的模型可以实时检测道路上的目标。
  2. 事故预防:在事故预防和安全预警中,利用该数据集可以提高检测的准确性和速度。
  3. 生产管理:在智能驾驶系统和车辆辅助系统的开发工作中,利用该数据集可以提高系统的可靠性和稳定性。
技术指标:

  • 数据量:共计16,000张图像,覆盖多种目标类型。
  • 数据划分:数据集是否进行了训练集、验证集和测试集的划分,需根据数据集实际内容确定。
  • 标注格式:支持VOC和YOLO格式的标注文件,方便导入不同的检测框架。
  • 标注精度:所有图像均已详细标注,确保数据的准确性和可靠性。
注意事项:
  • 数据隐私:在使用过程中,请确保遵守相关法律法规,保护个人隐私。
  • 数据预处理:在使用前,建议进行一定的数据预处理,如图像归一化等。
获取方式:
  • 下载链接:请访问项目主页获取数据集下载链接。
  • 许可证:请仔细阅读数据集的使用许可协议。
关键代码示例:

以下是关键代码的示例,包括数据加载、模型训练、检测和结果展示。

数据加载(以VOC格式为例):
1import os
2import cv2
3import xml.etree.ElementTree as ET
4import numpy as np
5
6# 数据集路径
7DATASET_PATH = 'path/to/dataset'
8IMAGES_DIR = os.path.join(DATASET_PATH, 'JPEGImages')
9ANNOTATIONS_DIR = os.path.join(DATASET_PATH, 'Annotations')
10
11# 加载数据集
12def load_dataset(directory):
13    images = []
14    annotations = []
15
16    for img_file in os.listdir(IMAGES_DIR):
17        if img_file.endswith('.jpg') or img_file.endswith('.png'):
18            img_path = os.path.join(IMAGES_DIR, img_file)
19            annotation_path = os.path.join(ANNOTATIONS_DIR, img_file.replace('.jpg', '.xml').replace('.png', '.xml'))
20            
21            image = cv2.imread(img_path)
22            tree = ET.parse(annotation_path)
23            root = tree.getroot()
24            
25            objects = []
26            for obj in root.findall('object'):
27                name = obj.find('name').text
28                bbox = obj.find('bndbox')
29                xmin = int(bbox.find('xmin').text)
30                ymin = int(bbox.find('ymin').text)
31                xmax = int(bbox.find('xmax').text)
32                ymax = int(bbox.find('ymax').text)
33                objects.append((name, [xmin, ymin, xmax, ymax]))
34            
35            images.append(image)
36            annotations.append(objects)
37
38    return images, annotations
39
40train_images, train_annotations = load_dataset(os.path.join(DATASET_PATH, 'train'))
41val_images, val_annotations = load_dataset(os.path.join(DATASET_PATH, 'val'))
42test_images, test_annotations = load_dataset(os.path.join(DATASET_PATH, 'test'))
模型训练:
1# 初始化YOLOv8模型
2model = YOLO('yolov8n.pt')
3
4# 转换VOC格式到YOLO格式
5def convert_voc_to_yolo(annotations, image_shape=(640, 640), class_names=['Motorcycle', 'Pedestrian', 'Car', 'Bicycle', 'Bus', 'Traffic Light', 'Truck']):
6    yolo_annotations = []
7    class_map = {name: i for i, name in enumerate(class_names)}
8    
9    for ann in annotations:
10        converted = []
11        for name, obj in ann:
12            class_id = class_map[name]
13            x_center = (obj[0] + obj[2]) / 2 / image_shape[1]
14            y_center = (obj[1] + obj[3]) / 2 / image_shape[0]
15            width = (obj[2] - obj[0]) / image_shape[1]
16            height = (obj[3] - obj[1]) / image_shape[0]
17            converted.append([class_id, x_center, y_center, width, height])
18        yolo_annotations.append(converted)
19    return yolo_annotations
20
21# 定义训练参数
22EPOCHS = 100
23BATCH_SIZE = 16
24
25# 转换并训练模型
26train_yolo_annots = convert_voc_to_yolo(train_annotations)
27val_yolo_annots = convert_voc_to_yolo(val_annotations)
28
29results = model.train(data='road_driving_perspective_detection.yaml', epochs=EPOCHS, batch=BATCH_SIZE)
模型检测:
1# 加载训练好的模型
2model = YOLO('best.pt')
3
4# 检测图像
5def detect_road_objects(image):
6    results = model.predict(image)
7    for result in results:
8        boxes = result.boxes
9        for box in boxes:
10            x1, y1, x2, y2 = box.xyxy[0]
11            conf = box.conf
12            class_id = box.cls
13            
14            # 显示结果
15            cv2.rectangle(image, (int(x1), int(y1)), (int(x2), int(y2)), (0, 255, 0), 2)
16            class_name = ['Motorcycle', 'Pedestrian', 'Car', 'Bicycle', 'Bus', 'Traffic Light', 'Truck'][class_id]
17            cv2.putText(image, f'{class_name}, Conf: {conf:.2f}', (int(x1), int(y1)-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
18    
19    return image
20
21# 测试图像
22test_image = cv2.imread('path/to/test_image.jpg')
23result_image = detect_road_objects(test_image)
24cv2.imshow('Detected Road Objects', result_image)
25cv2.waitKey(0)
26cv2.destroyAllWindows()
配置文件 road_driving_perspective_detection.yaml
1train: path/to/train/images
2val: path/to/val/images
3test: path/to/test/images
4
5nc: 7  # Number of classes
6names: ['Motorcycle', 'Pedestrian', 'Car', 'Bicycle', 'Bus', 'Traffic Light', 'Truck']  # Class names
7
8# Training parameters
9batch_size: 16
10epochs: 100
11img_size: [640, 640]  # Image size
使用指南:
  1. 数据准备:确保数据集路径正确,并且数据集已准备好。
  2. 模型训练:运行训练脚本,等待训练完成。
  3. 模型检测:使用训练好的模型进行检测,并查看检测结果。
结语:

本数据集提供了一个高质量的道路驾驶视角人车检测数据集,支持自动化目标检测、智能驾驶等多个应用场景。通过利用该数据集训练的模型,可以提高道路驾驶视角下人车检测的效率和准确性。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/142553.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

linux 操作系统下dd 命令介绍和使用案例

linux 操作系统下dd 命令介绍和使用案例 1. dd 命令简介 dd 命令是一个功能强大的 Linux 工具,用于转换和复制文件。它的主要用途包括: 创建引导盘备份和恢复磁盘分区创建磁盘镜像清除磁盘数据测试读写性能 dd 命令的语法与大多数 Linux 命令有所不同,使用 optionvalue 的形…

[YM]模板-顺序表

概念: 顺序表是一种线性表,作为线性表的一种,它是用一段物理地址连续的存储单元依次存储数据元素的线性结构 模板: typedef int T; typedef struct Node{T *data;int last;int MaxSize; }*LinearList; //1 初始化顺序表 int Ini…

【C++学习】 IO 流揭秘:高效数据读写的最佳实践

✨ 今朝有酒今朝醉,明日愁来明日愁 🌏 📃个人主页:island1314 🔥个人专栏:C学习 ⛺️ 欢迎关注:👍点赞 👂&#x1f3f…

Java之线程篇四

目录 volatile关键字 volatile保证内存可见性 代码示例 代码示例2-(volatile) volatile不保证原子性 synchronized保证内存可见性 wait()和notify() wait()方法 notify() 理解notify()和notifyAll() wait和sleep的对比 volatile关键字 volati…

基于yolov8的茶叶病害检测系统python源码+onnx模型+评估指标曲线+精美GUI界面

【算法介绍】 基于YOLOv8的茶叶病害检测系统,是利用深度学习技术,特别是YOLOv8这一先进的目标检测算法,来精准识别和监测茶叶生长过程中出现的各种病害。该系统通过无人机、地面机器人或固定摄像头等设备,定期采集茶园的高分辨率…

MATLAB窗口操作常用命令

MATLAB窗口操作常用命令 命令功能clc清除窗口命令clear commandclf清除图形对象(窗口)clear清除工作区所有变量 释放内存clear all清除工作区的所有变量和函数type显示指定文件的所有内容与CMD命令类似dir查看当前工作文件夹中的内容与CMD命令类似save保存工作区或工作区中任何…

多维度智能体验:引领未来的RAG型知识图谱数字

随着人工智能技术的发展,传统的数字人已逐渐普及,但大多数仍然局限于简单的文本回复或预设答案,缺乏深入的语义理解和个性化互动能力,难以应对复杂、多维度的问题交互。不同于传统的数字人,英智知识图谱RAG型数字人提供…

.NET源码的在线探索:source.dot.net网站深度解析

一个在线的.NET源码查询网站为https://source.dot.net/。这个网站为开发者提供了便捷的.NET源码查询服务,无需从GitHub等代码托管平台下载整个源代码库,即可在线浏览和查询.NET框架及相关项目的源代码。 以下是该网站的一些主要功能特性: …

vue node node-sass sass-loader 版本 对应 与 兼容

警告: LibSass 和 Node Sass 已弃用。虽然它们将继续无限期地接收维护版本,但没有计划添加其他功能或与任何新的 CSS 或 Sass 功能兼容。仍在使用它的项目应该转移到 Dart Sass。 sass Sass是一种预处理器脚本语言,可以解释或编译成…

英语学习之vegetable

这里写目录标题 不熟悉的单词熟悉的句型 不熟悉的单词 brocolli (花)椰菜;西兰花🥦 spinach 菠菜 aubergine 茄子🍆 cabbage 卷心菜 zucchini/courgette 西葫芦 parsnip 欧洲防风,民间俗称“芹菜萝卜” …

[240917] Docker vs Podman:容器化的终极对决 | Kali Linux 2024.3 版本发布

目录 Docker 🐋 vs 🦭 Podman: 容器化领域的终极对决一、容器化简介二、🐋 Docker 是什么?三、🦭 Podman 是什么?四、架构差异1. Docker 的客户端-服务器模型2. Podman 的无守护进程架构 五、安全注意事项1…

苹果 2024 秋季新品发布会一文汇总:iPhone 16 / Pro 登场、手表耳机齐换代

✌ 作者名字:高峰君主 📫 如果文章知识点有错误的地方,请指正!和大家一起学习,一起进步👀 💬 人生格言:没有我不会的语言,没有你过不去的坎儿。💬 &#x1f5…

2024年最新版本spss 27中文版新功能特色及下载安装激活教程

在智能设备领域,一款名为SPSS 27.0的专业统计软件正因其卓越性能和革新功能在市场上引发热议。这款老牌统计工具在历经多次迭代后,不仅保持了其在科研和教育领域的核心地位,还通过增强用户体验和引入先进功能,重新定义了数据分析的…

数据爬虫中遇到验证码的解决方法

在数据爬虫中遇到验证码是一个常见且复杂的问题,验证码的存在主要是为了阻止自动化工具(如爬虫)对网站进行过度访问或数据抓取,以保护网站的安全性和数据的准确性。 一、验证码的基本概念与类型 验证码(CAPTCHA&…

Java的输入输出

秋招笔试很多都是要自己写输出输出的,所以对常见的整理一下,后续也会持续更新的~~~ 目录 1.java中的Scanner类 1.1next()方法和nextLine()方法的区别 1. next() 方法 示例 2. nextLine() 方法 示例 主要区别 使用场景 2.print类 3.常用的转换…

JAVA算法数据结构第一节稀疏矩阵

一、稀疏矩阵介绍: 稀疏矩阵是一种特殊类型的矩阵,其中大部分元素都是零。在处理这类矩阵时,如果仍然使用标准的矩阵存储方式(即传统的二维数组),则会浪费大量的存储空间来保存零值。为了提高存储效率以及…

iptables部署使用

1、Iptables-server安装确认 [rootlocalhost ~]$ rpm -qa|grep iptables #查看安装iptables iptables-1.4.21-18.0.1.el7.centos.x86_64 [rootlocalhost ~]$ rpm -ql iptables #查看iptables相关文件 2、安装iptables-services [rootlocalhost ~]$ yum list all|grep iptab…

Ubuntu24.04 安装opencv4.10

Ubuntu24.04 安装opencv4.10 一、下载OpenCV二、更新系统,安装必要的包1、“E: unable to locate libjasper-dev"的解决方法2、没有公钥,无法验证下列签名 :NO_PUBKEY 的解决方法 三、配置,使用cmake工具1、新建build目录2、在build中&a…

【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的?

【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的? 【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的? 文章目录 【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的?1. 什么是梯度?2.梯度…

2024 VMpro 虚拟机中如何给Ubuntu Linux操作系统配置联网

现在这是一个联网的状态 可以在商店里面下载东西 也能ping成功 打开虚拟网络编辑器 放管理员权限 进行设置的更改 选择DNS设置 按提示修改即可 注意的是首选的DNS服务器必须是114.114.114.114 原因 这边刚刚去查了一下 114.114.114.114 是国内的IP地址 8.8.8.8 是国外的I…