导言
介绍了 Tiger数据集,这是一个专为姿势估计任务设计的多功能数据集。该数据集由来自YouTube 视频的 263 张图片组成,其中 210 张用于训练,53 张用于验证。它是测试姿势估计算法和排除故障的绝佳资源。
尽管虎姿态数据集只有 210 张图像,但它的大小却易于管理,而且具有多样性,因此适合评估训练管道、识别潜在错误,并在使用更大的数据集进行姿态估计之前,作为一个有价值的初步步骤。
数据集 YAML
YAML(另一种标记语言)文件可用于指定数据集的配置细节。它包含文件路径、类定义和其他相关信息等重要数据。具体来说,对于 tiger-pose.yaml 文件,您可以检查 Ultralytics 老虎姿势数据集配置文件.
tiger.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger
#具体
Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
Classes
names:0: tiger
训练
要在图像大小为 640 的 Tiger-Pose 数据集上对YOLOv8n-pose 模型进行 100 次训练,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。
列车示例
Python
CLIfrom ultralytics import YOLO
# Load a model
model = YOLO("yolov8n-pose.pt") # load a pretrained model (recommended for training)# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
图片和注释示例
下面是老虎姿势数据集中的一些图像示例及其相应的注释:
数据集样本图像
镶嵌图像:该图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练过程中使用的技术,可将多幅图像合并为单幅图像,以增加每个训练批次中物体和场景的多样性。这有助于提高模型对不同物体尺寸、长宽比和环境的泛化能力。
该示例展示了 Tiger-Pose 数据集中图像的多样性和复杂性,以及在训练过程中使用镶嵌技术的好处。
推理示例
推理示例
Python
CLIfrom ultralytics import YOLO# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
代码获取
计算机视觉、图像处理、毕业辅导、作业帮助、代码获取,远程协助,代码定制,私聊会回复!