深度学习常用开源数据集介绍【持续更新】

DIV2K

  1. 介绍:DIV2K是一个专为 图像超分辨率(SR) 任务设计的高质量数据集,广泛应用于计算机视觉领域的研究和开发。它包含800张高分辨率(HR)训练图像和100张高分辨率验证图像,每张图像都具有极高的清晰度,非常适合用于训练和评估超分辨率算法。通过DIV2K数据集,研究人员可以生成相应的低分辨率(LR)图像,从而进行模型的训练和验证,推动图像超分辨率技术的发展。此外,DIV2K数据集包含1000张具有不同退化类型的低分辨率图像,分为训练数据、验证数据和测试数据。训练数据包括800张低分辨率图像,并为降级因素提供高分辨率和低分辨率图像;验证数据包括100张高清高分辨率图片,用于生成低分辨率的图像;测试数据包括100张多样化的图像,用来生成低分辨率的图像。
  2. 下载地址:https://data.vision.ee.ethz.ch/cvl/DIV2K/
  3. 数据集结构形式
DIV2K/ -- DIV2K datasetDIV2K/DIV2K_train_HR/ -- 0001.png, 0002.png, ..., 0800.png train HR images (provided to the participants)
DIV2K/DIV2K_train_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_train_LR_bicubic/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_bicubic/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_bicubic/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4
DIV2K/DIV2K_train_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_train_LR_unknown/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_unknown/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_unknown/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4DIV2K/DIV2K_valid_HR/ -- 0801.png, 0802.png, ..., 0900.png validation HR images (will be available to the participants at the beginning of the final evaluation phase)
DIV2K/DIV2K_valid_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_valid_LR_bicubic/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_bicubic/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_bicubic/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4
DIV2K/DIV2K_valid_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_valid_LR_unknown/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_unknown/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_unknown/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4DIV2K/DIV2K_test_HR/ -- 0901.png, 0902.png, ..., 1000.png test HR images (not provided to the participants, used for final evaluation and ranking)
DIV2K/DIV2K_test_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_test_LR_bicubic/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_bicubic/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_bicubic/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
DIV2K/DIV2K_test_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_test_LR_unknown/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_unknown/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_unknown/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
  1. 示例
    在这里插入图片描述

Flickr2K

  1. 加粗样式介绍:Flickr2K是一个大规模的高分辨率图像数据集,它包含了2650张2K分辨率的图像,这些图像主要来源于Flickr,覆盖了人物、动物和风景等多种类别。数据集中的图像被用来生成不同降采样倍数的低分辨率图像,以供图像超分辨率任务使用。Flickr2K数据集的特点是图像分辨率高,内容丰富多样,适合用于训练和评估图像超分辨率算法。
  2. 下载地址:https://esrgan.readthedocs.io/en/latest/pages/api/datasets.html#flickr2k
  3. 示例
    在这里插入图片描述

Set 5

  1. 介绍:Set5数据集是一个包含5张图像的集合,这些图像(“baby”, “bird”, “butterfly”, “head”, “woman”)通常用于测试图像超分辨率模型的性能。数据集由Bevilacqua, Marco等人创建,语言为英语,许可证类型为其他。数据集的主要用途是超分辨率。
  2. 下载地址:https://hf-mirror.com/datasets/Voxel51/Set5
  3. 示例
    在这里插入图片描述

Set 12

  1. 介绍:Set12 是一个常用的数字化图像处理数据集。该数据集由 12 张涉及不同场景的灰度图像组成,包括 lena,cameraman,house,pepper,fishstar,monarch,airplane,parrot,barbara,ship,man,couple 。
  2. 下载地址:https://github.com/ysix7/Dataset
  3. 示例
    在这里插入图片描述

Set 14

  1. 介绍:Set14数据集是一个包含14张图像的测试集,常用于评估图像超分辨率模型的性能。该数据集共有378个样本,专为测试和验证图像超分辨率技术而设计。
  2. 下载地址:https://hf-mirror.com/datasets/Voxel51/Set14
  3. 示例
    在这里插入图片描述

Urban100

  1. 介绍:Urban100是一个包含100张城市景观图像的数据集,这些图像具有复杂的纹理和细节,非常适合用于评估 超分辨率算法 在复杂场景下的性能。这个数据集因其多样化的城市场景和高难度的纹理处理而受到研究者的青睐,常被用作测试集来评估超分辨率模型的性能。Urban100数据集中的图像因其真实性和挑战性,对于图像处理和计算机视觉领域的研究具有重要价值。
  2. 下载地址:https://hf-mirror.com/datasets/eugenesiow/Urban100
  3. 示例
    在这里插入图片描述

B100

  1. 介绍:B100数据集,全称BSD100,是从Berkeley Segmentation Dataset中选取的100张自然图像。这些图像具有较高的多样性,适合用于测试超分辨率算法在不同场景下的表现。BSD100数据集因其图像的多样性和自然场景的代表性,被广泛用于图像超分辨率研究领域的性能评估。
  2. 下载地址: https://hf-mirror.com/datasets/eugenesiow/BSD100
  3. 示例
    在这里插入图片描述

LIVE1

  1. 介绍:这是一个公共领域主观图像质量数据集,全称 LIVE Public-Domain Subjective Image Quality Database。质量评估研究主要依靠主观实验来提供校准数据和测试机制。所有质量评估研究的目标是做出与人类观察者主观意见一致的预估。LIVE1 数据集可以用于质量评估(QA)算法的训练和测试。
  2. 下载地址:https://orion.hyper.ai/datasets/21663
  3. 示例
    在这里插入图片描述

classic5

  1. 介绍:Classic5通常指的是一个图像去噪的数据集,它包含5个自然场景的图像,这些图像被广泛用于图像去噪算法的性能评估。这个数据集因其简单性和易用性而受到研究者的青睐。
  2. 下载地址:https://paperswithcode.com/dataset/classic5
  3. 示例
    在这里插入图片描述

BSD68

  1. 介绍:BSD68是一个用于评估图像去噪算法性能的经典数据集。BSD68包含了68张灰度图像,这些图像被广泛用于测试和评估图像去噪算法的性能。BSD68数据集中的图像种类丰富,包括景物、人物、动态和静态场景等,这使得研究人员能够在多种场景下测试其算法的性能。
  2. 下载地址:https://github.com/ysix7/Dataset
  3. 示例
    在这里插入图片描述

SIDD

  1. 介绍:SIDD是"Smartphone Image Denoising Dataset"的缩写,这是一个图像降噪数据集。它包含了大约30,000张来自10个场景的噪声图像,这些图像由5个具有代表性的智能手机摄像头在不同光照条件下拍摄,并生成了它们的高质量真实图像(ground truth images)。SIDD数据集被用来评估和基准测试一些降噪算法,特别是针对智能手机摄像头拍摄的图像。提供Raw-RGB图像和sRGB图像,Raw-RGB图像数据大约10GB,sRGB图像数据大约6GB。
  2. 下载地址: https://aistudio.baidu.com/datasetdetail/140841
  3. 示例
    在这里插入图片描述

SIDD_Small_sRGB_Only

  1. 介绍:这是一个更小版本的数据集,仅包含160对噪声图像和真实图像(ground-truth images),主要用于训练和学习目的。
  2. 下载地址: https://www.kaggle.com/datasets/rajat95gupta/smartphone-image-denoising-dataset
  3. 示例
    在这里插入图片描述

TVD

  1. 介绍:腾讯深度学习数据集TVD(Tencent Video Dataset)是一个用于基于学习的可视数据压缩和分析的视频数据集。TVD包含86个视频序列,覆盖了多种内容类型。每个视频序列由65帧4K(3840x2160)空间分辨率的帧组成。这个数据集旨在服务于多种目的,比如训练基于神经网络的编码工具和测试包括目标检测与跟踪在内的机器视觉任务。
  2. 下载地址:https://multimedia.tencent.com/resources/tvd
  3. 示例
    在这里插入图片描述

KoNViD_1k

  1. 介绍:KoNViD_1k(Konstanz Natural Video Database)是一个自然视频质量评估数据库,它包含了1200个具有真实失真的独特视频序列,这些视频序列是从YFCC100m数据库中筛选出来的,以确保它们代表了各种类型的视频内容、失真类型和主观质量。这个数据库的目的是为了提供更好的基础,以开发和评估客观的视频质量评估(VQA)方法,特别是对于自然视频。
  2. 下载地址:https://database.mmsp-kn.de/konvid-1k-database.html
  3. 示例
    在这里插入图片描述

MNIST_Dataset

  1. 介绍:MNIST数据集(Mixed National Institute of Standards and Technology database)是一个广泛用于训练各种图像处理系统的手写数字数据库。
  2. 下载地址:https://github.com/Saquibkhan456/MNIST_dataset
  3. 示例
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/6131.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Boot框架下的信息学科平台系统开发实战

摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了基于保密信息学科平台系统的开发全过程。通过分析基于保密信息学科平台系统管理的不足,创建了一个计算机管理基于保密信息学科平台系统的方案。文章介…

RPC核心实现原理

目录 一、基本原理 二、详细步骤 三、额外考虑因素 RPC(Remote Procedure Call,远程过程调用)是一种计算机通信协议,也是一种用于实现分布式系统中不同节点之间进行通信和调用的技术。其实现原理主要可以分为以下几个步骤&…

【论文分享】使用可穿戴相机和计算机视觉评估个人在不断变化的环境中的屏幕暴露情况

本次带来一篇sci的全文翻译,该论文主讲如何使用可穿戴相机和计算机视觉评估个人在不断变化的环境中的屏幕暴露情况! 【论文题目】Assessing personal screen exposure with ever-changing contexts using wearable cameras and computer vision 【篇名翻…

从分析Vue实例生命周期开始,剖析Vue页面跳转背后执行过程

文章目录 1.概要2.Vue实例生命周期3.生命周期函数解释4.存在父子组件情况页面执行过程5. 分析路由跳转页面执行过程6.扩展补充7.小结 1.概要 本文旨在分析Vue页面进行路由切换时,Vue背后的运行过程,旨在让大家更加清晰地明白Vue页面运行过程中钩子方法的…

SAP固定资产报废BAPI_ASSET_RETIREMENT_POST的主要参数说明<转载>

原文链接:https://mp.weixin.qq.com/s/bzuK0PUfY7Zb-AoAIeWKiQ SAP固定资产的报废在前台通过tcode ABAVN执行相关业务的操作。 比如如下操作。 事务类型:选择如下,可以根据实际要求选择 填写完成必填相关参数后,最后点击保存即可…

鸿蒙基本组件结构

组件结构 1. 认识基本的组件结构 ArkTS通过装饰器Component 和Entry 装饰 struct 关键字声明的数据结构,构成一个自定义组件 自定义组件中提供了一个build函数,开发者需要在函数内以链式调用的方式进行基本的UI描述,UI描述的方法请参考UI描述…

北航软件算法C4--贪心部分

C4 【写在前面】贪心の食客步骤注意完整代码tip 算法练习赛步骤完整代码 Jade Star步骤完整代码 切钢条步骤tip完整代码【写在后面】 【写在前面】 这学期一直没怎么有时间写blog,一直在赶各种上机和大作业,但是写博客确实能很好的巩固基础,…

Stable Diffusion Web UI 1.9.4常用插件扩展-WD14-tagger

Stable Diffusion Web UI 1.9.4 运行在 WSL 中的 Docker 容器中 tagger 插件的作用是,上传一张图片,反推这张图片可能的提示词。 使用场景就是,想要得到类似的图片内容时使用。 WD14-tagger 安装 Stable Diffusion WebUI WD14-tagger GitH…

如何选择适合的AWS EC2实例类型

在云计算的世界中,Amazon Web Services(AWS)提供了丰富的服务,其中Elastic Compute Cloud(EC2)是最受欢迎的服务之一。选择合适的EC2实例类型对于确保应用程序的性能和成本效益至关重要。我们九河云通过本文…

高效数据集成:聚水潭与金蝶云星空无缝对接的实现

聚水潭数据集成到金蝶云星空:无信息件线上销售退货对接其他入库ok 在企业的日常运营中,数据的高效流转和精准处理至关重要。本文将分享一个实际案例,展示如何通过轻易云数据集成平台,将聚水潭的数据无缝对接到金蝶云星空&#xf…

电话语音机器人,是由哪些功能构成?

电话语音机器人是自动电话销售、筛选意向客户的,只要录入好行业话术,导入要拨打的手机号,机器人就可以上岗工作了。 电话语音机器人组成部分: 1、语音识别器,主要作用:识别客户讲话内容,从而做…

捆绑推荐综述:方法、应用与挑战

近年来,捆绑推荐系统因其能够通过推荐一组物品(而非单个物品)来提升用户体验并增加销售额,而在学术界和工业界受到了广泛关注。本综述对捆绑推荐进行了全面回顾,首先提出了一种用于探索产品捆绑的分类方法。我们根据不…

【环境搭建】Apache DolphinScheduler 2.0.5

安装 Docker 和 Docker Compose(已经安装可以跳过) 首先,确保你的 Ubuntu 系统是更新过的,可以使用以下命令更新软件包列表: sudo apt-get update 安装 Docker,运行以下命令: sudo apt-get in…

网站架构知识之Ansible(day020)

1.Ansible架构 Inventory 主机清单:被管理主机的ip列表,分类 ad-hoc模式: 命令行批量管理(使用ans模块),临时任务 playbook 剧本模式: 类似于把操作写出脚本,可以重复运行这个脚本 2.修改配置 配置文件:/etc/ansible/ansible.cfg 修改配置文件关闭主机Host_key…

【系统架构设计师(第2版)】七、系统架构设计基础知识

有效的软件体系结构及其明确的描述和设计,已成为软件工程领域中重要的主题。 *注:由于历史原因,研究者和工程人员对**Software Architecture(简称SA)*的翻译不尽相同,本文中软件“体系结构”和“架构”具有…

人工智能之人脸识别(人脸采集人脸识别)

文章目录 前言PySimpleGUI 库1-布局和窗口2 文本框组件3-视频处理图片处理数据库操作数据采集(重要部分)人脸识别(综合部分) 前言 例如:随着人工智能的不断发展,本文主要介绍关于人工智能中GUI和PyMysql相…

深入浅出 Spring Boot 与 Shiro:构建安全认证与权限管理框架

一、Shiro框架概念 (一)Shiro框架概念 1.概念: Shiro是apache旗下一个开源安全框架,它对软件系统中的安全认证相关功能进行了封装,实现了用户身份认证,权限授权、加密、会话管理等功能,组成一…

【JAVA】java 企业微信信息推送

前言 JAVA中 将信息 推送到企业微信 // 企微消息推送messageprivate String getMessage(String name, String problemType, String pushResults, Long orderId,java.util.Date submitTime, java.util.Date payTime) {String message "对接方&#xff1a;<font color\…

AI代币是什么?AI与Web3结合的未来方向在哪里?

近两年随着人工智能的崛起&#xff0c;AI已经渗透到制造业、电商、广告、医药等各个行业&#xff0c;加密货币领域也不例外&#xff0c;人工智能与区块链的融合&#xff0c;让我们看到了独特的数字资产 — AI加密代币。 它的流行始于2022年底&#xff0c;随着OpenAI智能聊天机…

MySQL数据库中的视图

视图 ​ 本篇将开始介绍有关数据库中视图的相关知识点&#xff0c;其中主要包含视图的基本使用&#xff0c;视图规则和限制。 ​ 视图是一个虚拟表&#xff0c;其内容由查询定义。同真实的表一样&#xff0c;视图包含一系列带有名称的列和行数据&#xff0c;视图的数据变化会…