《数字图像处理基础》学习01-数字图像处理的相关基础知识

 这篇文章只是对数字图像处理的相关基础知识有个大概的了解,之后的文章会接着补充和扩展。

目录

一,图像的基本概念

1,图像 

2,图像的分类

1)物理图像 

 2)虚拟图像

二,数字图像处理

 三,数字图像处理系统结构

 四,数字图像处理的主要研究内容


一,图像的基本概念

1,图像 

相信大家对图像这个词并不陌生,可以看到这个词是由两个字组成:“图”和“像”,其中:

  • 图:是指物体反射或者是投射电磁波的分布。
  • 像:是指图在人脑中的印象。(或指 人的视觉系统对接收的图信息在大脑中形成的印象)

 因此,由上面两个字“图”和“像”组成的词“图像”就是指:

  • 用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人的视觉系

    统而产生的视知觉实体。(或 是对客观存在物体的一种相似性的生动模仿与描述,是物体的

    一种不完全的,不精确的描述,但是在某种意义下是适当的表示。)

2,图像的分类

 图像可分为物理图像和虚拟图像两种。

1)物理图像 

物理图像是指物质或能量的实际分布。 

物理图像又可以分为:可见图像和不可见图像。 

  • 可见图像:在物理图像中,有些物质或能量能够被我们的肉眼看到,例如用相机(非数码相

    机,可以是手机中的相机)拍摄的风景、人物、动物等日常照片,都是可见图像,即人眼能够

    直接感知的图像就是可见图像。如下图👇

    还有就是电视和电脑屏幕上的图像也是可见图像,例如:显示的电影、视频、网页等内容。
    如下所示👇
  • 不可见图像:物质或能量不能被我们的肉眼看到,需要特殊手段才能观察到的图像。例如温

    度,高度,压力等的分布图及医学影像等,通过可视化的手段将不可见的物理量转换成肉眼方

    便识别的图像。如下所示的温度分布图👇,将不可见的物理量温度使用可视化的手段表示出来

 2)虚拟图像

虚拟图像:是指采用数学的方式,将由概念形成的物体(不是实物)进行表示的图像。 

虚拟图像是相对于物理图像的另外一种图像,虚拟图像中的内容在现实生活中并不存在,内容全部

靠想象出来,并采用数学建模的方式,利用成像几何原理,在计算机上制作出来,由于虚拟图像是

由计算机制作出来的,不存在客观因素(环境中的尘埃和设备的固有噪声)和主观因素(手抖引起

的模糊)影响,从而导致虚拟图像仿佛就是在真空中拍摄的图像,缺少真实感。

如下所示的动漫,图像中角色都是虚构出来,在现实生活中并不存在。


                                      《雾山五行》 这部动漫贼好看,有兴趣的去观看。

3)数字图像 

数字图像:用一个数字阵列来表示的图像 (或是指以二进制形式的数字表示和存储的图像 )。 

由于在进行数字图像处理的过程中,要经过计算机,因此需要利用数字化图像扫描仪对物理图像或

虚拟图像扫描来获得数字图像,得以在计算机上处理。如下就是将物理图像转换成数字图像👇

观察上图,可以看到,由于物理图像的内容较多,这里只选取了部分子块(中间彩色的马赛克图)

对应的数字阵列如最右的图所示👆👉👉


可以看到,对于数字图像而言,像素是它的一个最小单位。每个像素点的数值表示对应的颜色和亮

度。(数字图像是以二维的点阵形式显示的,其中的每个(像)点称为像素)

数字图像也可以是数数码相机拍摄得到的图像,亦或者是数字摄像仪拍摄得到的图像。

二,数字图像处理

上面学习了数字图像的概念和产生的途径,接下来,开始对这些数字图像进行处理。 

数字图像处理是指对数字图像信息进行加工,以改善图像的视觉效果和提高图像的实用性;或对

字图像进行压缩编码以减少所需的存储空间的技术。

数字图像处理也称为计算机图像处理,泛指利用计算机技术对数字图像进行某些数学运算和各种加工处理。

首先需要知道的是,数字图像处理有两个方面的操作:

  1. 从图像到图像的处理:将视觉效果不好的图像处理成视觉好的图像。如下👇

    左边为原图,右边为处理结果图。

    可以看到,这种数字图像处理是在图像的像素级上进行的处理,处理的数据集比较大。
  2. 从图像到非图像的一种表示(输入是图像,输出是对输入图像进行描述的信息):由于这种

    操作不再是从图像到图像的简单数字图像处理,而是侧重于研究图像的内容,更倾向于对图

    像内容的分析,解释和识别,比数字图像处理更高一级的计算处理过程,因此,这类处理通

    常又称为数字图像分析。如下,是“自动驾驶(YOLO V5) 行人检测 示例图”

     以及如下所示,使用直方图来描述图像信息,👇

    可以看到,数字图像分析则通过图像分割和特征提取,把原来以像素描述的图像转变成比较简洁的非图形式的描述。

需要知道的是,数字图像分析是通过对图像中不同对象进行分割来对图像中目标进行分类和

识别的技术。其目的主要是为了缩减对图像的描述,使之更适合于计算机处理即对不同目标

的分类。因此,广义的数字图像处理概念实际上指的是图像处理和分析。

数字图像处理与数字图像分析的关系如下

在上图中,数字图像处理就是对图像的低级处理,数字图像分析就是对图像的高级处理。

因此,要想对图像进行图像分析,必须要经过图像预处理。 

 三,数字图像处理系统结构

 一个典型的数字图像处理系统的组成架构:

对应的物理设备如下图所示👇 

值得一提的是输入设备的分辨率,如果分辨率过低,会导致图像所包含的图像信息过少,不便于人或机器的处理与分析。

分辨率:是指单位长度上采样的像素个数。单位为DPI(dot/inch,dots per inch 每英寸所打印的点数)。

专用或通用图像处理系统如下:

  1.     利用MATLAB图像处理工具箱提供的丰富的图像函数和环境进行图像处理软件开发;
     MATLAB 是MATrix LABoratory(矩阵实验室)的英文缩写,MATLAB 软件是美国

    Mathworks公司推出的一种高级科学计算、专业级符号计算、可视化建模仿真和交互式应用

    开发环境。     该系统的基本数据结构是矩阵,程序中的(矩阵)变量不要求做明确的维数说

    明,系统提供了大量的内置函数,从而被广泛地应用于数值(线性代数)计算、控制系统、信

    号处理、图形绘制、图像处理等领域的分析、仿真和设计工作。
  2.     直接在Microsoft Windows上,以Microsoft公司的VC++或BC++为编程工具,进行图像处

    理软件开发。

 四,数字图像处理的主要研究内容

我需要学习的主要有以下六个:

  1. 图像数字化

    图像数字化的目的是将一幅图像以数字的形式进行表示,并且要做到既不失真又便于计算机

    进行处理。第二篇文章会详细讲。
  2. 图像增强

    目的是将一幅图像中有用的信息(或感兴趣的信息)进行增强,同时将无用的信息(即干扰

    信息或噪声)进行抑制,提高图像的可观察性。如下图👇

    通过图像增强,可以将左上模糊的图像处理成左下清晰的图,以及将右上含有噪点的图像处

    理成右下无噪点的图像。

    可以看到,图像增强是一种简单地突出图像中感兴趣的特征,或想方法显现图像中那些模糊

    了的细节,以使图像更清晰地被显示或更适合于人或机器的处理与分析的技术。
  3. 图像恢复

    图像恢复的目的是将退化了的以及模糊了的图像的原有信息进行恢复,以达到清晰化的目

    的。咋一看,图像恢复和图像强化有点像,其实两者的区别很明显:图像增强主要是为了突

    出图像中我们感兴趣的部分(或有用的信息),而图像恢复没有针对性,它是对整张图像进

    行无差别的清晰化处理。

    可以看到, 图像恢复是一种从图像退化的数学或概率模型出发,研究改进图像外观,从而使

    恢复以后的图像尽可能地反映原始图像的本来面目的一种技术,其目的是获得与景物真实面

    貌相像的图像。
  4. 图像压缩编码


    图像压缩编码的目的是简化图像的表示方式,压缩表示图像的数据,以便于存储和传输。

    如下图所示,将占用空间较大的33KB原图压缩到了原图的50%以下,得到15KB的效果结果图。

    并且,图像压缩编码是在不损失图像质量或少损失图像质量的前提下,尽可能地减少图像的存

    储量,以满足图像存储和实时传输应用需求的一种技术。
  5. 图像分割

    图像分割是图像处理技术中最为困难的任务之一,其基本思路是把一幅图像划分成背景和目

    标,从而提取感兴趣的目标来。如下图所示👇 
  6. 图像表示与描述

    图像的表示和描述基本思路是通过对图像中感兴趣的特征的定性和定量描述,从而赋予识别

    出的目标以符号标识和解释。

    如下图所示👇

  7. 图像变换和图像的基本运算

    图像变换是指通过一种数学映射的方法,将空域中的图像信息转换机到如频域,时域等空间上进行分析的数学手段。

    图像变换是简化图像处理过程和提高图像处理效果的基本技术,最典型的图像变换主要有傅里叶变换、离散余弦变换和小波变换等。

在后续的学习中,会进一步学习数字图像处理相关的研究,有兴趣的关注专栏 。

有问题请在评论区留言或者是私信我,回复时间不超过一天。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1555999.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

PostGIS--介绍

目录 1、什么是PostGIS?2、数据2.1 对象2.1.1 读取几何元数据信息函数2.1.2 处理点的函数2.1.3 处理线的函数2.1.4 处理面的函数2.1.5 集合 2.2 集合输入和输出2.3 shapefile文件 总结PS: 1、什么是PostGIS? PostGIS通过增加对空间类型、空间索引和空间…

【MaskGAN】MaskGAN: Towards Diverse and Interactive Facial Image Manipulation

文章目录 MaskGAN: Towards Diverse and Interactive Facial Image Manipulationkey points贡献方法密集映射网络DMN编辑行为模拟训练多目标学习CelebAMask-HQ数据集实验消融实验总结MaskGAN: Towards Diverse and Interactive Facial Image Manipulation 会议/期刊:CVPR 202…

实现mnist手写数字识别

基础知识 tensorflow TensorFlow是一个开源的机器学习框架,致力于各种数据流图的自动微分和深度神经网络的计算。简而言之,** TensorFlow帮助我们轻松地构建、训练和部署机器学习模型** 。它可以在各种平台上运行,包括桌面计算机、服务器…

Dyna-slam复现(保姆级详细图文版,百分百成功)

因最近论文要和这些算法做对比,故配置了一下,在此记录 因为是老的算法,cuda版本现在的显卡都不能使用,所以笔者找的电脑是华硕飞行堡垒17年的电脑,1080的显卡 深度学习及maskrcnn配置 先将dyna-slam git下来,终端执行 git clone https://github.com/BertaBescos/Dyna…

数据结构之红黑树实现(全)

一、红黑树 红黑树是一种自平衡的二叉搜索树,它通过约束节点的颜色和结构来保持平衡。红黑树是由 Rudolf Bayer 在1972年发明的,被认为是一种优秀的平衡树结构,广泛应用于各种数据结构和算法中。 1.红黑树的性质 1. 每个结点是红的或者黑的…

PhotoMaker部署文档

一、介绍 PhotoMaker:一种高效的、个性化的文本转图像生成方法,能通过堆叠 ID 嵌入自定义逼真的人类照片。相当于把一张人的照片特征提取出来,然后可以生成你想要的不同风格照片,如写真等等。 主要特点: 在几秒钟内…

前端工程化 - Vue

环境准备 Vue-cli是Vue官方提供的一个脚手架,用户快速生成一个Vue的项目模板。 Vue-cli提供了如下功能: 统一的目录结构本地调试热部署单元测试集成打包上线 需要安装Node.js 安装Vue-cli npm install -g vue/cli通过vue --version指令查看是否安装成…

常见排序详解(历时四天,哭了,必须释放一下)

目录 1、插入排序 1.1 基本思想 1.2 直接插入排序 1.2.1 思路 1.2.2 代码实现 1.2.3 性质 1.3 希尔排序 1.3.1 思路 1.3.2 代码实践 1.3.3 性质 2、选择排序 2.1 基本思想 2.2 直接选择排序 2.2.1 思路 2.2.2 代码实践 2.2.3 性质 2.3 堆排序 2.3.1 思路 2.…

108页PPT丨OGSM战略规划框架:实现企业目标的系统化方法论

OGSM战略规划框架是一种实现企业目标的系统化方法论,它通过将组织的目标(Objectives)、目标(Goals)、策略(Strategies)和衡量指标(Measures)进行系统化整合,确…

windows下DockerDesktop命令行方式指定目录安装

windows下DockerDesktop指定目录安装(重新安装) 因为DcokerDesktop占用内存较大, 并且拉去镜像后占用本地空间较多,所以建议安装时就更改默认安装路径和镜像存储路径 这里,展示了从下载到安装的过程: 首先下载DcokerDesktop;找到Docker Desktop Installer.exe 并重命名为 do…

国内超声波清洗机哪个品牌好?力荐四款超耐用超声波清洗机!

超声波清洗机作为一款高效实用的家庭与专业清洁利器,能够迅速且彻底地清洁多样化的物件。面对市场上琳琅满目的品牌与型号,每一款都各具特色与优势,故在决定购买前做足调研显得尤为重要,以免购入不尽如人意的产品,造成…

力扣110:判断二叉树是否为平衡二叉树

利用二叉树遍历的思想编写一个判断二叉树,是否为平衡二叉树 示例 : 输入:root [3,9,20,null,null,15,7] 输出:true思想: 代码: int getDepth(struct TreeNode* node) {//如果结点不存在,返回…

打造自己的RAG解析大模型:Windows部署OCR服务(可商业应用)

在上一篇文章中,我们介绍了如何在 Windows 环境中配置 OCR 相关模型,并完成了模型验证。本篇文章将基于之前的内容,进一步讲解如何将文本检测、方向分类和文本识别模型进行串联,最终搭建一个基础的 OCR 应用服务。通过这些模型的串…

【Diffusion分割】CTS:基于一致性的医学图像分割模型

CTS: A Consistency-Based Medical Image Segmentation Model 摘要: 在医学图像分割任务中,扩散模型已显示出巨大的潜力。然而,主流的扩散模型存在采样次数多、预测结果慢等缺点。最近,作为独立生成网络的一致性模型解决了这一问…

回调函数是什么

回调函数是什么 回调函数就是⼀个通过函数指针调⽤的函数。 如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被⽤来调⽤其所指向的函数时,被调⽤的函数就是回调函数。 回调函数不是由该函数的实现⽅直接调⽤&…

Linux驱动开发(速记版)--GPIO子系统

第105章 GPIO 入门 105.1 GPIO 引脚分布 RK3568 有 5 组 GPIO:GPIO0 到 GPIO4。 每组 GPIO 又以 A0 到 A7,B0 到 B7,C0 到C7,D0 到 D7,作为区分的编号。 所以 RK3568 上的 GPIO 是不是应该有 5*4*8160 个呢&#xff1…

Semantic Communication Meets Edge Intelligence——构造终端共享的知识图谱指导无线物联网通信中文本的传输

论文链接: IEEE Xplore Full-Text PDF:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp&arnumber9979702 1. 背景 随着自动驾驶、智能城市等应用的发展,移动数据流量将大幅增加。传统的香农信息论(CIT)通信系统已接近其带…

SpringBoot MyBatis连接数据库设置了encoding=utf-8还是不能用中文来查询

properties的MySQL连接时已经指定了字符编码格式&#xff1a; url: jdbc:mysql://localhost:3306/sky_take_out?useUnicodetrue&characterEncodingutf-8使用MyBatis查询&#xff0c;带有中文参数&#xff0c;查询出的内容为空。 执行的语句为&#xff1a; <select id&…

decltype推导规则

decltype推导规则 当用decltype(e)来获取类型时&#xff0c;编译器将依序判断以下四规则&#xff1a; 1.如果e是一个没有带括号的标记符表达式(id-expression)或者类成员访问表达式&#xff0c;那么decltype(e)就是e所命名的实体的类型。此外&#xff0c;如果e是一个被重载的函…

k8s 中存储之 NFS 卷

目录 1 NFS 卷的介绍 2 NFS 卷的实践操作 2.1 部署一台 NFS 共享主机 2.2 在所有k8s节点中安装nfs-utils 2.3 部署nfs卷 2.3.1 生成 pod 清单文件 2.3.2 修改 pod 清单文件增加 实现 NFS卷 挂载的 参数 2.3.3 声明签单文件并查看是否创建成功 2.3.4 在 NFS 服务器 创建默认发布…