【Flux.jl】主要功能一览表

对 ?Flux 指令的结果进行一个朴素的分类结果如下。

神经元种类

  • LSTM: 长短期记忆网络单元,适用于处理和预测序列数据。
  • GRU: 门控循环单元,是LSTM的变体,结构更简单。
  • GRUv3: 第三版的门控循环单元,可能有一些特定的改进。
  • Dense: 密集连接层,即全连接层,每个输入都与每个输出有连接。

优化器

  • Descent: 梯度下降优化器。
  • Momentum: 动量优化器,考虑历史梯度来加速训练。
  • Nesterov: Nesterov动量,是对动量优化器的改进。
  • AdaGrad: 自适应梯度算法,为每个参数调整学习率。
  • AdaDelta: AdaGrad的改进版,限制累积梯度的大小。
  • AdaMax: Adam的变体,使用无穷范数代替二阶矩估计。
  • RMSProp: 自适应学习率方法,考虑梯度平方的移动平均。
  • Adam: 结合了动量和RMSProp的优化器。
  • AdamW: Adam的变体,对权重衰减进行了改进。
  • AMSGrad: Adam的改进版,解决了某些情况下的收敛问题。
  • AdaBelief: Adam的变体,使用.belief.估计来代替传统的momentum。
  • NAdam: 结合了Nesterov动量和Adam的优化器。
  • OAdam: Adam的变体,用于大规模优化。
  • RAdam: 随机Adam,对Adam的学习率进行了改进。

损失函数

  • binarycrossentropy: 二进制交叉熵损失,用于二分类问题。
  • crossentropy: 交叉熵损失,用于多分类问题。
  • ctc_loss: 连接时序分类损失,用于序列标注问题。
  • dice_coeff_loss: Dice系数损失,用于图像分割。
  • focal_loss: 焦点损失,用于解决类别不平衡问题。
  • hinge_loss: 铰链损失,用于支持向量机。
  • huber_loss: Huber损失,对异常值不敏感的损失函数。
  • kldivergence: Kullback-Leibler散度,用于度量两个概率分布的差异。
  • logitbinarycrossentropy: 对数几率二进制交叉熵损失。
  • logitcrossentropy: 对数几率交叉熵损失。
  • mae: 平均绝对误差,用于回归问题。
  • mse: 均方误差,用于回归问题。
  • msle: 对数均方误差,用于回归问题。
  • poisson_loss: 泊松损失,用于计数数据。
  • squared_hinge_loss: 平方铰链损失。
  • tversky_loss: Tversky损失,用于图像分割。
  • binary_focal_loss: 二进制焦点损失。

激活函数

  • elu: 指数线性单元。
  • gelu: 高斯误差线性单元。
  • hardsigmoid: 硬Sigmoid函数。
  • hardswish: 硬Swish函数。
  • hardtanh: 硬Tanh函数。
  • hardσ: 硬Sigmoid函数的另一种表示。
  • leakyrelu: 泄露修正线性单元。
  • lisht: 线性整流激活函数的变体。
  • mish: Mish函数,光滑的非单调激活函数。
  • relu: 修正线性单元。
  • relu6: 限制在6以内的ReLU函数。
  • rrelu: 随机泄露修正线性单元。
  • selu: Scaled Exponential Linear Units。
  • sigmoid: Sigmoid函数。
  • sigmoid_fast: 快速Sigmoid函数。
  • softmax: Softmax函数,用于多分类。
  • softmax!: 强制in-place计算的Softmax函数。
  • softplus: Softplus函数。
  • softshrink: Softshrink函数。
  • softsign: Softsign函数。
  • swish: Swish函数。
  • tanh_fast: 快速Tanh函数。
  • tanhshrink: Tanhshrink函数。
  • thresholdrelu: 阈值ReLU函数。
  • trelu: 三角ReLU函数。
  • σ: Sigmoid函数的另一种表示。

  • BatchNorm: 批归一化层,用于加速训练。
  • Conv: 卷积层,用于特征提取。
  • ConvTranspose: 转置卷积层,用于上采样。
  • Dense: 密集层,即全连接层。
  • Dropout: Dropout层,用于防止过拟合。
  • Embedding: 嵌入层,用于处理类别数据。
  • EmbeddingBag: 嵌入袋层,是嵌入层的变种。
  • GlobalMaxPool: 全局最大池化层。
  • GlobalMeanPool: 全局平均池化层。
  • GroupNorm: 组归一化层。
  • InstanceNorm: 实例归一化层。
  • LayerNorm: 层归一化层。
  • MaxPool: 最大池化层,用于下采样。
  • MeanPool: 平均池化层,用于下采样。
  • MultiHeadAttention: 多头注意力层,用于Transformer模型。
  • SkipConnection: 跳跃连接,常用于残差网络。

池化

  • AdaptiveMaxPool: 自适应最大池化,根据输出尺寸调整池化窗口大小。
  • AdaptiveMeanPool: 自适应平均池化,根据输出尺寸调整池化窗口大小。
  • MaxPool: 最大池化,选择每个窗口内的最大值。
  • MeanPool: 平均池化,计算每个窗口内的平均值。
  • GlobalMaxPool: 全局最大池化,在整个特征图上取最大值。
  • GlobalMeanPool: 全局平均池化,在整个特征图上取平均值。
  • lpnormpool: Lp范数池化。
  • lpnormpool!: 强制in-place计算的Lp范数池化。

卷积

  • Conv: 卷积操作,用于特征提取。
  • ConvTranspose: 转置卷积操作,用于上采样。
  • DepthwiseConv: 深度可分卷积,每个输入通道单独卷积。
  • DepthwiseConvDims: 深度可分卷积的维度。
  • DenseConvDims: 密集卷积的维度。
  • ConvDims: 卷积的维度。

设备

  • CPUDevice: CPU设备,用于在CPU上执行计算。
  • CUDADevice: CUDA设备,用于在NVIDIA GPU上执行计算。
  • MetalDevice: Metal设备,用于在Apple GPU上执行计算。
  • XLADevice: XLA设备,用于在TPU上执行计算。
  • oneAPIDevice: oneAPI设备,用于在Intel GPU上执行计算。

初始化方法

  • glorot_normal: Glorot正态分布初始化,也称为Xavier初始化。
  • glorot_uniform: Glorot均匀分布初始化。
  • kaiming_normal: Kaiming正态分布初始化,适用于ReLU激活函数。
  • kaiming_uniform: Kaiming均匀分布初始化。
  • orthogonal: 正交初始化,保持权重的正交性。
  • sparse_init: 稀疏初始化,初始化为稀疏矩阵。
  • truncated_normal: 截断正态分布初始化。
  • identity_init: 单位矩阵初始化。
  • default_rng_value: 默认随机数生成器的值。

梯度算子

  • ∇conv_data: 计算卷积操作关于输入数据的梯度。
  • ∇conv_data!: 同上,但可能会就地修改输入数据。
  • ∇conv_filter: 计算卷积操作关于卷积核(过滤器)的梯度。
  • ∇conv_filter!: 同上,但可能会就地修改卷积核。
  • ∇depthwiseconv_data: 计算深度可分卷积操作关于输入数据的梯度。
  • ∇depthwiseconv_data!: 同上,但可能会就地修改输入数据。
  • ∇depthwiseconv_filter: 计算深度可分卷积操作关于卷积核的梯度。
  • ∇depthwiseconv_filter!: 同上,但可能会就地修改卷积核。
  • ∇grid_sample: 计算网格采样操作关于输入网格的梯度。
  • ∇imrotate: 计算图像旋转操作关于输入图像的梯度。
  • ∇logsoftmax: 计算LogSoftmax操作关于输入数据的梯度。
  • ∇logsoftmax!: 同上,但可能会就地修改输入数据。
  • ∇lpnormpool: 计算Lp范数池化操作关于输入数据的梯度。
  • ∇lpnormpool!: 同上,但可能会就地修改输入数据。
  • ∇maxpool: 计算最大池化操作关于输入数据的梯度。
  • ∇maxpool!: 同上,但可能会就地修改输入数据。
  • ∇meanpool: 计算平均池化操作关于输入数据的梯度。
  • ∇meanpool!: 同上,但可能会就地修改输入数据。
  • ∇softmax: 计算Softmax操作关于输入数据的梯度。
  • ∇softmax!: 同上,但可能会就地修改输入数据。
  • ∇upsample_bilinear: 计算双线性上采样操作关于输入数据的梯度。
  • ∇upsample_linear: 计算线性上采样操作关于输入数据的梯度。
  • ∇upsample_nearest: 计算最近邻上采样操作关于输入数据的梯度。
  • ∇upsample_trilinear: 计算三线性上采样操作关于输入数据的梯度。

其他项目

adjust!: 调整参数。
batched_adjoint: 批量共轭转置。
batched_mul: 批量矩阵乘法。
batched_mul!: 强制in-place计算的批量矩阵乘法。
batched_transpose: 批量转置。
batched_vec: 批量向量操作。
bias_act!: 偏置和激活函数的复合操作。
binary_focal_loss: 二进制焦点损失函数。
cpu: CPU操作。
cpu_device: CPU设备。
create_bias: 创建偏置参数。
default_device_rng: 默认设备随机数生成器。
default_rng_value: 默认随机数生成器的值。
destructure: 解构对象。
dot_product_attention: 点积注意力机制。
dot_product_attention_scores: 点积注意力分数。
dropout: Dropout操作。
dropout!: 强制in-place计算的Dropout操作。
f16: 16位浮点数。
f32: 32位浮点数。
f64: 64位浮点数。
fmap: 特征图操作。
freeze!: 冻结参数。
functor: 函数对象。
get_device: 获取当前设备。
get_device_type: 获取设备类型。
getkeypath: 获取键路径。
gpu: GPU操作。
gpu_backend!: GPU后端操作。
gpu_device: GPU设备。
gradient: 计算梯度。
grid_sample: 网格采样操作。
hamming_window: 汉明窗函数。
hann_window: 汉宁窗函数。
imrotate: 图像旋转。
istft: 离散短时傅里叶逆变换。
label_smoothing: 标签平滑。
make_causal_mask: 创建因果掩码。
melscale_filterbanks: 梅尔尺度滤波器组。
outputsize: 输出尺寸。
pad_circular: 循环填充。
pad_constant: 常数填充。
pad_reflect: 反射填充。
pad_repeat: 重复填充。
pad_symmetric: 对称填充。
pad_zeros: 零填充。
params: 参数。
pixel_shuffle: 像素洗牌操作。
rand32:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/36374.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【C语言】C语言的变量和声明系统性讲解

声明和定义的概念 在C语言中,**声明(Declaration)和定义(Definition)**是两个重要的基础概念,它们都涉及到变量、函数、结构体等的使用,但功能和作用存在明显区别: 声明&#xff1a…

【Linux】文件的内核级缓冲区、重定向、用户级缓冲区(详解)

一.文件内核级缓冲区 在一个struct file内部还要有一个数据结构-----文件的内核级缓冲区 打开文件,为我们创建struct file,与该文件的所对应的操作表函数指针集合,还要提供一个文件的内核级缓冲区 1.write写入具体操作 当我们去对一个文件写…

MCU、ARM体系结构,单片机基础,单片机操作

计算机基础 计算机的组成 输入设备、输出设备、存储器、运算器、控制器 输入设备:将其他信号转换为计算机可以识别的信号(电信号)。输出设备:将电信号(0、1)转为人或其他设备能理解的…

JDK8新特性之Stream流01

Stream 流介绍 目标 了解集合的处理数据的弊端 理解Stream流的思想和作用 集合处理数据的弊端 当我们需要对集合中的元素进行操作的时候,除了必须的添加,删除,获取外,最典型的就是遍历集合。我们来体验集合操作的弊端&#xff…

【C++】—— map 与 multimap

【C】—— map 与 multimap 1 map1.1 map 和 multimap 参考文档1.2 map 类的介绍1.3 pair 类型介绍1.4 map的构造1.5 map的插入1.5.1 map 的插入方法1.5.2 验证1.5.3 再探pair1.5.4 make_pair 1.6 operator[]1.6.1 样例1.6.2 认识operator[]1.6.3 operator[] 的功能 1.7 map 的…

VTK知识学习(20)- 数据的存储与表达

1、数据的存储 1)、vtkDataArray VTK中的内存分配采用连续内存,可以快速地创建、删除和遍历,称之为数据数组(DataArray),用类 vtkDataArray 实现。数组数据的访问是基于索引的,从零开始计数。 以 vtkFloatArray 类来说明如何在 …

HCIP-以太网交换安全

端口隔离:实现同一VLAN下的不同用户在二层不能互通(可以实现在三层互通),同一个隔离组内是相互隔离的, MAC地址表功能:动态MAC地址表项,接口通告报文中的源MAC地址学习获得,表项可老…

电机功率、电压与电流的换算方法

在电气工程和相关行业中,电机的功率、电压和电流是三个重要的基本参数。它们之间有着密切的关系,而理解这些关系对于电机的选型、设计和应用至关重要。本文将详细阐述这三者之间的换算关系,以及相关公式的应用。 一、电机功率的定义 电机功…

【CKS最新模拟真题】获取多个集群的上下文名称并保存到指定文件中

文章目录 前言一、TASK二、解题过程1、问题一解题2、问题二解题 前言 月底考CKS,这是最新版的CKS模拟题 环境k8s版本ubuntu1.31 一、TASK 题目要求 Solve this question on: ssh cks3477 You have access to multiple clusters from your main terminal through contexts. …

智能合约的离线签名(EIP712协议)解决方案

一、解决核心问题 项目方不支付gas费,由用户自己发起交易,用户支付gas费。用户的数据保存在链下服务器中,token合约在链上,交易是由用户通过网页的DAPP发起。 后台服务、token合约、dapp如何配合工作是本方案的重点 二、总架构…

php:完整部署Grid++Report到php项目,并实现模板打印

一、下载Grid++Report软件 路径:开发者安装包下载 - 锐浪报表工具 二、 安装软件 1、对下载的压缩包运行内部的exe文件 2、选择语言 3、 完成安装引导 下一步即可 4、接收许可协议 点击“我接受” 5、选择安装路径 “浏览”选择安装路径,点击"安装" 6、完成…

SpringMvc完整知识点一

SpringMVC概述 定义 SpringMVC是一种基于Java实现MVC设计模型的轻量级Web框架 MVC设计模型:即将应用程序分为三个主要组件:模型(Model)、视图(View)和控制器(Controller)。这种分离…

SpringBoot暴露Prometheus指标数据

一、Prometheus Prometheus是一个开源的服务监控系统和时序数据库,提供了通用的数据模型和快捷数据采集、存储和查询接口。其核心组件Prometheus server会定期从静态配置的监控目标或者基于服务发现自动配置的目标中拉取数据,当新拉取到的数据大于配置的…

Hadoop生态圈框架部署 伪集群版(七)- Hive部署

文章目录 前言一、Hive部署(手动部署)1. 下载Hive2. 解压Hive安装包2.1 解压2.2 重命名2.3 解决冲突2.3.1 解决guava冲突2.3.2 解决SLF4J冲突 3. 配置Hive3.1 配置Hive环境变量3.2 修改 hive-site.xml 配置文件3.3 配置MySQL驱动包 4. 初始化MySQL上的存…

C++析构函数和构造函数

一、构造函数 1.构造函数的基本概念 1.对构造函数的理解: 构造函数是类的一种特殊成员函数,其主要功能是在创建对象时进行初始化操作。它的名字与类名相同,并且没有返回值类型(不能是void)。例如,对于一个…

Cherno C++学习笔记 P32 字符串

这篇文章我们来讲字符串。字符串可以说是最重要的变量类型了,因为对字符串的读写极大地影响到我们的程序和用户之间的交互。甚至很多很庞大的程序就只是在处理字符串。 对于字符串,我们同时需要有关于数组和指针的关系,字符串的实现与数组是…

linuxCNC(五)HAL驱动的指令介绍

HAL驱动的构成 指令举例详解 从终端进入到HAL命令行,执行halrun,即可进入halcmd命令行 # halrun指令描述oadrt加载comoonent,loadrt threads name1 period1创建新线程loadusr halmeter加载万用表UI界面loadusr halscope加载示波器UI界面sho…

在做题中学习(78):数组中第K个最大元素

解法:快速选择算法 说明:堆排序也是经典解决topK问题的算法,但时间复杂度为:O(NlogN) 而将要介绍的快速选择算法的时间复杂度为: O(N) 先看我的前两篇文章,分别学习:数组分三块,随机选择基准…

分布式事务的前世今生-纯理论

一个可用的复杂的系统总是从可用的简单系统进化而来。反过来这句话也正确: 从零开始设计的复杂的系统从来都用不了,也没办法让它变的可用。 --John Gal 《系统学》 1975 1. 事务的概念 百科: 事务(Transaction),一般是…

MySQL 服务无法启动

常见原因: 检查端口占用: 使用命令行工具(如netstat)来检查3306端口是否已被其他程序占用,输入netstat -ano(Windows)或netstat -tulnp | grep 3306(Linux/Mac)来查找3306端口的占用情况。如果…