ICML24|通用时间序列预测大模型思路

图片

论文标题:Unified Training of Universal Time Series Forecasting Transformers

GitHub链接:https://github. com/SalesforceAIResearch/uni2ts

论文链接:https://arxiv.org/pdf/2402.02592

前言

普适预测器是一个能够处理任何时间序列预测问题的大型预训练模型。它在跨多个领域的大规模时间序列数据集上进行训练。如图1,与现有范式相比,普适预测面临三个关键问题:i) 多频率,ii) 任意变量预测,iii) 分布变化。

为了解决这些挑战,本文对传统时间序列Transformer架构进行了新颖的增强,提出了——基于掩码编码器的普适时间序列预测Transformer(MOIRAI)。MOIRAI在新引入的大规模开放时间序列档案(LOTSA)上进行了训练,该档案包含了来自九个领域的超过270亿个观测值。作为零样本预测器,MOIRAI在性能上与全样本模型相比具有更优越的表现。

图片

本文工作

图片

上图是本文MOIRAI框架图,

  • 作者首先提出学习多个输入和输出投影层,以处理来自不同频率时间序列的不同模式。通过使用基于patch的投影,对于高频数据采用较大的patch大小,反之亦然,投影层专门学习该频率的模式。

  • 其次,通过提出的任意变量注意力机制解决了维度变化的问题,该机制将时间和变量轴同时视为单个序列,利用旋转位置嵌入(RoPE)和学习的二元注意力偏差分别编码时间和变量轴。任意变量注意力机制允许模型输入任意数量的变量。

  • 最后,通过混合参数分布解决了需要灵活预测分布的问题。此外,优化灵活分布的负对数似然具有与目标度量优化竞争的附加优势,这对于预训练普适预测器来说是一个强大的功能,因为它可以随后使用任何目标度量进行评估。

概括一下:

MOIRAI采用基于patch的非重叠方法,通过掩码编码器架构对时间序列进行建模。提出的将架构扩展到任意变量设置的一项修改是“展平”多变量时间序列,将所有变量视为单个序列。随后通过多patch大小输入投影层投影为向量表示。[mask]表示一个可学习的嵌入,替换掉预测范围内的patch(感觉和语言模型思路类似)。然后,输出token通过多patch大小输出投影解码为混合分布的参数。

核心Transformer模块是一个仅包含编码器的Transformer架构,利用了当前的大型语言模型架构提出的各种改进trick,包括:1)使用预归一化并用RMSNorm替换所有LayerNorm;2)应用了查询-键归一化;3)FFN层中的非线性被SwiGLU替换,调整隐藏维度以使参数数量与原始FFN层相同。在Transformer模块的所有层中省略了偏置。

实验分析和结果

实验分析部分篇幅很大,这里只截取了部分结果。总结来说:MOIRAI在所有模型规模下都优于Monash基准中的所有基线,显示出统一训练方法带来的强大的分布内和跨领域能力。每个MOIRAI实例都是在多个数据集上评估的单一模型,而基线模型通常是每个数据集训练一个模型。

图片

未来工作思考

参数和调优方面,几乎没有进行超参数调优。在架构方面,使用多patch大小映射来解决跨频率学习的问题,这种方法有些依赖经验性,灵活性不足。

对高维时间序列的支持有限,扩展Transformer输入长度的高效方法可以缓解这个问题。掩码编码器结构还使其适合探索潜在扩散架构。

在数据方面,LOTSA可以通过在领域和频率方面增加更多的多样性来进一步增强。最后,结合表格或文本输入等多模态普适预测也是一个新方向。


 大家可以关注我【科学最top】,第一时间follow时序高水平论文解读!!!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/17999.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

LRU(Least Recently Used,最近未使用)

一、LRU的由来 lru的引入主要是和内存回收有关。 属于内核的大部分page是不能够进行回收的,比如内核栈、内核代码段、内核数据段以及大部分内核使用的page,它们都是不能够进行回收的; 相反,进程使用的page,比如进程…

网盘聚合搜索项目Aipan(爱盼)

本文软件由网友 刘源 推荐; 简介 什么是 Aipan(爱盼) ? Aipan(爱盼)是一个基于 Vue 和 Nuxt.js 技术构建的开源网盘搜索项目。其主要目标是为用户提供一个能够自主拥有和管理的网盘搜索网站。该项目持续维护和更新&a…

i春秋-Hash(__wakeup沉默、序列化)

练习平台地址 竞赛中心 题目描述 题目内容 啥也没有就一个标签跳转 点击后的确发生了跳转 观察到url中有key和hash两个值,猜测hash是key的hash 查看源代码发现确实是 $hashmd5($sign.$key);the length of $sign is 8 解密得到$sign应该为kkkkkk01 构造122的hash i…

【含开题报告+文档+PPT+源码】基于SpringBoot+Vue的智能蒙绮英语学习系统设计与实现

开题报告 随着全球化的不断深入,英语作为国际通用语言,其重要性日益凸显。掌握英语不仅可以拓宽个人的视野和知识面,还可以增强个人竞争力,为个人职业发展带来更多机会。因此,开发一款能够帮助用户更高效地学习英文单…

Blender vs 3dMax谁才是3D软件的未来?

在探讨Blender与3ds Max谁才是3D软件的未来时,我们需要从多个维度对这两款软件进行详细分析。 Blender的优势 开源免费:Blender是一款完全免费的开源3D创作套件,这使得它成为独立艺术家、业余爱好者和小型工作室的首选。用户无需承担巨额的…

ubuntu安装cuda、cudnn和TensoRT【分步安装】

我说实话,这个环境安装真的要了老命,太tm恶心了。 因为遇到了很多问题,非常之恶心 问题一:版本对应 问题二:下载具慢 问题三:上NVIDIA有时候上不去 问题四:找到对应版本点不了 问题五&…

基于树莓派的边缘端 AI 目标检测、目标跟踪、姿态估计 视频分析推理 加速方案:Hailo with ultralytics YOLOv8 YOLOv11

文件大纲 加速原理硬件安装软件安装基本设置系统升级docker 方案Demo 测试目标检测姿态估计视频分析参考文献前序树莓派文章hailo加速原理 Hailo 发布的 Raspberry Pi AI kit 加速原理,有几篇文章介绍的不错 https://ubuntu.com/blog/hackers-guide-to-the-raspberry-pi-ai-ki…

网络工程实验一:静态路由的配置

#实验仅供参考,勿直接粘贴复制,用以学习交流# 1、实验目的: 熟悉eNSP网络仿真工具平台。 掌握静态路由配置方法。 能够配置路由器接口地址。 2、实验内容: 2.1、安装对应的软件: (1)Virtual …

基于java的宠物用品交易平台

一、作品包含 源码数据库设计文档万字PPT全套环境和工具资源部署教程 二、项目技术 前端技术:Html、Css、Js、Vue、Element-ui 数据库:MySQL 后端技术:Java、Spring Boot、MyBatis 三、运行环境 开发工具:IDEA/eclipse 数据…

华为VPN技术

1.启动设备 2.配置IP地址 [FW1]int g1/0/0 [FW1-GigabitEthernet1/0/0]ip add 192.168.1.254 24 [FW1-GigabitEthernet1/0/0]int g1/0/1 [FW1-GigabitEthernet1/0/1]ip add 100.1.1.1 24 [FW1-GigabitEthernet1/0/1]service-manage ping permit [FW2]int g1/0/0 [FW2-Gi…

鸿蒙进阶篇-数组常用方法(一)

大家好,这里是鸿蒙开天组,今天咱们来学习一下数组的常用方法。 数组在编程中是非常常见的数据类型,毕竟需要用到的场合太多了,所以我们今天来使劲学习一下常用方法,在这里也没法一一列全,但是大家也可以根…

整数唯一分解定理

整数唯一分解定理,也称为算术基本定理,是由德国数学家高斯在其著作《算术研究》中首次提出的。本文回顾整数唯一分解定理以及对应的几个重要结论。 一、整数唯一分解定理 整数唯一分解定理,也称为算术基本定理,是数论中的一个重…

对Pod做一个详细了解

文章目录 01创建一个pod02删除pod03镜像拉取策略04pod的标签05pod资源限制方法06pod的重启策略 07pod中运行多个容器08对pod内的容器执行命令09 验证多个pod中多个容器网络共享10 pod的创建流程和调度的约束方式pod的声明周期介绍pod 的健康检查健康检查的方式probe的探测方式案…

LinkedHashMap实现LRU

LRU 环境:JDK11 最近接触LRU(Least Recently Used),即最近最少使用,也称淘汰算法,在JDK中LinkedHashMap有相关实现 LRU的LinkedHashMap实现 LinkedHashMap继承HashMap。所以内存的存储结构和HashMap一样,但是LinkedH…

基于rk356x u-boot版本功能分析及编译相关(三)Makefile分析

🎏技术驱动源于热爱,祝各位学有所成。 文章目录 一、Makefile简要概述二、简要流程图三、Makefile文件具体分析大家好哈,这次因工作比较忙,文章更新拖的有些久了。哈哈,话不多说,咱们接着上次继续说u-boot的Makefile。 一、Makefile简要概述 一般要了解u-boot源码的编译…

shell(1)脚本创建执行与变量使用

shell(1)脚本创建执行与变量使用 声明! 学习视频来自B站up主 泷羽sec 有兴趣的师傅可以关注一下,如涉及侵权马上删除文章 笔记只是方便各位师傅的学习和探讨,文章所提到的网站以及内容,只做学习交流&…

第5章总体设计-5.4 硬件可行性分析

5.4 硬件可行性分析 5.4.1 硬件方案评估1. 框式产品硬件可行性分析(1)机框设计可行性。(2)单板设计可行性。(3)核心功能器件选型。(4)数据流。 2. 盒式产品硬件可行性分析3. 终端产品…

TOIS24|推荐公平性的反事实解释

论文:https://arxiv.org/pdf/2307.04386 代码:https://anonymous.4open.science/r/CFairER-anony/. 关键词:可解释推荐;公平;反事实的解释;强化学习 1 动机 现有推荐系统存在的公平性问题,例如性别歧视和种族偏见等,…

week 3 - Assembly Language

Important Instructions and Syntax 此内容是以MASM编写的,你将使用Visual C/C内联汇编来编程,因此数据元素的声明有所不同,但概念和指令集(instruction sets)相同。 一、General-Purpose Registers 寄存器是CPU内的命名存储单元…