Transformer+时间序列预测,依然是顶会密码!看完这些你也行!

最近在时间序列预测领域,Transformer再次崭露头角!全新的iTransformer模型以其独特优势,在不修改任何模块的情况下,实现了全面领先。

事实上,「基于Transformer进行时间序列预测」 一直是研究的焦点之一。这主要归功于它在处理长时序问题和提高模型训练速度方面所具备的独特优势。随着深度学习的蓬勃发展,它更成为AI顶会中的常客。

为了给大家带来更多启发,我整理了 「12种前沿改进思路」,并涉及两个主要方向:
1.模型结构创新,以informer等为代表;
2.数据输入创新,以patch TST、ITranformer为代表。

25年该方向的创新可以参考以下方向:
1.把简单模型与patch尝试结合,并做一些小改进;
2.直接patch操作之后,进行注意力机制等的改进。

1.iTransformer

代表论文:iTransformer: Inverted Transformers Are Effective for Time Series Forecasting

「背景」:最近很多学者利用Transformers对时间序列的时间标记的全局依赖性进行建模,每个标记由相同时间戳的多个变量组成。然而,由于性能下降和计算爆炸,Transformers在具有较大lookback windows的预测序列中面临挑战。此外,每个时间标记的嵌入融合了表示潜在延迟事件和不同物理测量的多个变量,这可能无法学习以变量为中心的表示,并导致无意义的注意力图。
「简述」:该文在不对基本组件进行任何修改的情况下重新调整了Transformer架构的用途,提出了iTransformer,它将注意力和前馈网络应用于反向维度。具体地,作者将单个序列的时间点嵌入到变量标记中,注意力机制利用这些变量标记来捕捉多变量相关性;同时,将前馈网络应用于每个变量tokens,以学习非线性表示。

图片

2.Scaleformer

代表论文:Scaleformer: Iterative Multi-scale Refining Transformers For Time Series Forecasting

「简述」:该文提出了一个通用的多尺度框架,该框架可应用于最先进的基于变压器的时间序列预测模型(FEDformer、Autoformer等)。通过使用共享权重在多个尺度上迭代重新定义预测的时间序列,引入架构调整和专门设计的归一化方案,使其能够在数据集和转换器架构中实现显著的性能改进,从5.5%提高到38.5%,同时将额外的计算开销降到最低。

在这里插入图片描述

3.InParformer

代表论文:InParformer: Evolutionary Decomposition Transformers with Interactive Parallel Attentionfor Long-Term Time Series Forecasting

「背景」:长期时间序列预测(LTSF)对捕捉长期相关性的模型能力提出了重要要求。具有自注意机制的Transformer,最初被提出用于对标记为离散的和高度语义的语言序列进行建模。然而,与语言序列不同,大多数时间序列都是连续的数字点。具有时域冗余的时间步长是弱语义的,仅利用时域标记很难描述整体属性时间序列(例如总体趋势和周期性变化)。
「简述」:该文提出了一种新的基于Transformer的预测模型,称为InParformer,该模型具有主动并行注意力(InPar Attention)机制。InPar注意力被提出用于在频域和时域中全面学习长程依赖关系。为了提高其学习能力和效率,该文进一步设计了几种机制,包括查询选择、键值对压缩和重组。此外,InPar前者采用进化季节趋势分解模块构建,以增强复杂的时间模式提取。

图片

4.SMARTformer

代表论文:SMARTformer: Semi-Autoregressive Transformer with Efficient Integrated Window Attention for Long Time Series Forecasting

「简述」:该文介绍了SMARTformer,它代表SeMi自回归变换器。SMARTformer利用集成窗口注意(IWA)和半自回归(SAR)解码器从编码器和解码器的角度捕获全局和局部相关性。
IWA在多尺度窗口中进行局部自注意,并在具有线性复杂性的窗口中进行全局注意,以在局部和扩大的感受性长石中实现互补线索。SAR迭代生成子序列,类似于自回归(AR)解码,但以NAR方式引用整个序列。这样,SAR既受益于NAR的全局范围,也受益于AR的局部细节捕获。

图片

5. GCformer

代表论文:GCformer: An Efficient Framework for Accurate and Scalable Long-Term Multivariate TimeSeries Forecasting

「简述」:该文提出了GCformer,它将用于处理长输入序列的结构化全局卷积分支与用于捕获短的最近信号的基于局部Transformer的分支相结合。利用三种不同的参数化方法,引入了全局卷积核的内聚框架。全局分支中所选的结构化卷积核是以亚线性复杂度专门制作的,从而能够有效处理冗长和有噪声的输入信号。对六个基准数据集的实证研究表明,GCformer优于最先进的方法,将多变量时间序列基准的MSE误差降低了4.38%,将模型参数降低了61.92%。

在这里插入图片描述

6.FEDformer

代表论文:FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series Forecasting

「简述」:该文建议将Transformer与季节趋势分解方法相结合,其中分解方法捕获时间序列的全局轮廓,而Transformer捕获更详细的结构。为了进一步提高Transformer的长期预测性能,利用了大多数时间序列在傅立叶变换等众所周知的基础上往往具有稀疏表示的事实,并开发了一种频率增强的Transformer。

7.ETSformer

代表论文:ETSformer: Exponential Smoothing Transformers for Time-series Forecasting

「简述」:该文提出了一种新的时间序列变压器架构ETSformer,它利用指数平滑原理改进了用于时间序列预测的变压器。特别是受时间序列预测中经典指数平滑方法的启发,该文提出了新的指数平滑保持(ESA)和频率注意(FA)来取代普通变压器的自注意机制,从而提高了准确性和效率。在此基础上,使用模块化分解块重新设计了Transformer架构,使其能够学习将时间序列数据分解为可解释的时间序列组件,如级别、增长和季节性。

在这里插入图片描述

8.Autoformer

代表论文:Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term SeriesForecasting

「简述」:该文将Autoformer设计为一种具有自相关机制的新型分解架构。打破了级数分解的预处理惯例,将其作为深度模型的基本内部块进行了更新。这种设计使Autoformer具有复杂时间序列的渐进分解能力。此外,受随机过程理论的启发,该文设计了基于序列周期性的自相关机制,在子序列层面进行相关性发现和表示聚合。Autoformer在六个基准上相对提高了38%,涵盖了五个实际应用:能源、交通、经济、天气和疾病。

在这里插入图片描述

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1557440.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

恶意软件基础知识——恶意软件命名

计算机病毒(Computer Virus)指编制或者在计算机程序中插入的破坏计算机功能或者破坏数据,影响计算机使用并且能够自我复制的一组计算机指令或者程序代码。 ——《中华人民共和国计算机信息系统安全保护条例》 恶意软件的定义 恶意软件是一个用来描述恶意应用程序…

EMC-共模耦合

本次内容主要谈论共模耦合,EMC中数量可观且极为棘手的问题大都由共模引起,近端时间一直在研究共模问题,有一点心得,跟大家一起分享。在抗扰度测试过程中,比如CBCI测试时,所有线束都会施加干扰信号&#xff…

俗人,精气神,歌曲《错的人》

精气神,在人体中,精指构成人体生命活动的各层次的有形元素,常呈固体或液体状态。 哲学前提:世界上的一切,从微观上讲,都是由精微物质构成的,比如基本粒子。 关于有形与无形、与主观关注点相关…

YOLO--前置基础词-学习总结(上)

RFBNet是什么意思 RFBNet 是一种用于目标检测的深度学习网络,它的名字来源于 "Receptive Field Block Network"(感受野块网络)。简单来说,RFBNet 是一种可以让计算机更好地“看”图像中不同大小的物体的方法。 在图像处…

原生input实现时间选择器用法

2024.10.08今天我学习了如何用原生的input&#xff0c;实现时间选择器用法&#xff0c;效果如下&#xff1a; 代码如下&#xff1a; <div><input id"yf_start" type"text"> </div><script>$(#yf_start).datepicker({language: zh…

Qwen变体新成员加一,英伟达训练 NVLM-D-72B 视觉大模型

今天&#xff08;2024 年 9 月 17 日&#xff09;&#xff0c;我们推出了前沿级多模态大语言模型&#xff08;LLM&#xff09;系列 NVLM 1.0&#xff0c;它在视觉语言任务上取得了最先进的结果&#xff0c;可与领先的专有模型&#xff08;如 GPT-4o&#xff09;和开放存取模型&…

低代码赋能汽车制造产业链场景系列

当前汽车行业数字化智能化转型浪潮下&#xff0c;整车及其上下游产业链的协同创新正变得至关重要。头部车企与上下游供应链企业正逐步解决在生产管理、业务互通、系统集成等方面的痛点与挑战。电动化、智能化、网联化作为汽车产业的三大趋势&#xff0c;正共同推动未来汽车产业…

Web自动化Demo-Kotlin+Selenium

1.新建工程 打开Aqua&#xff0c;点击New Project选中Kotlin&#xff0c;配置如下&#xff1a; 然后在build.gradle.kts文件中添加依赖 plugins {kotlin("jvm") version "1.9.23" }group "org.example" version "1.0-SNAPSHOT"rep…

数据分析:宏基因组群落TOPOSCORE拓扑结构打分

文章目录 介绍数据TOPOSCORE算法SCORE计算TOPOSCORE实操tp_helper.R导入数据生存分析Fisher精确检验聚类分析SIG定义Toposcoring 分数计算Akkermansia muciniphila的考虑TOPOSCORE的验证总结系统信息介绍 研究背景:肠道微生物群对癌症患者对免疫检查点抑制剂(ICIs)的临床反…

<Rust>iced库(0.13.1)学习之部件(三十一):picklist部件的使用及可变style设置

前言 本专栏是学习Rust的GUI库iced的合集,将介绍iced涉及的各个小部件分别介绍,最后会汇总为一个总的程序。 iced是RustGUI中比较强大的一个,目前处于发展中(即版本可能会改变),本专栏基于版本0.12.1. 注:新版本已更新为0.13 概述 这是本专栏的第三十一篇,主要说明下…

基于springboot vue地方废物回收机构管理系统设计与实现

博主介绍&#xff1a;专注于Java&#xff08;springboot ssm 等开发框架&#xff09; vue .net php phython node.js uniapp 微信小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设&#xff0c;从业十五余年开发设计教学工作 ☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不…

新生培训 day1 C语言基础 顺序 分支 循环 数组 字符串 函数

比赛地址 b牛客竞赛_ACM/NOI/CSP/CCPC/ICPC算法编程高难度练习赛_牛客竞赛OJ C语言数据类型 字符 整型数 int 2e9 long long 9e18 浮点数 代码示例 /** Author: Dduo * Date: 2024-10-8* Description: 新生培训day1 */ #include <stdio.h>int main() {// 定义变量in…

论文速读:基于渐进式转移的无监督域自适应舰船检测

这篇文章的标题是《Unsupervised Domain Adaptation Based on Progressive Transfer for Ship Detection: From Optical to SAR Images》基于渐进式转移的无监督域自适应舰船检测:从光学图像到SAR图像&#xff0c;作者是Yu Shi等人。文章发表在IEEE Transactions on Geoscience…

TDesign - 腾讯出品的企业级开源设计系统越发成熟稳定,支持 Vue3 / 小程序,适合开发企业中后台和移动应用

TDesing 发展越来越好了&#xff0c;出了好几套组件库&#xff0c;很成熟稳定了&#xff0c;新项目完全可以考虑使用。 早在2021年&#xff0c;腾讯的 TDesing 刚发布不久&#xff0c;我就写了一篇简短的文章来介绍&#xff0c;当时主要关注的是 TDesign 的 Vue 组件库和用来搭…

计算机基础知识:计算机中丢失 msvcr110.dll怎么修复?

1. msvcp110.dll 介绍 1.1 定义&#xff1a;Microsoft Visual C 2012的一部分 msvcp110.dll是Microsoft Visual C 2012 Redistributable Package的一部分&#xff0c;这是一个运行时库文件&#xff0c;包含了Microsoft Visual C 2012编译器所构建程序所需的函数和资源。 1.2…

大数据ETL数据提取转换和加载处理

什么是 ETL&#xff1f; 提取转换加载&#xff08;英语&#xff1a;Extract, transform, load&#xff0c;简称ETL&#xff09;&#xff0c;用来描述将资料从来源端经过抽取、转置、加载至目的端的过程。ETL一词较常用在数据仓库&#xff0c;但其对象并不限于数据仓库。 ETL&…

Ansys Speos | 智能手环心率传感器仿真

在本例中&#xff0c;我们将使用Ansys Speos和Ansys Motion模拟具有动态运动的智能带光学心率传感器。通过Ansys Motion模拟智能手环的位移和人体手腕组织的变形&#xff0c;然后将位移和变形数据导入Speos&#xff0c;最后在Ansys Speos中&#xff0c;用模拟智能手环位移和人体…

视频合并与封面添加:打造独特视频作品的指南

在视频创作领域&#xff0c;将多个视频片段合并成多个完整的作品&#xff0c;并为其添加统一的封面图片&#xff0c;是提升视频专业度和吸引力的有效方法。 1打开软件&#xff0c;在界面功能栏里切换到“嵌套合并”版块上 2在设置视频封面中选择“使用随机封面”&#xff0c;并…

二叉树——左叶子节点之和

以目前所学的知识而言&#xff0c;对于二叉树涉及递归相关的问题&#xff0c;一般需要设定两个返回条件&#xff1a; 1、二叉树左子树或右子树遍历完后&#xff0c;即节点为NULL时需要返回。 2、当前节点满足题目要求时&#xff0c;需要对相应参数做出改变&#xff0c;或是直…

同城美容美发一站式到店上门服务系统小程序源码

&#x1f486;‍♀️同城美容美发一站式到店上门服务&#xff1a;美丽&#xff0c;就该如此便捷&#x1f487;‍♂️ &#x1f3e0;一、同城服务&#xff0c;触手可及的美丽 在繁忙的都市生活中&#xff0c;我们总是在寻找那份触手可及的美丽。而“同城美容美发一站式到店上门…