ICML24最新开源时序基础模型MOMENT

图片

论文标题:MOMENT: A Family of Open Time-series Foundation Models

论文链接:https://arxiv.org/pdf/2402.03885

前言

当前时间序列数据上预训练大型模型面临以下挑战:(1) 缺乏大型且统一的公共时间序列数据集,(2) 时间序列特征的多样性使得多数据集训练十分繁重。(3) 用于评估这些模型的实验基准仍处于起步阶段,尤其是在资源、时间和监督有限的情况下。

本文提出MOMENT,一个用于通用时间序列分析的开源基础模型家族。该模型家族中的模型:(1)处理多样化时间序列分析任务(如预测、分类、异常检测和插补等)的基础模块,(2) 可以即插即用,无需或仅需少量特定任务示例(实现零样本预测、少样本分类等),(3) 通过使用任务相关的数据进行微调,可以进一步提高性能。

本文贡献

  • 数据集构建开源:编制了一个名为“The Time series Pile”的大型公共时间序列数据集合,涵盖了从医疗保健到工程、金融等多个领域的数据。The Time Series Pile 包含了来自多个不同领域的5个以上的公共时间序列数据库,用于预训练和评估模型,解决缺乏大型且统一的公共时间序列数据集问题。

  • 多数据集预训练:进行大规模混合数据集预训练,探索时间序列在分辨率、通道数量、长度和振幅等方面有所不同、存在缺失值等问题的处理和解决。

  • 评估:对于五种时间序列建模任务:短期和长期预测、分类、异常检测和插补,将MOMENT与(1)最先进的深度学习模型以及统计基线进行比较,(2)使用更具任务针对性的数据集,(3)采用多种评估指标,(4)专门在有限监督设置下进行评估。

本文模型

数据集:时间序列数据集Pile的数据划分。 为了避免数据污染,作者将所有数据集划分为互不重叠的训练集、验证集和测试集,并遵循每个数据集创建者提供的预定义划分方案。如果某些数据集没有预定义的划分方案,会随机抽取60%的数据用于训练,10%用于验证,30%用于测试。在预训练过程中,只使用所有数据集的训练部分。

图片

MOMENT模型 在MOMENT模型中,时间序列被分解为不重叠的固定长度子序列,称为补丁(patch)。每个补丁被映射为一个D维度的补丁嵌入。在预训练过程中,会随机掩盖这些补丁,将其补丁嵌入替换为一个特殊的掩码嵌入 [MASK]。预训练的目标是学习这些补丁嵌入,以便使用轻量级的重建头来重构输入的时间序列。

图片

模型评估:除了对比分析之外,作者还进行了大量的可视化分析,更多具体细节可看原文。下图显示了对合成生成的正弦波嵌入进行主成分分析(PCA)后的结果,表明MOMENT可以捕捉到微妙的趋势、尺度、频率和相位信息。

图片

下图是MOMENT学习的表示在3个最大的UCR数据集上的PCA和t-SNE可视化结果。 不同的颜色代表不同的类别。即使在没有针对特定数据集进行微调的情况下,MOMENT也能为不同的类别学习到明显不同的表示。

图片

结论

本文提出一个时间序列基础模型MOMENT,构造了(Time Series Pile)大型多样化公共时间序列数据集,并通过从头开始预训练高性能时间序列基础模型,证明了其有效性。然后,还对模型结果进行了大量的可视化分析。


 大家可以关注我【科学最top】,第一时间follow时序高水平论文解读!!!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/19066.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Flink和Spark的区别是什么?各自的应用场景是什么?

一、Flink是什么? Flink:Flink 是一个分布式流处理框架,其架构基于流计算,将一切都看作是流。它采用了一种基于事件驱动的架构,数据以流的形式源源不断地进入系统,并且能够实时处理这些数据。例如&#xf…

2024.11.18晚Linux复习课笔记

第一章 cat -n显示行号 -b不显示空行号 pwd 打印当前的工作目录 cd ls 打印当前工作的所有文件 -a -A -l:显示当前文件的详细信息 -r:递归显示 passwd:修改密码 ip a 查看ip地址 poweroff shutdown -h 关机 reboot shutdown -r 第二章 man --help …

基于Spring Boot+Unipp的博物馆预约小程序(协同过滤算法、二维码识别)【原创】

🎈系统亮点:协同过滤算法、二维码识别; 一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构:B/S架构 运行环境:win10/win11、jdk17 前端: 技术:框…

Scaling Law的“终结“还是新起点?——开源实践者的深度思考

作者:宋大宝,与大宝同学因那篇《回顾总结展望「融合RL与LLM思想,探寻世界模型以迈向AGI」》结识于今年春天,虽我们当时某些思想观念有些出入,也碰撞出了很多火花与共鸣,并持续地相互启发的走到了现在。他是…

【qt】控件4

1.Qradiobutton(单选按钮) ui界面有三个按钮,应该文本框,根据不同的按钮来改变不同文本框的内容 根据不同的单选按钮改变不同的文本框。 Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);ui->radioB…

Day02_AJAX综合案例 (黑马笔记)

Day02_AJAX综合案例 目录 Day02_AJAX综合案例 学习目标 01.案例_图书管理-介绍 目标 讲解 小结 02.Bootstrap 弹框_属性控制 目标 讲解 小结 03.Bootstrap 弹框_JS控制 目标 讲解 小结 04.案例_图书管理_渲染列表 目标 讲解 小结 05.案例_图书管理_新增图书…

六、代码生成,《编译原理》(本科教学版),第2版

文章目录 零、前言0.1 编译器前端到后端 一、代码生成1.1 代码生成的任务1.2 给数据分配计算资源1.3 给代码选择合适的机器指令1.4 栈式计算机1.4.1 栈式计算机Stack的结构1.4.2 栈计算机的指令集1.4.3 变量的内存分配伪指令1.4.4 栈式计算机的代码生成1.4.4.1 递归下降代码生成…

Android集成FCM(Firebace Cloud Messaging )

集成FCM官方文档 Firebace主页面 将 Firebase 添加到您的 Android 应用 1、进入Firebace页面,创建自己的项目 2、点击自己创建好的项目,在右侧选择Cloud Messaging 3、点击Android去创建 google-services.json 4、将下载的 google-services.json 文件…

D2076——一款双通道音频功率放大器【青牛科技】

概述: D2076是一款双通道音频功率放大器,最低工作电压可到1.0V。适用于 便携式小型收音机或立体声耳机作双通道或BTL应用。 主要特点: BTL工作,Po90mW(典型值) 外接元器件少 通过外接PNP三极管作为…

智慧社区平台系统提升物业管理效率与居民生活质量

内容概要 智慧社区平台系统是为应对现代城市管理挑战而诞生的重要工具。随着城市化进程的加快,传统的物业管理方式已经难以满足日益增长的居民需求和管理复杂性。因此,引入智能化管理手段显得尤为重要。这个系统不仅仅是一个简单的软件,它是…

【langchain4j】AIservices能够实现更加灵活的chain

文章目录 AI service介绍如何工作的AiServices提供的能力支持的返回形式 简单的例子:接收用户消息,并按规定返回接收单个变量接收更多动态变量 advanced RAGChaining multiple AI Services:多个AiSerives合并到一起相关教程:[Lang…

JavaScript 中字符串和数组的概念解析与多角度对比区分

文章目录 💯前言💯字符串(String)💯数组(Array)💯字符串与数组的相同点与不同点💯字符串和数组的实际应用场景💯字符串与数组的互转💯字符串和数组…

4K双模MiniLED显示器哪个好

4K双模MiniLED显示器哪个好?现在市面上的4K双模MiniLED显示器太多了,琳琅满目,今天就给大家列举一下7款当下火热到爆炸的品牌,看看4K双模MiniLED显示器哪个好。 4K双模MiniLED显示器哪个好 - HKC G27M7PRO HKC G27M7Pro 是一款性…

每天五分钟深度学习pytorch:批归一化全连接网络完成手写字体识别

本文重点 前面我们学习了普通的全连接神经网络,后面我们学习了带有激活层的全连接神经网络,本文我们继续进一步升级,我们学习带有批归一化的全连接神经网络,批归一化可以加快神经网络的训练速度,减少过拟合,具体它的原理,大家可以看我们的《每天五分钟深度学习》专栏,…

excel打开csv文件乱码的问题

如图所示,在保存csv文件时已指定编码为utf-8,用excel打开后仍然乱码 解决方法: 在保存csv文件时指定编码为utf-8-sig 该编码方式会在文件开头加入一个 BOM(Byte Order Mark),有助于 Excel 正确识别 UTF-8…

QQ音乐 11.3.4 | 魅族定制版,极致简洁,无广告,不限机型

QQ音乐魅族定制版,界面设计极致简洁,没有任何广告干扰,支持听限免歌曲,不限机型使用。用户可以通过微信和QQ直接登录,享受纯净的音乐体验。 大小:94.6M 下载地址: 百度网盘:https:…

使用TensorFlow实现简化版 GoogLeNet 模型进行 MNIST 图像分类

在本文中,我们将使用 TensorFlow 和 Keras 实现一个简化版的 GoogLeNet 模型来进行 MNIST 数据集的手写数字分类任务。GoogLeNet 采用了 Inception 模块,这使得它在处理图像数据时能更高效地提取特征。本教程将详细介绍如何在 MNIST 数据集上训练和测试这…

TON商城与Telegram App:生态融合与去中心化未来的精彩碰撞

随着区块链技术的快速发展,去中心化应用(DApp)逐渐成为了数字生态的重要组成部分。而Telegram作为全球领先的即时通讯应用,不仅仅满足于传统的社交功能,更在区块链领域大胆探索,推出了基于其去中心化网络的…

vulhub之log4j

Apache Log4j Server 反序列化命令执行漏洞(CVE-2017-5645) 漏洞简介 Apache Log4j是一个用于Java的日志记录库,其支持启动远程日志服务器。Apache Log4j 2.8.2之前的2.x版本中存在安全漏洞。攻击者可利用该漏洞执行任意代码。 Apache Log4j 在应用程序中添加日志记录最…

web服务nginx实验4:访问控制

4-1:基于不同用户的访问控制: 安装软件: 创建HTTP基本认证用户密码文件,tom,密码:1,lisa,密码:1: -c:表示创建一个新的密码文件。如果该文件已经…