FinGPT:12.3k 星星!金融领域的开源大模型来了!

cover_image
✨点击这里✨:🚀原文链接:(更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号!)

FinGPT:12.3k 星星!金融领域的开源大模型来了!

🌟如果你从事金融报表的阅读、数据分析等工作,这款模型将是一个绝佳的工具。

Hello,大家好,我是Aitrainee, 最近我看到了一条推文,介绍了 FinGPT
,这款开源金融领域的LLM(大型语言模型)。FinGPT采用数据中心方法,为研究人员和从业者提供开发金融LLM的资源。这对金融界来说显然非常激动人心,因为LLM在各种领域的应用正如火如荼地展开。
如果你从事金融报表的阅读、数据分析等工作,这款模型将是一个绝佳的工具。

FinGPT的研究论文和框架提出了一种将LLM(如ChatGPT)应用于金融应用的方式。虽然目前还未完全实现,但这是一个良好的起点,并为进一步的开发提供了很多讨论空间。今天我就来详细谈谈FinGPT。

回到FinGPT,虽然最初看到推文时我以为会有一个完整的模型发布,但实际上这只是一个框架。开发一个完整的模型需要大量资源,正如Bloomberg
GPT那样,他们利用多年积累的数据来训练自己的金融LLM,这使得Bloomberg
GPT在金融研究方面比普通的ChatGPT或其他开源LLM表现更好。然而,训练这样的模型需要数百万美元的投入,这对普通人来说是难以企及的。

FinGPT的目标是提供一个开放的环境,让人们可以共同开发类似甚至更好的模型。研究论文中提出的框架非常有趣:
首先是数据层,汇集了新闻数据、社交数据、财务数据等。
然后是自然语言处理模型和数据工程,最后将这些数据输入现有的开源LLM,如Llama模型和ChatGLM,以进行微调和特定金融应用的开发。

虽然目前他们的GitHub仓库中还没有提供完整的数据抓取代码,但他们确实在不断完善和发布模型。例如,他们在一些示例中使用了中国金融市场数据和美国市场数据来训练不同的LLM模型。未来,他们还计划发布一个训练好的模型,供大家使用和进一步微调。

FinGPT的应用前景非常广阔,包括机器人顾问、金融欺诈检测、量化交易、信用评分和风险管理等。如果你对这些应用感兴趣,我强烈推荐你阅读他们的研究论文,并关注他们的进展。

下面提供官方的 文档介绍、相关资源、部署教程 等,进一步支撑你的行动,以提升本文的帮助力。

最新动态:

  • • [模型发布] 2023年11月:我们发布了 FinGPT-Forecaster !🔥 演示 , Medium博客 & 模型 在 Huggingface🤗 上可用!

  • • [论文接受] 2023年10月: “FinGPT: Instruction Tuning Benchmark for Open-Source Large Language Models in Financial Datasets” 被NeurIPS 2023的 Instruction Workshop 接受🎉

  • • [论文接受] 2023年10月: “FinGPT: Democratizing Internet-scale Data for Financial Large Language Models” 被NeurIPS 2023的 Instruction Workshop 接受🎉

  • • [模型发布] 2023年10月:我们发布了 金融多任务LLMs 🔥,这些模型在 FinGPT-Benchmark 上评估基础LLMs时产生。

  • • [论文接受] 2023年9月: “Enhancing Financial Sentiment Analysis via Retrieval Augmented Large Language Models” 被 ACM国际金融AI会议 (ICAIF-23) 接受🎉

  • • [模型发布] 2023年8月:我们发布了 金融情感分析模型 🔥

  • • [论文接受] 2023年7月: “Instruct-FinGPT: Financial Sentiment Analysis by Instruction Tuning of General-Purpose Large Language Models” 被IJCAI 2023的 FinLLM 2023 接受🎉

  • • [论文接受] 2023年7月: “FinGPT: Open-Source Financial Large Language Models” 被IJCAI 2023的 FinLLM 2023 接受🎉

  • • [Medium博客] 2023年6月: FinGPT: Powering the Future of Finance with 20 Cutting-Edge Applications

为什么选择FinGPT?

1). 金融领域变化迅速。 BloombergGPT 使用混合金融数据和通用数据训练了一个LLM,耗时约53天,费用约为 300万美元
。每月或每周重新训练类似BloombergGPT的LLM模型代价高昂,因此轻量级的适应性非常有利。FinGPT可以快速微调以整合新数据(成本显著降低,每次微调费用低于
300美元 )。

2).
民主化互联网规模的金融数据至关重要,比如通过自动数据整理管道允许模型及时更新(每月或每周更新)。BloombergGPT有特权数据访问和API,而FinGPT提供了更便捷的替代方案。它优先考虑轻量级的适应性,利用最佳的开源LLM。

3).
关键技术是“RLHF(人类反馈的强化学习)”,这是BloombergGPT所缺乏的。RLHF使LLM模型能够学习个人偏好(风险规避水平、投资习惯、个性化机器人顾问等),这是ChatGPT和GPT4的“秘密”成分。

AI机器人顾问的里程碑:FinGPT-Forecaster

在我们的 HuggingFace Space 试用最新发布的FinGPT-Forecaster演示

输入以下内容:

  1. 1. 股票代码(例如AAPL, MSFT, NVDA)

  2. 2. 预测开始的日期(yyyy-mm-dd)

  3. 3. 检索市场新闻的过去几周

  4. 4. 是否添加最新的基本财务信息作为附加信息

点击提交!您将收到公司全面的分析和下一周股价走势的预测!

有关详细和更多定制化的实现,请参考 FinGPT-Forecaster

FinGPT演示:

金融情感分析的当前最先进水平

  • • FinGPT V3 (更新于 2023年10月12日)

    • • 新增内容: 在单个RTX 3090上进行情感分析的最佳可训练和推理的FinGPT,比GPT-4和ChatGPT微调效果更好。

    • • FinGPT v3 系列是使用LoRA方法在新闻和推文情感分析数据集上微调的LLMs,在大多数金融情感分析数据集上取得了最佳成绩,成本低廉。

    • • FinGPT v3.3使用llama2-13b作为基础模型;FinGPT v3.2使用llama2-7b作为基础模型;FinGPT v3.1使用chatglm2-6B作为基础模型。

    • • 基准测试结果:

加权F1FPBFiQA-SATFNSNWGI设备时间成本
FinGPT v3.30.8820.8740.9030.6431 × RTX 3090
17.25小时$17.25
FinGPT v3.20.8500.8600.8940.6361 × A1005.5小时
$ 22.55
FinGPT v3.10.8550.8500.8750.6421 × A1005.5小时
$ 22.55
FinGPT (

快速开始指南

安装

您可以通过以下方式安装FinGPT:

使用pip安装:
pip install FinGPT
从源码安装:
git clone https://github.com/AI4Finance-Foundation/FinGPT.git  
cd FinGPT  
pip install -e .

示例代码

以下是使用FinGPT进行金融情感分析的示例代码:

from fingpt import FinGPT  # 加载预训练的FinGPT模型  
model = FinGPT.from_pretrained('FinGPT/fingpt-sentiment_llama2-13b_lora')  # 定义输入文本  
text = "Apple Inc.的股票表现非常出色,投资者情绪高涨。"  # 进行情感分析  
sentiment = model.predict(text)  
print(f"情感分析结果: {sentiment}")

自定义微调

FinGPT允许您对模型进行微调以适应特定的金融任务。以下是一个简单的微调示例:

from fingpt import FinGPT, Trainer  # 加载预训练的FinGPT模型  
model = FinGPT.from_pretrained('FinGPT/fingpt-sentiment_llama2-13b_lora')  # 定义训练数据  
train_data = [  {"text": "这是一个积极的新闻", "label": "positive"},  {"text": "这是一个消极的新闻", "label": "negative"}  
]  # 定义训练参数  
training_args = {  "num_train_epochs": 3,  "learning_rate": 2e-5,  "per_device_train_batch_size": 16  
}  # 进行微调  
trainer = Trainer(model=model, args=training_args, train_data=train_data)  
trainer.train()

RLHF微调

RLHF(人类反馈的强化学习)是FinGPT的一项重要特性,可以让模型学习个体偏好。以下是一个简单的RLHF微调示例:

from fingpt import FinGPT, RLHFTrainer  # 加载预训练的FinGPT模型  
model = FinGPT.from_pretrained('FinGPT/fingpt-sentiment_llama2-13b_lora')  # 定义训练数据  
train_data = [  {"text": "这是一个积极的新闻", "label": "positive"},  {"text": "这是一个消极的新闻", "label": "negative"}  
]  # 定义RLHF参数  
rlhf_args = {  "num_train_epochs": 3,  "learning_rate": 2e-5,  "per_device_train_batch_size": 16  
}  # 进行RLHF微调  
trainer = RLHFTrainer(model=model, args=rlhf_args, train_data=train_data)  
trainer.train()

知音难求,自我修炼亦艰

抓住前沿技术的机遇,与我们一起成为创新的超级个体

(把握AIGC时代的个人力量)

**
**

** 点这里 👇 关注我,记得标星哦~ **

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

预览时标签不可点

微信扫一扫
关注该公众号

轻触阅读原文

AI进修生



收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1452240.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

C语言概述与历史

引言 C语言是一门历史悠久且影响深远的编程语言。它不仅为后继的许多编程语言奠定了基础,同时因其高效性和灵活性在系统编程和嵌入式开发领域得到了广泛应用。本篇文章将全面介绍C语言的起源与发展、设计目标与理念,以及C语言的标准演化历程,…

IT入门知识博客文章大纲第一部分《IT基础知识》(1/10)

目录 IT入门知识博客文章大纲第一部分《IT基础知识》(1/10) 1.引言 2.第一部分:IT基础知识 2.1 计算机硬件 CPU:计算机的心脏 内存:数据的临时居所 存储设备:数据的长期仓库 输入输出设备&#xff1…

Lua实现自定义函数面向对象编程

本文目录 1、引言2、原理3、实例4、层析验证 文章对应视频教程: 暂无,可以关注我的B站账号等待更新。 点击图片或链接访问我的B站主页~~~ 1、引言 在现代软件开发中,面向对象编程(OOP)已经成为一种广泛使用的编程范式…

海外仓系统如何让海外仓受益,WMS海外仓系统使用指南

随着跨境电商业务的快速发展,海外仓面临着需要更加高速运转的巨大挑战。 当海外仓出现因为手动作业导致效率低下,成本不断飙升或者出现库存管理问题的时候,意味着是时候引入一套合适的海外仓管理系统了。 对于寻求海外仓业务流程优化的企业…

Java17 --- RabbitMQ之插件使用

目录 一、Federation插件 1.1、运行两个rabbitmq实例 1.2、启用插件 1.3、在下游端点添加上游端点 1.4、创建策略 1.6、测试 二、联邦队列 2.1、创建策略 2.2、创建交换机与队列 2.2.1、创建52000的队列与交换机 2.2.2、创建62000的队列 三、Shovel 3.1、启…

力控算法每日一练:209. 长度最小的子数组(java)

给定一个含有 n 个正整数的数组和一个正整数 target 。 找出该数组中满足其总和大于等于 target 的长度最小的 子数组 [numsl, numsl1, ..., numsr-1, numsr] ,并返回其长度。如果不存在符合条件的子数组,返回 0 。 class Solution {public int minSu…

Docker镜像技术剖析

目录 1、概述1.1 什么是镜像?1.2 联合文件系统UnionFS1.3 bootfs和rootfs1.4 镜像结构1.5 镜像的主要技术特点1.5.1 镜像分层技术1.5.2 写时复制(copy-on-write)策略1.5.3 内容寻址存储(content-addressable storage)机制1.5.4 联合挂载(union mount)技术 2.机制原理…

技术转管理,是灾难还是奇迹?

深耕技术or转战管理?this is a question! 如果你还没有想好,那请继续往下看! 技术专家:技术前瞻者、方案构建者、难题破解者、团队聚核者 管理专家:战略规划者、高效组织者、变革引领者、团队建设者 特点和重心都不在…

Unity动态添加聊天文本

1.创建一个滚动视图 2.调整滚动视图的位置并删掉这个 3.创建一个输入框和一个按钮 这里插一句一定要给content添加这个组件并设置单元格大小 4创建一个脚本并编写下面代码 using System.Collections; using System.Collections.Generic; using TMPro; using Unity.VisualScrip…

C#的Switch语句(在C#中如何根据结果执行不同的代码)

文章目录 基本语法示例 注意使用goto跳转其他标签 基本语法 switch语句是一种选择结构,用于基于某个表达式的值执行不同的代码块。它提供了一种更简洁、更易读的方式来处理多路分支逻辑,相比于多个嵌套的if…else if…else语句。下面是switch语句的基本…

排序算法、堆排序、大顶堆、小顶堆、手写快排-215. 数组中的第K个最大元素、2336. 无限集中的最小数字

目录 215. 数组中的第K个最大元素 题目链接及描述 题目分析 堆排序分析 堆排序代码编写 快排分析 快排代码编写 2336、无限集中的最小数字 题目链接及描述 题目分析 代码编写 215. 数组中的第K个最大元素 题目链接及描述 215. 数组中的第K个最大元素 - 力扣&#…

前端菜鸡流水账日记 -- pnpm的学习

哈咯哇大家,我又来了,最近稍微悠闲一些,所以就趁着这个机会学习一些新的知识,今天就是碰巧遇到了pnm,这个可以看作是npm的升级版本,比npm要快,用起来也更得劲更迅速 官网地址:https…

ArrayList集合+综合案例

数组与集合的区别 ArrayList 概述 是java编写好的一个类,用于表示一个容器,使用的时候,需要注意指定容器中元素的数据类型;(如果不指定,语法不报错,但是取值的时候不方便)注意事项 使用的时候,写ArrayList<元素的数据类型>的数据类型的时候,带着泛型;使用ArrayList集合…

智能资产时代:探索Web3对数字资产的变革

随着科技的不断进步&#xff0c;数字资产的概念已经深入人心。从最初的比特币到如今的多样化数字资产&#xff0c;技术的革新改变了我们对资产的理解和管理方式。作为新一代互联网的核心&#xff0c;Web3正在引领一场关于数字资产的革命。本文将深入探讨Web3如何变革数字资产&a…

达梦数据库备份还原(RPO/RTO)

不带归档的还原&#xff08;还原到备份集的状态&#xff09; 本文使用作业备份数据库数据Linux环境 备份 1.创建代理环境 2.创建作业&#xff08;图片从左到右依次创建&#xff09; 注意备份的路径选择好 这里可以查询备份作业日志 还原 关闭数据库 在终端切换到达梦的bin…

防止Selenium被检测 Google Chrome 125

背景 最近在使用selenium自动播放学习课程&#xff0c;相信大家也有一些类似的使用场景。 能自动化的事情&#xff0c;绝不自己干。 为防止被检测是机器人做题&#xff0c;刷视频&#xff0c;需要做一些小调整。 先来看作为服务方维护者&#xff0c;是如何检测是Selenium打…

Coolify:24.2K 星星!使用全新、开源免费且自托管的替代方案,部署应用程序的最佳工具(停止使用 Vercel)

✨点击这里✨&#xff1a;&#x1f680;原文链接&#xff1a;&#xff08;更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号&#xff01;&#xff09; Coolify&#xff1a;24.2K 星星&#xff01;使用全新、开源免费且自托管的替代方案&#xff0c;部…

[Python学习篇] Python字符串

字符串是 Python 中最常用的数据类型&#xff0c;一般使用单引号或引号来创建字符串 语法&#xff1a; 字符串变量名A 字符串变量值A 字符串变量名B "字符串变量值B" 示例&#xff1a; a Hello A print(a) b "Hello B" print(b) 字符串特征 一对引号字…

什么是GPT-4

什么是GPT-4 ChatGPT 可以说&#xff0c;ChatGPT的发展&#xff0c;主要的分水岭在GPT-4&#xff0c;GPT-4主要是文本对话&#xff0c;且训练度也不够完善。GPT-4之后不但训练度得到了巨大提升&#xff0c;模型支持的参数量更是预计有1万亿参数&#xff0c;在这之后出现的GPT-4…

智慧场馆:绝对是科技+建筑的完美盛宴,有图有真相。

2024-01-03 14:34贝格前端工场 去年的亚运会&#xff0c;让大家体验了一把建筑科技&#xff0c;现在这个依然成了新趋势&#xff0c;贝格前端工场借此描述下场馆和科技的紧密联络&#xff0c;以及智慧场馆的应用场景。 智慧场馆是指通过科技手段将传统场馆进行升级改造&#…