【大模型技术】什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题

从问题出发,先有需求再有解决方案

老板和员工在思维方式上有一个很大的差别就是,作为老板他们喜欢寻找现有的解决方案,如果现有的解决方案无法满足的情况下,才会自己设计一个解决方案。

而作为员工来说特别是技术人员,大都有一种技术至上的心态,比如说很多技术人员找工作会特别在乎公司用的技术是否足够牛逼,足够高大上。

之所以产生这种现象的原因是因为,技术人员的心态是学会牛逼的技术,走到哪里都不怕。

而老板的心态是,能解决问题把业务跑起来最重要,现有的解决方案或许不是最好的,但它却是经过验证的,能够保证业务的稳定性;但如果提出新的解决方案,就要承担新方案潜在的各种风险。等以后业务稳定之后,可以慢慢的优化现有的方案。

什么时候需要训练和微调模型?

在上面的内容中,描述了一下员工与老板思维以及心态上的区别;这两种思维方式没有绝对的对错之分,区别只是两种完全不同的发展方向,一种是打工人的思维方式,一种是创业者的思维方式。

就拿大模型训练与微调来说,很多技术人员都想亲自参与或体验一下一个模型从无到有的诞生过程;但受限于各种原因,有机会参与这样工程的人还是比较少的;因此很多人都退而求其次,想做一下模型的训练与微调。

图片

举个例子,你是某个小公司的技术人员,老板想引入大模型技术来升级现有的业务系统,然后让你做一下前期调查和简单的解决方案。

不管使用的是大模型的什么技术,比如Agent,知识库,AIGC等;很多技术人员下意识的方式就是先搞一个本地模型,试试能不能训练和微调一下,然后就陷入各种技术细节中无法自拔。

但事实上,市面上已经有很多大模型服务商,他们有专门训练和微调过的模型;根据现有的业务体系,或许随便找一个合适的模型就可以用了。

为什么不建议企业引入大模型技术时,就直接打造属于自己的大模型?

原因就是,你还不知道怎么把大模型技术与自己的业务场景相结合;虽然市面上可能有一些相似的案例,但每个企业都有其独特的运作方式,适合别人的不一定适合你。

简单来说就是,你都不知道现有业务引入大模型能解决哪些问题,以及潜藏着哪些问题;说白了就是,你都不知道要训练和微调出一个需要解决什么问题的模型,这样的模型怎么可能做的好呢?

图片

就类似于你需求都不清楚,就直接开始开发产品了,这样的产品能有人用吗?

当然,如果说你觉得你是上帝之子,即使需求不明确也能做出符合业务场景的大模型;或者说你不差钱,训练一次不行就重新训练,那也可以。

因此,什么时候开始训练和微调模型?

最好的时机就是,在你的业务成型之后,有一些问题确实需要解决或者说需要节约成本;这时,你再去考虑训练和微调一个模型,甚至是找模型服务商帮你重新设计一个模型都可以。

图片

一句话就是,在你的需求明确之后,也就是你知道要训练出一个什么样的模型,并且你有足够的技术和资金支持,那么你就可以训练和微调自己的模型了。

说到底还是那句话,技术是为业务服务的,技术的发展是基于业务场景的落地,而不是从技术去推动业务场景的发展,虽然技术的发展也有可能颠覆现有的业务场景,但那是技术与业务场景的深度融合的结果。

总之,不要一开始就想着训练和微调属于自己的模型,要从问题出发,而不是从结果出发。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/143517.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

2024年03月中国电子学会青少年软件编程(图形化)等级考试试卷(一级)答案 + 解析

青少年软件编程(图形化)等级考试试卷(一级) 分数:100 题数:37 一、单选题(共25题,共50分) 单击下列哪个按钮,能够让舞台变为“全屏模式”?( ) A…

2.pytest框架实现一些前后置(固件,夹具)的处理,断言和allure-pytest插件生成allure测试报告

一、setup/teardowm,setup_class/teardown_class(所有) 为什么需要这些功能? 比如:web自动化执行用例之前,请问需要打开浏览器吗?用例执行后需要关闭浏览器吗? 前置后置 二、使用pytest.fixture…

500元以内蓝牙耳机哪款好?四大百元精品机型推荐

一副优质的蓝牙耳机总能为我们带来更加便捷和愉悦的体验,然而,面对市场上琳琅满目的选择,500元以内蓝牙耳机哪款好?如何在有限的预算内找到最适合自己的蓝牙耳机呢?今天我将为大家带来四大百元精品机型推荐&#xff0c…

配网缺陷检测无人机航拍图像数据集(不规范绑扎,螺栓销钉缺失)数据集总共3000张左右,标注为voc格式

配网缺陷检测无人机航拍图像数据集,(不规范绑扎,螺栓销钉缺失)数据集总共3000张左右,标注为voc格式。 数据集名称 配网缺陷检测无人机航拍图像数据集(Distribution Network Defect Detection UAV Aerial I…

Find My太阳镜|苹果Find My技术与太阳镜结合,智能防丢,全球定位

太阳镜是一种常见的眼镜,通常用于防止强光刺激和保护眼睛免受紫外线伤害。太阳镜可以减少光线对眼睛的刺激,缓解眼部疲劳,提高视觉舒适度。佩戴太阳镜可以有效地减少紫外线对眼睛的刺激,降低眼疾的发生率。 在智能化加持下&…

CLion/Git版本控制

文章目录 文章介绍准备工具操作首次提交修改代码提交第二版 文章介绍 记录用clion和git做代码的版本控制 准备工具 CLion2024.2.0.1 git 操作 首次提交 该文件夹的打开方式选择clion 全部提交 成功提交后查看分支 修改代码提交第二版

微信小程序03-页面交互

零、文章目录 微信小程序03-页面交互 1、案例:比较数字大小 (1)案例分析 需求:本案例将实现“比较数字大小”微信小程序,它的功能是当用户输入两个数字后,点击“比较”按钮可以自动比较这两个数字的大小…

图数据归一化

图数据归一化 文章目录 图数据归一化前言一、图结构归一化1.邻接矩阵归一化2.拉普拉斯矩阵归一化 二、图特征归一化1.输入特征归一化2.中间层特征归一化 前言 在图分析和图网络的研究领域中,图归一化扮演着至关重要的角色。它包括一系列技术和方法,旨在…

关于循环Socket创建超Linux文件句柄限制现象分析

项目场景: 在操作系统的世界中万物皆文件。之前拜读过一些作品:针对于socket的创建,Linux也相应创建文件(专业术语中也称文件句柄),于是,我想做一些关于极限的操作,看看这些极限操作…

RTR_Chapter_5 上

第五章 着色基础 在渲染三维物体的图像时,场景中的模型不仅仅需要有正确的几何形状,还应当具备想要的材质外观。根据应用程序的不同,这些外观具有非常广泛的范围,从真实感渲染(即物体外观几乎和真实世界中的一模一样&a…

指针和引用;内联函数和普通函数

1. 指针和引用 1.1 定义和性质区别 指针是一个变量,只不过这个变量存储的是一个地址,指向内存的一个存储单元;而引用跟原来的变量实质上是同一个东西,只不过是原变量的一个别名而已。可以有const指针,常量指针可以改…

社恐人群的社交新宠:实时人脸融合互动应用

目录 简介 实现思路 1. 引入所需库 2. 人脸检测器和特征点模型的初始化 3. 打开摄像头 4. 选择覆盖的图片 5. 获取图片的尺寸 6. FPS计算初始化 7. 主循环处理每一帧 8. 人脸检测和特征点识别 9. 处理每一张检测到的人脸 10. 调整图片大小并叠加到人脸上 11. FPS计…

PowerShell install 一键部署Oracle19c

Oracle19c前言 Oracle 19c 是甲骨文公司推出的一款企业级关系数据库管理系统,它带来了许多新的功能和改进,使得数据库管理更加高效、安全和可靠。以下是关于 Oracle 19c 的详细介绍: 主要新特性 多租户架构:支持多租户架构,允许多个独立的数据库实例在同一个物理服务器上…

JAVA开源项目 校园美食分享平台 计算机毕业设计

本文项目编号 T 033 ,文末自助获取源码 \color{red}{T033,文末自助获取源码} T033,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析 六、核心代码6.1 查…

【开源大模型生态8】这么多开源大模型

这张图片列出了多个开源的大模型,按照应用层、平台层、基础层和算力层进行了分类。下面我会为您逐一介绍这些模型及其特点: 应用层 AquilaCode: 一种用于自然语言处理的应用程序,可能是用于文本编码或解码的任务。SQLCoder: 可能是一种用于…

FLUX屠榜了小红书,平台这会也真假难辨

最近,小红书被一种新潮的AI绘图技术“屠榜”,这种技术就是FLUX。通过FLUX生成的虚拟美女照片,不仅成功“骗过”了平台审核,还让无数普通用户和商家惊讶。 越来越多人开始讨论这项技术的潜力,甚至一些并非技术玩家的用…

《SmartX ELF 虚拟化核心功能集》发布,详解 80+ 功能特性和 6 例金融实践

《SmartX ELF 虚拟化核心功能集》电子书现已发布!本书详细介绍了 SmartX ELF 虚拟化及云平台核心功能,包含虚机服务、容器服务、网络服务、存储服务、运维管理、工具服务、数据保护等各个方面。 即刻下载电子书,了解如何利用基于 SmartX ELF …

【FPGA XDMA AXI Bridge 模式】PCIe:BARs 和 AXI:BARs 含义解析

一. XDMA IP核两种模式 Xilinx的 DMA/Bridge Subsystem for PCI Express IP核中,支持普通的XDMA模式,但是这种模式只允许主机端发起PCIe 读写请求,FPGA内部无法主动发起读写请求,也即FPGA无法主动读写HOST的内存。 而该IP核的另…

c++编程(26)——智能指针

欢迎来到博主的专栏:c编程 博主ID:代码小豪 文章目录 智能指针什么是智能指针? auto_ptrunique_ptrshare_ptrshared_ptr缺陷 weak_ptr 智能指针 什么是智能指针? 智能指针是c中关于动态内存管理的重要一环,在智能指针…

力扣718-最长重复子数组(Java详细题解)

题目链接:718. 最长重复子数组 - 力扣(LeetCode) 前情提要: 因为本人最近都来刷dp类的题目所以该题就默认用dp方法来做。 dp五部曲。 1.确定dp数组和i下标的含义。 2.确定递推公式。 3.dp初始化。 4.确定dp的遍历顺序。 5…