对想从事大模型领域的技术开发者的建议或看法

学习技术之前,我们首先要搞明白的是我们想要什么,想做什么,而不是稀里糊涂的去学习技术**”**

大模型技术作为目前比较火的技术之一,有很多技术人员想从事大模型方面的开发,但又不知道该怎么入手,应该学点什么。今天我们就根据作者个人的感受来提供一些建议或者说看法。

对想从事大模型领域开发者的建议

首先,作为一个技术人员来说我们首先要明白一件事,大模型领域的开发主要分为两个部分;一个是基于大模型的应用开发,二是大模型技术本身的开发,这两者是完全不同的开发路线,也是完全不同的技术路线。

下面我们就从这两点展开来说一下其中的异同点和所需要的技术基础。

大模型应用开发

严格来说大模型应用开发和传统的业务开发没什么区别,技术栈也基本相同,都是通过调用接口的方式来实现功能;唯一不同的地方就是,传统的开发是调用的一些其它的功能接口,而大模型应用调用的是大模型开放的接口;而从技术的角度来说这个没什么区别,基本上都是通过http/s或socket等网络协议实现的接口调用。

所以传统的技术开发者转大模型应用开发,基本上没有什么门槛,哪怕你对大模型技术一窍不通,也可以直接转;只不过如果你有人工智能或机器学习的基础,会让你更容易理解大模型的运作机制,但从应用的角度来说这个并没有特别大的作用。

在这里插入图片描述

因此,对从事大模型应用开发的技术人员来说,需要的是和传统开发几乎一样的能力,那就是你的架构能力,代码开发能力,设计能力,中间件的使用和解决问题的能力。

总之一句话,大模型应用开发就是在功能模块中多增加了一个大模型功能的接口,其它的和传统的开发模式一模一样,没有任何区别。

哪怕是基于你们自己公司的大模型做上层应用的开发,你们公司也会选择组建两个团队,一个是开发业务功能,另一个开发和维护大模型的功能,而这也是第二种大模型领域开发人员需要做的事情,那就是大模型技术的开发。

对于大模型应用开发者来说,所需要的技术基本上还是属于之前的那一套,比如java , 微服务,接口开发,数据加解密,数据库,缓存,消息队列等。

大模型技术开发

如果说上一种基于大模型的应用开发是考虑怎么把大模型的功能应用的更好,那么大模型技术开发就是怎么把大模型做的更好。

为什么这么说?首先虽然我们觉得大模型的功能已经很强大,但从技术的角度来说大模型技术还处于初级阶段,其作用范围有限,其能力也有限,更重要的是其不稳定,直接应用到工作中会有很大的安全性问题。

因此,这也是为什么大模型技术目前主要的应用场景都是以一些边缘化的业务为主,还无法把大模型技术应用到企业的核心生产体系中;这也是之前马斯克在一次采访中说目前还没有把人工智能技术应用到自动驾驶中,原因就在于此。

而对大模型技术开发者来说,需要的主要能力包括,编程语言主要以python为主,原因就在于python是大模型开发的主流语言;其次,包括大数据处理,算法,神经网络,自然语言处理,计算机视觉等。

在这里插入图片描述

因为大模型主要特点就是规模巨大,涉及到大量的算法和计算问题,而python 在大数据处理方面具有天然的优势;因为对于之前从事大数据开发的技术人员来说,转战大模型技术开发具有一定的技术优势,但也不是绝对的;毕竟数据处理只是大模型技术开发中的一个环节。

其次,大模型由于需要模仿人类大脑的神经网络模型,并且需要根据不同的场景完成不同的复杂任务,而这就需要很多强大的算法来完成;因此算法工程师是大模型技术中不可或缺的一环。

之后,由于大模型庞大的参数和神经网络体系;因此传统的系统架构很难满足大模型训练和运行的需求,因此分布式计算技术,比如并行计算就成了大模型运行的基础,所以分布式计算也是其不可或缺的一环。

最后就是,大模型技术与不同应用场景的结合部分;比如基于大模型的自然语言处理,就需要你对自然语言处理有一定的理解;而对于图像和视频的处理就需要你具备基本的计算机视觉技术的基础。

img

当然,大模型技术栈远不仅这一点,其中还涉及到很多其它的技术,比如说向量计算,大批量数据的存储与加载,基于链式结构等实现的逻辑推理能力等。

总之,对大部分开发者来说,大模型应用开发相对比较简单,当然竞争也更加激烈;其次就是大模型技术本身的开发,对技术要求相对较高;对于后者来说,单纯的计算机技术可能已经无法满足这种需求,更多需要的是数学,物理,生物等其它学科的佼佼者参与进来。就拿算法来说,在算法领域成就较高的人基本上都是数学出身的,而不是计算机出身的。

最后,每个人可以根据自己的喜好以及能力去选择适合自己的发展方向;而不是稀里糊涂的不知道自己在干什么。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/4521.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

433、315通信、ev1527、2262编码

目录 ASK介绍EV1527编码芯片介绍模块介绍无线发射芯片无线接收芯片解码程序发射电路原理图 ASK介绍 ASK是幅移键控,通过调幅将数据发送出去,所以发送与接收都是多位二进制数。 ASK如何区分0和1? 0:发送 433.92Mhz 无线波形&…

面向生成式 AI 的向量数据库:架构,性能与未来趋势

导读 向量数据库是高效处理和准确检索高维数据的基石,对于生成式 AI 技术而言至关重要。本文将分享向量数据库的架构设计和实现中的关键点。 主要分为五个方面: 向量数据库背景介绍 Milvus 整体架构设计 性能的关键-索引 面向 AI 持续进化 01 向量…

vulhub之zabbix

zabbix是一款服务器监控软件,其由server、agent、web等模块组成,其中web模块由PHP编写,用来显示数据库中的结果。能够监控各种网络参数以及服务器健康性和完整性。 zabbix的详细介绍: https://blog.csdn.net/wt334502157/article/details/117994107 zabbix latest.php S…

介绍一下如何生成随机数(c基础)

适合对象 c语言初学者 总结语言用色&#xff0c;个人强调用红色&#xff0c;注意为易错点&#xff0c;若有问题请告诉我谢谢。(建议通过目录观看)。一定要自己动手打代码。 rand函数 是生成随机数的函数&#xff0c;但实则是伪随机数。(即是同一个值) 格式 #include<st…

java案例6-1库存管理系统

【案例介绍】 1.任务描述 像商城和超市这样的地方&#xff0c;都需要有自己的库房&#xff0c;并且库房商品的库存变化有专人记录&#xff0c;这样才能保证商城和超市正常运转。 本例要求编写一个程序&#xff0c;模拟库存管理系统。该系统主要包括系统首页、商品入库、商品显示…

【嵌入式Linux】Linux设备树详解

设备树是是Linux中一种用于描述硬件配置的数据结构&#xff0c;它在系统启动时提供给内核&#xff0c;以便内核能够识别和配置硬件资源。设备树在嵌入式Linux系统中尤其重要&#xff0c;因为这些系统通常不具备标准的硬件配置&#xff0c;需要根据实际的硬件配置来动态配置内核…

逻辑卷建立

逻辑卷 lvm逻辑卷即为&#xff1a;logical volume manager逻辑管理卷&#xff0c;是linux系统下管理硬盘分区的一种机制&#xff0c;lvm适合于管理大型存储文件&#xff0c;用户可以动态的对磁盘进行扩容 作用 lvm&#xff1a;linux系统的一个重要的存储技术 不同的硬盘的不…

【持续更新】【NLP项目】【自然语言处理】智能聊天机器人——“有问必答”【Chatbot】第2章、《模式一:问候模式》

智能聊天机器人——“有问必答” 【注】该项目已开源&#xff0c;开源地址为&#xff1a;链接&#xff0c;代码更新可能不及时。 第2章、《模式一&#xff1a;问候模式》 主窗体的布局如下图所示&#xff1a; 共九种功能模式&#xff0c;最下方为关闭窗口按钮。 点击问候模…

时序预测 | Matlab基于TSA-LSTM-Attention被囊群优化算法优化长短期记忆网络融合注意力机制多变量多步时间序列预测

时序预测 | Matlab基于TSA-LSTM-Attention多变量多步预测 目录 时序预测 | Matlab基于TSA-LSTM-Attention多变量多步预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 时序预测 | Matlab基于TSA-LSTM-Attention被囊群优化算法优化长短期记忆网络融合注意力机制多变量多…

attributeerror: ‘FreeTypeFont‘ object has no attribute ‘getsize‘问题

我在训练yolov9的时候报错&#xff1a;attributeerror: ‘FreeTypeFont‘ object has no attribute ‘getsize‘。看过很多博客分析&#xff0c;都是说FreeTypeFont 字体的原因&#xff0c;其实真实问题出现yolo版本安装的Pillow库更新后&#xff0c;getsize&#xff08;&#…

三维天地:数字技术推动汽车产业实验室管理变革创新

近日,2024汽车技术与装备发展论坛在苏州成功召开。论坛以“共筑汽车产业新质生产力”为主题,聚焦新技术、新装备、新生态展开深入研讨,探索装备制造与汽车产业的融合发展路径。北京三维天地科技股份有限公司受邀参会。 在同期举办的检测认证高质量发展论坛上,三维天地咨询总监宫…

产品人必读书籍丨这本书告诉了我在AI时代如何成为一名顶级PM!!

《人工智能产品经理》——AI时代的PM修炼手册&#xff0c;这是一本不太工具的工具书。 很多人不了解产品经理需要具备的能力和素质。那么产品经理人工智能呢&#xff1f;这就更懵了&#xff0c;全是新词汇组成的新职业&#xff0c;到底怎样才算合格的人工智能产品经理&#x…

免费文件夹加密工具

1、去掉了miniExcel引用包&#xff0c;删除掉了excel配置文件 2、增加了密码登录功能&#xff0c;可以修改密码 3、使用sqlite3数据库来保存文件夹列表和用户密码&#xff0c;用户密码采用md5加盐 4、使用了 antdui来美化下界面 5、未解锁文件平不能被移除 其他还是保持老样…

第四届计算机图形学、人工智能与数据处理国际学术会议

在线投稿&#xff1a;学术会议-学术交流征稿-学术会议在线-艾思科蓝 第四届计算机图形学、人工智能与数据处理国际学术会议&#xff08;ICCAID 2024&#xff09;将于 2024年12月13日-15日在中国南昌举行。本次会议主要围绕“计算机图形学、人工智能与数据处理”的最新研究…

辐射发射测试新境界:深入解析TS-RadiMation套件多种操作方法(一)

TS-RadiMation套件作为辐射发射测试的得力助手&#xff0c;支持多种测试方法。 多频段手动模式电波暗室固定高度测试GTEM小室测试手动模式&#xff08;单频段&#xff09; 本文将详细介绍如何操作手动模式及手动模式&#xff08;单频段&#xff09;这两种模式&#xff0c;助您…

基于matlab的基于Tent混沌映射改进的麻雀搜索算法SSA优化BP神经网络预测

基于Tent混沌映射改进的麻雀搜索算法SSA优化BP神经网络预测 1 普通BP网络 代码如有需要&#xff0c;联系 596520206 %构建网络netnewff(inputn,outputn,hiddennum);% 网络参数net.trainParam.epochs100; % 训练次数net.trainParam.lr0.01; % 学习速…

[前端][基础]JavaScript

1&#xff0c;JavaScript简介 JavaScript 是一门跨平台、面向对象的脚本语言&#xff0c;而Java语言也是跨平台的、面向对象的语言&#xff0c;只不过Java是编译语言&#xff0c;是需要编译成字节码文件才能运行的&#xff1b;JavaScript是脚本语言&#xff0c;不需要编译&…

10:00面试,10:08就出来了,问的问题有点变态。。。

从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天必不可少的&#xff0c;看在钱给的比较多的份上&#xff0c;就不太计较了。没想到8月一纸通知&#xff0c;所有人不准加班&#xff0c;加班费不仅没有了&#xff0c;薪资还要降40%…

Java三大特性之一——多态(详细版)

文章目录 一、什么是多态二、重写2.1、重写的规则 三、多态的实现条件四、向上转型五、向下转型六、动态绑定七、使用多态的优缺点7.1、优点7.2、缺点 八、避免在构造方法中调用重写的方法 一、什么是多态 Java多态是面向对象编程的一个重要特性&#xff0c;它允许不同的对象对…

连锁餐饮企业-凡塔斯,用千里聆RPA搭建用户评价管理系统,提升门店服务满意度

凡塔斯是大型连锁餐饮企业昊澜餐饮集团旗下餐饮品牌&#xff0c;是牛排自助餐头部品牌&#xff0c;旗下拥有凡塔斯、百分好、食物链KING自助烤肉及餐饮人才商学院等多个行业知名品牌。 创立至今&#xff0c;集团管理门店已发展到福建、广东、江西、浙江等十多个省市&#xff0c…