企业必备:搭建大模型应用平台实操教程

最近AI智能体很火,AI智能体平台化产品肯定属于大公司的。但在一些场景下,尤其是对业务数据要求很高的公司,那就只能用私有大模型。不一定完全是为了对外提供服务,对内改造工作流也是需要的。所以

  1. 我感觉未来大部分企业都会搞一个自己的大模型。大模型 + RAG的方案会非常成熟。
  2. 很多企业都会通过AI agent的智能体来改造工作流,很多工作的效率会因此而大大提效。

这类开源的大模型应用平台有很多,例如dify,fastgpt,langchain等。这里我以dify为例。

一、下载开源模型管理应用:ollama

地址:https://ollama.com/ 这是一个专门管理开源大模型的工具,通过这个工具我们可以安装到市面上大多数开源大模型。同时,它还对大模型做了精简,让我们在使用时,对本地电脑的显存要求更小。

直接点击Download下载。下载后运行应用,直接下一步安装即可。备注:该工具默认安装在C盘,所以模型文件默认也是安装在C盘。

如果你是windows系统,想把模型文件放到其他盘,需要在环境变量里创建一个OLLAMA_MODELS,它的值就是填你想存放模型的路径。例如 D://ollama

下载完毕后,在终端:执行ollama run 开源大模型名称。这里大模型的名字,需要是全名。ollama支持的模型都在这里:https://ollama.com/library 可以根据自己的电脑配置来选择模型,目前谷歌新出的2B小模型,在某些能力上据说也达到了GPT3.5的水平,如果要下载gemma2B,你需要执行这个命令。ollama run gemma2:2b 一般来说,8G显存能勉强跑7B。24G显存能跑14B。

等待模型下载后,就可以在终端运行了。但是终端操作毕竟还有点麻烦。所以一般我们会部署一个网页来进行访问。这个选择有很多,我们可以用🏡 Home | Open WebUI 也可以用dify等支持调用ollama模型的各种agent的平台。ollama的常见命令如下:

ollama list 查看所有已安装的本地大模型。ollama pull 模型名称,更新模型。ollama rm 模型名称,删除模型。......

二、安装docker容器

docker是一个开源的应用引擎,它能够很好的管理我们安装的一些应用。避免多个应用之间环境冲突。

安装地址:https://www.docker.com/

直接安装之后,下一步即可。安装完之后,在终端输入:docker -v可查询是否安装成功。

使用docker有两个很大的好处:

  1. 减少环境配置的麻烦。
  2. 更好的应用程序隔离和资源管理。

缺点是,docker被墙之后,需要梯子才能下载。或者自行通过镜像解决。

三、安装开源项目dify

打开dify开源地址:https://github.com/langgenius/dify

只要4个命令:

git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d

这里安装可能会慢一点。安装完之后,可以在docker里看到所有程序都运行了。

dify运行后,我们可以使用第三方key来使用大模型,也可以添加本地大模型。包括我们刚刚配置的ollama下载的模型。

但是因为dify是在docker里安装的,属于在容器里,想要访问docker外面的程序,需要做一些配置。

配置地址参考这个网址,windows、mac、linux都有点不一样。https://docs.dify.ai/guides/model-configuration/ollama

像我的Mac,配置时候,调用地址用改成这个即可:http://host.docker.internal:11434, 所有配置如下图:

保存后,刷新一下网页。然后我们创建一个ChatBOT

我们先从最简单的聊天助手开始。比如售前、售后客服。

根据自己的需求,填入提示词、知识库等内容。最后选择自己的配置好的模型。点发布后就能对外使用了。

四、部署智能客服到微信

打开这个开源项目:https://github.com/hanfangyuan4396/dify-on-wechat 目前已经支持,企业微信和个人微信。

git clone https://github.com/hanfangyuan4396/dify-on-wechat

把代码下载到本地,

拷贝下来后,在docker文件夹下,找到docker-compose.yml文件。按照我下面框住的地方进行修改。

DIFY_API_BASE 本地部署,就按我截图写。API秘钥都按我下图路径获取。

保存后,直接运行docker命令即可。

cmdcd dify-on-wechat/docker       # 进入docker目录
docker compose up -d           # 启动docker容器
docker logs -f dify-on-wechat  # 查看二维码并登录

运行成功后,在终端和docker容器里都会有一个微信二维码出来让你登录,用微信小号扫码登录后就能体验了。

今天分享的内容,对没有开发基础的同学会有点难。但其实很多开源项目难度也就这样。搞定一个项目,就搞定了大多数。祝大家都能顺利完成吧!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1555334.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

普渡PUDU MT1:AI赋能,破解大面积场景清洁新挑战

普渡AI智能扫地机器人PUDU MT1:破解大面积场景清洁难题的新利器 在仓储物流、工业车间、交通枢纽、大型商场等大面积场景中,清洁难题一直是管理者们头疼的问题。这些区域面积广阔,清洁任务繁重,传统清洁方式难以胜任。然而,普渡机器人最新推出的AI智能扫地机器人PUDU MT1…

什么是 HTTP Get + Preflight 请求

当在 Chrome 开发者工具的 Network 面板中看到 GET Preflight 的 HTTP 请求方法时,意味着该请求涉及跨域资源共享 (CORS),并且该请求被预检了。理解这种请求的背景,主要在于 CORS 的工作机制和现代浏览器对安全性的管理。 下面是在 Chrome …

ConcurrentHashMap在JDK1.7和1.8的区别,详解

目录 1.了解HashMap底层插入原理 2.ConcurrentHashMap 是什么? HashTable的实现 3.ConcurrentHashMap 1.7和1.8的区别 4、JDK1.7 中的ConcurrentHashMap实现原理 6、JDK1.8中的ConcurrentHashMap 7.链表转红黑树条件 1.8 put方法 8.并发扩容 9.总结 首先呢…

Origin正态分布检验

在spass中用Shapiro-Wilk检验--正态分布检测 Shapiro-Wilk检验--正态分布检测_spss shapiro-wilk检验-CSDN博客

数据服务-实时同步(sersync)

1. 概述 1.之前我们通过rsync定时任务实现定时备份/同步 2. 对于NFS我们需要进行实时同步 2. Sersync原理 3. 上手指南 环境主机web0110.0.0.7(nfs客户端)nfs0110.0.0.31(rsync客户端) (nfs服务端)backup10.0.0.41(rsync服务端) 3.1 rsync服务端准备 参考: 数据服务-备份服务…

好用便宜的头戴式耳机哪款好?强推四款高分爆单耳机精品!

音质,是耳机的灵魂。头戴式降噪耳机,以其卓越的音质表现,为您演绎音乐的真谛。无论是细腻的情感表达,还是震撼的音效体验,它都能让您感受到音乐的魅力所在。那好用便宜的头戴式耳机哪款好?,这里…

为什么芯片有多个不同的供电电压?

一、为什么芯片有多个不同的供电电压? 优化性能与功耗:芯片的核心部分(Core)和输入输出部分(IO)可能采用不同的电压。核心电压通常较低,以减少功耗和发热,提高能效;而IO电…

Linux驱动开发常用调试方法汇总

引言:在 Linux 驱动开发中,调试是一个至关重要的环节。开发者需要了解多种调试方法,以便能够快速定位和解决问题。 1.利用printk 描述: printk 是 Linux 内核中的一个调试输出函数,类似于用户空间中的 printf。它用于…

CSID-GAN:基于生成对抗网络的定制风格室内平面设计框架论文阅读

CSID-GAN: A Customized Style Interior Floor Plan Design Framework Based on Generative Adversarial Network 摘要前言II. CSID-GAN METHODA. Overall FrameworkB. Algorithm and Loss Function III. DATASETS AND EVALUATION METRICSA. DatasetsB. Evaluation Metrics IV.…

SAP MM学习笔记 - 豆知识10 - OMSY 初期化会计期间,ABAP调用MMPV/MMRV来批量更新会计期间(TODO)

之前用MMRV,MMPV来一次一个月来修改会计期间。 如果是老的测试机,可能是10几年前的,一次1个月,更新到当前期间,搞个100多次,手都抖。 SAP MM学习笔记 - 错误 M7053 - Posting only possible in periods 2…

【web安全】——逻辑漏洞

1.逻辑漏洞 1.1. 简介 逻辑漏洞就是指攻击者利用业务/功能上的设计缺陷,获取敏感信息或破坏业务的完整性。一般出现在密码修改、越权访问、密码找回、交易支付金额等功能处。 逻辑漏洞的破坏方式并非是向程序添加破坏内容,而是利用逻辑处理不严密或代码问题或固有不足&#x…

Timeline: 时间线轮播多图

对全国2014-2023年各省市的人口,做出动态柱状图/时间线轮播多图,即每隔一定时间间隔,自动的切换2014、2015、....2023各省市的人口(即2014-2023年全国省市人口排名前12的情况) 1、模板 # -*- coding: gbk -*- from pyecharts import option…

智慧农业案例 (二)- 智能化灌溉系统

橙蜂智能公司致力于提供先进的人工智能和物联网解决方案,帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、领域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。 橙蜂智农的智慧农业产品涵盖了多方面的功能&…

使用Buildpacks构建Docker镜像

## 使用Buildpacks构建Docker镜像 ![](../assets/运维手册-Buildpacks-Buildpacks.io.png) ### Buildpacks简介 与Dockerfile相比,Buildpacks为构建应用程序提供了更高层次的抽象。具体来说,Buildpacks: * 提供一个平衡的控制,…

Elasticsearch学习笔记(五)Elastic stack安全配置二

一、手动配置http层SSL 通过前面的配置,我们为集群传输层手动配置了TLS,集群内部节点之间的通信使用手动配置的证书进行加密,但是集群与外部客户端的http层目前还是使用的自动配置,集群中HTTP的通信目前仍然使用自动生成的证书ht…

【EXCEL数据处理】000017 案例 Match和Index函数。

前言:哈喽,大家好,今天给大家分享一篇文章!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 【EXCEL数据处理】000016 案例 Match和Index函数。使用的软件&#xff…

2024/10/5 数据结构打卡

对两个长度为n的升序序列A和B的元素按由小到大的顺序依次访问,这里访问的 含义只是比较序列中两个元素的大小,并不实现两个序列的合并,因此空间复杂度为 O(1)。按照 上述规则访问到第n个元素时,这个元素即为两个序列A和B的中位数。…

C语言自定义类型联合和枚举(25)

文章目录 前言一、联合体联合体的声明联合体的特点联合体和结构体内存布局对比联合体的大小计算联合体的实际使用样例礼品兑换单判断当前机器是大端还是小端 二、枚举枚举的定义枚举类型的声明枚举类型的优点枚举类型的使用 总结 前言 关于自定义类型除了我们常用的结构体&…

DBMS-3.1 SQL(1)——SQL概述和DDL

本文章的素材与知识来自李国良老师和王珊老师。 SQL概述 1.定义 2.SQL语句分类 数据定义语言DDL(Data Definition Language) 一.表 1.创建表 (1)语法 中括号内的项为可选项。分号标志着一条SQL语句的结束。SQL语句不区分大小…

前端编程艺术(4)---JavaScript进阶(vue前置知识)

目录 1.变量和常量 2.模版字符串 3.对象 4.解构赋值 1.数组的解构 2.对象的解构 5.箭头函数 6.数组和对象的方法 7.扩展运算符 8.Web存储 9.Promise 10.AsyncAwait 11.模块化 1.变量和常量 JavaScript 中的变量和常量是用于存储数据的标识符。变量可以被重新赋值&am…