语言模型测试系列【8】

语言模型

  1. 文心一言
  2. 星火认知大模型
  3. 通义千问
  4. 豆包
  5. 360智脑
  6. 百川大模型
  7. 腾讯混元助手
  8. Kimi Chat
  9. 商量
  10. C知道

这次的测试比较有针对性,是在使用钉钉新推出的AI助理功能之后发现的问题,即创建AI助理绑定自己钉钉的知识库进行问答,其中对于表结构的文档学习尚有不足,回答的错误率较高,所以这里就直接拿各大预言模型进行测试对比。

首先,准备Excel文档的数据。
在这里插入图片描述
然后,进行提问,提问的数量不多,仅针对上图中标有底色的部分进行提问。同时对上面所列的语言模型进行筛选,仅有通义千问豆包Kimi Chat支持Excel文档的学习,那下面的对比也只对这三个语言模型进行测试,其他模型先靠边站吧。

提问及回答

问题1:请学习文档,并告诉我李航宇是哪个医疗单位的法定负责人
问题2:那 刘金刚 呢?
问题3:刘继东 是哪个单位的法定代表人
问题4:沈阳兴齐眼科有限公司的具体地址在哪里?

通义千问

问题1

在这里插入图片描述

问题2

在这里插入图片描述

问题3

在这里插入图片描述

问题4

在这里插入图片描述

豆包

问题1

在这里插入图片描述

问题2

在这里插入图片描述

问题3

在这里插入图片描述

问题4

在这里插入图片描述

Kimi Chat

问题1

在这里插入图片描述

问题2

在这里插入图片描述

问题3

在这里插入图片描述

问题4

在这里插入图片描述

对比分析

从支持Excel文档的阅读学习能力来看,通义千问豆包Kimi Chat都支持,这方面比其他模型还是有优势的,特别是在垂直领域,很多专门的行业都有自己的一套数据,而且大部分数据都储存在表的文件内。不管是阅读还是平台调用都比较方便准确的提取到感兴趣的数据信息,支持表结构的阅读学习,也将是语言模型努力的方向。

模型名称回答内容
文心一言3.5不支持
讯飞星火认知大模型不支持
通义千问四个问题错了仨,勉强对了一个
豆包准确
360智脑不支持
百川大模型不支持
腾讯混元助手不支持
Kimi Chat准确
商量不支持
C知道不支持

总结

豆包Kimi Chat对Excel文档的内容学习和理解比较准确,本次赢得测试。
通义千问在支持Excel学习后,准确率还是有所欠缺。
本次测试主要是在语言模型支持的领域进行对比测试,相信大部分通用功能,在网络环境下,基本上都能准确实现,这方面也增加了测试难度,很难区分出优劣。所以,今后将在各大语言模型迭代新功能上测试。

小注:
语言模型的支持将越来越完善,决赛圈越来越近了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1424984.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【echart】实现echart图的富文本样式

贴源码 let xData [山西,山东,内蒙,甘肃];let averData [2, 3,1, 3];var eicon path://M480.55,252.18L318.88,498.04c-15.95,24.25,1.08,56.57,30.11,57.12l147,2.79L448.5,696.92c-14.74,43.15,39.88,75.83,70.93,42.44l216.73-233.04c21.93-23.58,5.21-61.98-27-61.98H56…

【面试干货】 两个有序数组的合并排序

【面试干货】 两个有序数组的合并排序 1、实现思想2、代码实现 💖The Begin💖点点关注,收藏不迷路💖 1、实现思想 使用两个指针分别指向两个数组的起始位置,然后逐个比较两个指针所指向的元素,将较小的元素…

【IoTDB 线上小课 03】时序数据库 VS 实时数据库,区别是?

好评满满的【IoTDB 视频小课】系列又来了~ 关于 IoTDB,关于物联网,关于时序数据库,关于开源... 你想学习的重点,给我们 3-5 分钟,清晰地讲给你听: 时序数据库 VS 实时数据库 工业数字化转型愈发受到重视的当…

OpenAI 发布 GPT-4o,再次巩固行业地位!

5 月 14 日凌晨 1 点(太平洋时间上午 10 点),OpenAI 发布了其最新的 GPT-4o,再次巩固了其在人工智能领域的领导地位。这次发布不仅仅是一个产品的推出,更是向世界宣告 AI 技术已迈入一个全新的纪元。OpenAI 的 CEO 萨姆…

本机搭建RabbitMQ

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 一、下载安装包,搭建过程 二、重要概念介绍 三、创建用户 方式一:命令行 方式二:管理后台 3.1 创建用户 3.2 分配权限 3.3 提…

小程序|锁定查询功能如何使用?

学生或家长想要实现自己查询完成后,任何人都无法再次查询,老师应该如何设置?易查分的【锁定查询功能】就可实现,下面教大家如何使用吧。 📌使用教程 🔒锁定查询功能介绍 ✅学生或家长自主锁定:开…

【SQL】SQL常见面试题总结(1)

目录 1、检索数据1.1、从 Customers 表中检索所有的 ID1.2、检索并列出已订购产品的清单1.2、检索所有列 2、排序检索数据2.1、检索顾客名称并且排序2.2、对顾客 ID 和日期排序2.3、按照数量和价格排序2.4、检查 SQL 语句 3、过滤数据3.1、返回固定价格的产品3.2、返回产品并且…

高效协同,智慧绘制:革新型流程图工具全解析

流程图,作为一种直观展示工作过程和系统运作的工具,在现代办公和项目管理中发挥着不可或缺的作用。 其优势在于能够清晰、直观地呈现复杂的过程和关系,帮助人们快速理解并掌握关键信息。同时,流程图也广泛应用于各种场景&#xf…

STM32HAL库-中断篇

中断 中断简介 中断是一种事件处理机制,可以暂停主程序的运行,转而处理特定事件程序。 中断的作用和意义: 实时控制 在确定事件内对响应事件做出相应 故障处理 检测到故障需要第一时间处理 数据传输 如串口通信,不确定数…

独家|暴雨推出基于国产X86芯片的四路服务器

伴随着智慧计算时代的到来和企业数字化转型的深入,人工智能、大数据、虚拟化等创新技术在应用普及的过程中,也在不断地细分和深化,使得企业的业务系统日趋复杂,数据量、数据类型更加庞大,对计算平台的性能要求“水涨船…

CET6级(笔试备考)

CET6笔试 做题技巧 备考注意 感觉考前一个月还是要多刷几套真题啊,刷个10套吧。 参考链接:https://blog.csdn.net/m0_57656758/article/details/130707582

Spring实现数据库读写分离(MySQL实现主从复制)

目录 1、背景 2、方案 2.1 应用层解决: 2.2 中间件解决 3、使用Spring基于应用层实现 3.1 原理 3.2 DynamicDataSource 3.3 DynamicDataSourceHolder 3.4 DataSourceAspect 3.5 配置2个数据源 3.5.1 jdbc.properties 3.5.2 定义连接池 3.5.2 定义DataSource 3.6…

Cadence 16.6 PCB Edito如何将鼠标中键反向拉拽改为正向拖拽

Cadence 16.6 PCB Editor如何将鼠标中键反向拉拽改为正向拖拽 Cadence 16.6 PCB Editor默认鼠标中键是反向的拉拽,让我很不适应,在网上找的可行的方法,在这里总结出来,希望能帮到其他工程师。 按照以下步骤进行操作: …

数字化智能:Web3时代的物联网创新之路

引言 随着科技的不断发展,物联网(IoT)技术正在迅速普及和应用。而随着Web3时代的到来,物联网将迎来新的发展机遇和挑战。本文将探讨Web3时代的物联网创新之路,深入分析其核心技术、应用场景以及未来发展趋势。 Web3时…

4.线性代数

深度学习作为一门前沿的、应用广泛的学科,对于数学基础的要求非常高。 线性代数 线性代数在深度学习中扮演着至关重要的角色。它不仅是描述和理解数据的基础工具,也是构建和训练神经网络的核心组件。例如,在深度学习中,我们经常…

RAW转换和图像编辑工具:Capture One 23 Pro (win/mac)中文专业版

Capture One 23是一款功能强大的桌面版照片编辑软件,由丹麦PHASE ONE飞思数码公司开发。 以下是该软件的一些主要特点: 强大的RAW处理功能:Capture One 23支持多种品牌的相机和镜头,提供了丰富的RAW处理工具,包括曝光、…

【Python】图像批量合成视频,并以文件夹名称命名合成的视频

一个文件夹中有多个子文件夹,子文件夹中有多张图像。如何把批量把子文件夹中的图像合成视频,视频名称是子文件夹的名称,生成的视频保存到指定文件夹,效果记录。 代码 import os import cv2def create_video_from_images(image_f…

linux中远程服务器上传输文件的10个sftp命令示例

目录 1. 如何连接到 SFTP 2. 帮助 3.检查当前工作目录 4. 使用 sftp 列出文件 远程 本地 5. 使用 sftp 上传文件 6. 使用 sftp 上传多个文件 7. 使用 sftp 下载文件 8. 在 sftp 中切换目录 远程 本地 9. 使用 sftp 创建目录 10. 使用 sftp 删除目录 11. 退出 sf…

一次tomcat闪退处理

双击tomcat目录下bin目录中startup.bat 在我的电脑上是一闪而过,不能正常地启动tomcat软件 以记事本打开startup.bat文件,在文件的结尾处加上pause 然后再双击该bat执行,此时窗口就不会关闭,并会将错误信息打印在提示框中 可能是…

skimage图像处理(五)

多数量图像处理(批量化处理) 多数量图片内读取指定图片 首先导入skimage.io模块并将其简称为io,导入skimage库中的data_dir模块,用于获取示例图像的目录路径 import skimage.io as io from skimage import data_dir 构建…