“小浣熊家族AI办公助手”产品体验 — “人人都是数据分析师”

请添加图片描述


一、引言:

大家平时应该在工作中常常使用到Excel来做数据统计,比如临近过年时,公司一般会开各种复盘、年终、检讨、明年规划大会,势必需要准备一大堆的量化数据报表,用于会议上的数据汇报、分析工作,试想一下,在0到1的创业公司,在没有技术团队的情况下,如何进行数据报表相关的分析呢?

在这里插入图片描述

如果在没有了解“小浣熊AI办公助手”前提下,按照以前的惯性思路,肯定也是想着自己组建一个技术团队。现在,不妨试试新的指标平台。

通过对“小浣熊AI一站式办公助手”产品进行数据分析、趋势预测、数据可视化等功能,帮助办公任务变得更加轻松和高效,该产品也是一个低成本、高效率、轻量的、开箱即用的一站式AI相关的办公助手。

在这里插入图片描述


二、小浣熊家族介绍:

在这里插入图片描述

“小浣熊家族”是基于商汤大语言模型打造的 AI Native 生产力系列工具,覆盖软件开发、数据分析、编程教育等多个场景,旨在通过先进的人工智能技术优化和提升工作效率。家族现已推出代码小浣熊和办公小浣熊两位成员,为十余万用户提供数亿次智能辅助服务。

在这里插入图片描述

1. 代码小浣熊:

“代码小浣熊”是基于商汤大语言模型的软件智能研发助手,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求。代码小浣熊支持 Python、Java、JavaScript、C++、Go、SQL 等90+主流编程语言和 VS Code、IntelliJ IDEA 等主流 IDE。在实际应用中,代码小浣熊可帮助开发者提升编程效率超50%。

2. 办公小浣熊:

“办公小浣熊“是基于商汤大语言模型的大模型原生数据分析产品,可通过用户的自然语言输入,自动将数据转化为有意义的分析和可视化结果。办公小浣熊支持复杂表格、多表格、多文件的理解,可以完成数据清洗、数据运算、比较分析、趋势分析,预测性分析、可视化等常见数据分析任务,赋能财务分析、商业分析、销售预测、市场分析、宏观分析等多个应用场景。

在这里插入图片描述

现在办公小浣熊全面开放公测,公测期间免费提供给个人用户使用,接下来快来跟我一起来体验一下,开启AI智能化办公。


三、“办公小浣熊”体验过程:

首先我们通过进入AI“办公小浣熊”官方地址,选择中间C位的“办公小浣熊”图标,这里提供了2种的登录与注册方式:

  • 验证码登录(推荐个人使用)
  • 密码登录(推荐团队使用),后面会讲到为什么推荐团队使用。

1. 数据源说明:

公司是一家理赔相关的医疗服务平台,公司提供全面的保险服务,‌包括但不限于报案受理、‌保险咨询、‌投诉处理以及理赔服务,‌以下是赔付的相关数据,部分数据进行打码处理。

在这里插入图片描述

将“赔付数据”文件通过本地进行上传,这里支持很多类型的数据文件,本文使用比较通用的类型xlsx。

在这里插入图片描述

  • 支持 .xlsx/.xls/.csv/.txt/json/word(beta)/pdf(beta)/ppt(beta)/sql(限免)/图片(限免) 等类型文件
  • 单次≤3个文件,单个文件≤20M,单个会话≤10个文件/80M

2. 本地文件上传:查一下现在有多少人进行赔付?

在这里插入图片描述

  • 聊天式问答交互:通过输入“帮我查询一下有多少个产品”,可以看到不到10秒钟就可以帮我计算出来,十分适合不会Excel函数、不会写SQL的小白。
  • 可以看到小浣熊回答的是python代码的解析过程,表示有一些数据的加工是使用python的逻辑来处理。
  • 罗列的python代码,可以针对专业人士(写代码、数据分析),可以做到既要知其然,还要知其所以然,主要是AI在数据分析过程中的一些思路、方法以及逻辑,很有参考价值。
  • AI推荐的智能询问:“选择题永远比填空题好做”,充分的在用户的角度考虑问题,尽可能的减少用户的操作次数,智能化就体现在这些方面。
  • 让AI提前预判用户可能提出的问题,再让用户去做选择,引导用户完成使用,这在很大程度上提升了工作效率和与用户体验。
  • AI会根据已经提问的情况,进一步深入地挖掘可能感兴趣的提问话题,就像路标一样一步一步指引你解决问题。

这里为什么使用python做为AI分析的语言?因为Python数据分析是一个广泛的领域,它涉及到使用Python编程语言来处理、分析、可视化和解释数据,Python因其易用性、强大的库支持和社区支持而在数据分析领域广受欢迎。

在这里插入图片描述


3. 导入数据库文件功能:

这个功能貌似是官方给的Demo示例,而且数据库的链接信息也不能修改,里面有3个Excel文档,分别为用户基础信息表(users)、产品信息表(products)、订单信息表(orders),可以用于做一些测试演练,但是数据量也不太多。

在这里插入图片描述

三张SQL表的数据库ER模型,可以看到Users和Products都是主表,Orders表是一个中间关联表,即通过user_id与Users表进行关联,又通过product_id与Products表进行关联,所以这3张表可以产生一个笛卡尔积的数据结果。

在这里插入图片描述

帮我分析一下各个地区的销量总价是多少,由大到小进行排列。

可以看到如果是SQL文件的话,一般是写SQL语句来解决,而且SQL写的比我也好,但是如果我自己写的话,就是只查2张表就可以了,不用再JOIN Products表。

# Query to get total sales value by region and order by total sales value in descending order
query = """
SELECT Users.registration_location AS region, SUM(Orders.quantity * Products.price) AS total_sales_value
FROM Users
JOIN Orders ON Users.user_id = Orders.user_id
JOIN Products ON Orders.product_id = Products.product_id
GROUP BY Users.registration_location
ORDER BY total_sales_value DESC;
"""sales_value_by_location = cursor.execute(query).fetchall()
sales_value_by_location

在这里插入图片描述

为什么要选择SQLite3数据库?SQLite3提供了一个实验性的 Web 版本,‌称为 SQLite 3 Fiddle。‌这个版本允许开发者直接在 Web 浏览器中运行 SQLite3,‌无需下载或安装任何额外的软件。‌用户可以在浏览器的沙箱环境中运行最新的 SQLite 3.39.0 Beta 版本。‌这个 Web 版本是通过 WASM(‌WebAssembly)‌编译的最新 3.39.0 构建的副本,‌使得开发者能够在不离开浏览器的情况下进行 SQLite3 数据库的操作和管理。‌

在这里插入图片描述


4. 数据管理服务:

上文有一个伏笔,提到了使用手机密码进行登录可以进行团队管理,比如一些数据可以放到“数据管理”中进行管理,比如:

  • 基础数据表可以将一些比较基础的枚举数据定义在这里,比如证件类型,大概率长期不会发生变化,比如性别男女,基本上定义后不会修改。
  • 业务数据表可以将一些部分的基本业务数据表上传进行保存。
  • 因为没有自动更新的功能,所以,最好业务数据表推荐使用日期来区分。

在这里插入图片描述

进行团队管理Excel数据的关键,在于实现多人可以共享一些数据源,包括数据表格的定时更新,但是好像无法进行数据表格的权限的控制,‌可以大大提高团队管理Excel数据的效率和准确性,‌助力团队高效运营。‌

在这里插入图片描述

通过简单的从0到1对“AI办公小浣熊”的体验,可以发现“AI办公小浣熊”十分的简单,不需要学习什么Excel函数,也不需要学习IT相关的技术,可以进行低门槛的使用,只需要上传数据源文件,通过交互式聊天问答,就可以利用商汤自研的大模型算法将用户的自然语言输入,自动将数据转化为有意义的分析和可视化结果。

在这里插入图片描述


四、高级功能最佳实践:

不知道大家有没有遇到过,由于公司的前期阶段,经常需要进行业务的数据统计,特别是公司高层的一些会议,经常会有助理、主管找我说,帮我查一下某某的数据,这时候,只能打开SQL查询工具,来进行查询,但是这样效率比较慢,可以利用“AI办公小浣熊”来帮助我们提高效率。

1. 提问:帮我分析一下每年每个季度案件状态是已结案的直付总金额是多少?

接下来,可以让“AI办公小浣熊”帮我处理一下想要的领导需要的数据,首先可以看到“AI办公小浣熊”利用商汤AI大模型可以分析一下逻辑流程图,需要做哪些事情,可以看到逻辑思路上其实跟我们程序员写代码差不多,读取了存放在服务器的本地目录文件,然后分析需要的字段,再进行python代码逻辑的运算,可以得出一个table的表格数据。

在这里插入图片描述

可以看到通过“AI办公小浣熊”,可以不到一分钟就能给出量化的分析结果,比IT开发人员处理的速度快了不至10倍,这里可以看到还提示了2022年第2季度的总金额是0,复盘了一下excel的数据表,确实第二季度(4-6月)是没有数据的。

思考:但是领导一般不会去看这些表格,一般来说可以做一些可视化的报表比较合适的。

在这里插入图片描述

可以让“AI办公小浣熊”直接帮我们创建一个季度比较的柱状图,可以更直接的表现数据,可以看到也是使用python的图表来进行画图,不过,通过对比,画图的时间比AI生成table表格的时间要稍微长一点,生成的图表颜色比较单调,可以让更改颜色的方案来重新生成图表,但是总是觉得差点意思。

在这里插入图片描述

让“AI办公小浣熊”帮助我们生成一个echarts图表的json数据,生成也比较快,在echarts在线的调试示例中,找到一个比较中意的图表,可以看到数据也不太适合,需要自己重新转化改造一下,就可以看到生成图表样式还是可以的,发给领导看的话,也可以比较美观,同时,也可以生成带有代码的echarts图表代码,非常的方便。


2. 提问:帮我分析一下每年每个季度案件状态是已结案的直付总金额是多少?

上面我们使用了“AI办公小浣熊”快速的得到了一个每个季度已结案的直付总金额柱状图,只是简单的一个纬度查询,并不能体现很大的优势,接下来,让“AI办公小浣熊”帮我们生成多纬度的数据比较堆叠柱状图,来看看效率会提高多少?

在这里插入图片描述

数据源中有一些字段是需要数据转换的,比如被保人性别F表示男,M表示女,因为上面数据是放到“数据管理”中,可以看到是去读取服务器的文件,先查找数据为M女性的数据,而且python的代码也是有一些注释,也可以帮助我们去进行一些逻辑的排错,这个可能对IT程序员比较有用处。

通过python的代码可以生成一个2个纬度的数据表格,也可以直接下载生成的结果转化为excel格式的文档,也可以做为二次数据源保存到“数据管理”中。

# 提取需要的列:报案时间、结案时间、被保人性别
data_needed = data[['报案时间', '结案时间', '被保人性别']]# 将报案时间和结案时间转换为日期格式,并提取年月信息
data_needed['报案时间'] = pd.to_datetime(data_needed['报案时间']).dt.to_period('M')
data_needed['结案时间'] = pd.to_datetime(data_needed['结案时间']).dt.to_period('M')# 计算每个月的报案和结案人数
report_counts = data_needed.groupby('报案时间').size()
close_counts = data_needed.groupby('结案时间').size()# 合并报案和结案人数
monthly_counts = pd.concat([report_counts, close_counts], axis=1)
monthly_counts.columns = ['报案人数', '结案人数']# 计算每个月被保人性别的占比
gender_counts = data_needed.groupby(['报案时间', '被保人性别']).size().unstack(fill_value=0)
gender_ratio = gender_counts.div(report_counts, axis=0) * 100# 合并性别占比到月度统计表中
monthly_counts_with_gender = pd.concat([monthly_counts, gender_ratio], axis=1)
monthly_counts_with_gender.columns = ['报案人数', '结案人数', '男性占比(%)', '女性占比(%)']monthly_counts_with_gender.reset_index(inplace=True)
monthly_counts_with_gender.rename(columns={'index': '月份'}, inplace=True)monthly_counts_with_gender.head()

在这里插入图片描述

上面得到了table表格数据集,但是想要转化为图表,可以让它生成一个折线图的图表,可以看到上面的数据还是可以在下面的对话中继续使用的,最开始由于月份日期格式有问题,导致绘制的图表画不出来,但是可以看到AI可以非常智能的自动调整并修复逻辑。

通过查看折线图,可以明显分析出一些数据趋势的变化情况,针对这些变化可以做出对公司策略的调整:

  • 显示报案人数与结案人数的折线图
  • 7月-8月报案人数急剧增加
  • 12月达到了2022年的最高点
  • 9月-11月报案人数比较平稳
  • 7月到10月结案人数一直在递增

在这里插入图片描述

不过,上图只有报案人数与结案人数,明显这样来看只能看出一些变化,领导需要图中也要显示男女的人数占比。可以使用“堆叠柱状图”来展示4种类型的数据的分布和关联关系,提高数据传达和决策的效果。

当然,这里如果有时间的话,可以对图表进行参数调整,达到美化图表的效果。但是比较费时间,建议官方能默认支持生成比较好看的图片,让我们在会议汇报、领导查收时,能够眼前一亮,当然也是可以生成好json数据,在echarts根据自己的喜好生成美观的图表。


思考“AI办公小浣熊”产品价值的体现:

自己在公司也是开发有4年多的时间,通过上述从0到1的“AI办公小浣熊”产品实践,结合公司自己业务本身遇到的场景,进行以下几个角度的分析。


1. 企业内部报表系统存在的问题点:

不少公司企业内部,是完全依赖技术团队报表进行开发,但是,从技术团队的角度来看,在灵活性、通用性、产出效率几个特点来看,技术团队往往会存在以下一些问题。

在这里插入图片描述

往往一个小事情,解决的链路会很复杂、繁琐,往往增加了额外的沟通、时间成本,从人效的角度并不适合。


2. 某些业务场景下,对比“AI办公小浣熊”产品与技术开发的报表系统的分析:

在某些大方向上,基于公司的常规报表需求,在合理范围内是很正常的,但是在某一些不常用的报表需求范围内,可以使用“AI办公小浣熊”产品来解决,比如临时需要的紧急数据,走流程审批下来,估计都为时已晚,比如公司刚刚成立,需要很多统计类的需求,所以在有些场景下,我们可以通过“AI办公小浣熊”来优化工作流程,提高工作的效率,让人更专注于本职工作上。

在这里插入图片描述


3. 公司业务导入“AI办公小浣熊”可行性分析:

上面也提到了,结合公司的一些业务,并非所有的场景都适用,以下整理了公司某些场景下可替换的评估项,以及导入“AI办公小浣熊”后,初步预判可替换成本评估:

在这里插入图片描述

公司其实一直以来有些领导也在质疑,技术团队的价值?买一套成型的BI可以用吗?

序号业务场景类型CostDown成本预算/收益值
1非公司层面性、临时性、小范围内的数据统计分析业务开发量减少30%
2开发成本对比产品、UI、开发、测试工作量减少25%
3成本预算对比人力降低15%,IT软件资源降低20%
4产出时效性对比加快60-70%
5沟通成本对比降低30%

注:以上只是一个初步的预算模型值,在某些场景下,希望在各个业务部门,导入“AI办公小浣熊”后能够实现业务精细化运营、降本增效,实现“人人都是数据分析师”。


六、总结

随着移动互联网时代的不同发展和ChatGPT推动,越来越多的公司进行数字化转型,但是不同于GPT的是,“AI办公小浣熊”专注于数据智能化分析这一个热点方向展开了深入的研究、测试并发布,这也是数据智能分析具有里程碑意义的进步,一步一步深入了解“AI办公小浣熊”的能力与魅力。

通过对“AI办公小浣熊”的探索,可以发现对于数据量较大的信息数据源分析的效果也很好,无论是从速度上,还是回答准确率上,都极具针对性,至少满足了我个人平时的基本需求。通过AI的辅助让用户就不需要过度的思考和操作,确实做到了智能化、人性化和精确化这一步,可以实现让每个人都是数据的生产者和消费者,用来支撑企业的管理和运营需求。

在这里插入图片描述

办公小浣熊支持日常数据分析工作中的数据清洗、数据运算、趋势分析、预测性分析、比较分析、关联性分析、数据可视化等场景。

对于企业用户来讲是非常友好的,减少了下载安装软件的琐碎流程,通过AI赋予的价值在于解决企业内部普遍面临的依赖技术团队、Excel技能门槛高、数据产能低等共性问题,通过“AI办公小浣熊”将数据分析工具提升到业务面,最终实现人人可用、全民识数的目标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/20625.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

C盘扩容(C盘右键无法扩展卷解决)超详细步骤!!!

目录 1、问题及需求2、解决办法方法2 1、问题及需求 今天一看C盘爆红了,但是D盘还剩很多空间,想要从D盘再分出来50G给C盘。 但是压缩了D盘,在C盘扩展卷,实现不了,因为不仅挨着。看下边的解决办法 2、解决办法 桌面上…

机器学习笔记 // 天气预报、股票价格以及历史轨迹(如摩尔定律)// 时间序列的常见属性

时间序列随处可见。你可能已经在天气预报、股票价格以及历史轨迹[如摩尔定律,见下图​]等事物中见过它们。摩尔定律预测微芯片上面的晶体管个数大约每两年会翻倍。几乎50年以来,它已经被证明对未来的计算能源和成本来说是一个准确的预测器。 许多时间序列…

mysql日志写满出现The table ‘xxxx_amazon_order’ is full

数仓发现写数据出现 SQL 错误 [1114] [HY000]: The table ‘xxxx_amazon_order’ is full 1.第一时间查看系统磁盘, 发现空间写满了 df -h因为mysql是使用docker部署的, Docker 的默认存储位置在 /var/lib/docker /var 目录默认是在根分区 (/dev/mapper/centos-root) 下的 …

(一)Ubuntu22.04服务器端部署Stable-Diffusion-webui AI绘画环境

一、说明 cup型号: Intel(R) Celeron(R) CPU G1610 2.60GHz 内存大小: 8G 显卡型号:NVIDIA P104-100 注意:系统睡眠问题 sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target 网卡设置 …

springboot:少量配置信息情形

发现无论怎么改都还是指向8001 所以换一种方法 通过 结果 代码 import org.springframework.beans.factory.annotation.Value; import org.springframework.boot.web.server.ConfigurableWebServerFactory; import org.springframework.boot.web.server.WebServerFactoryCusto…

SpringBoot的快速入门

Maven Maven可以方便管理依赖的 Jar 包 IDEA 自带Maven,也可以选择自己安装 安装Maven:https://blog.csdn.net/qq_59636442/article/details/142314019 创建项目 通过Spring Initializr 快速创建项目:https://start.springboot.io/ 我的项目名叫blog&a…

2024中国高校计算机大赛 — 大数据挑战赛-赛后复盘

一、赛题描述 基于气象大数据的自动站实况联合预测 风光清洁能源的管理与气象关系密不可分,因为风能和太阳能的发电效率直接依赖于气象条件。风力发电需要精确的风速和风向预测,而太阳能发电则依赖于日照时间和云层覆盖情况的准确预报。优质的气象预测…

J.U.C - 深入解析ReentrantLock原理源码

文章目录 概述synchronized的缺陷1)synchronized不能控制阻塞,不能灵活控制锁的释放。2)在读多写少的场景中,效率低下。 独占锁ReentrantLock原理ReentrantLock概述AQS同步队列1. AQS实现原理2. 线程被唤醒时,AQS队列的…

基于Java+Springboot+Jpa+Mysql实现的在线网盘文件分享系统功能设计与实现二

一、前言介绍: 免费学习:猿来入此 1.1 项目摘要 在线网盘文件分享系统的课题背景主要源于现代社会对数字化信息存储和共享需求的日益增长。随着互联网的普及和技术的快速发展,人们越来越依赖电子设备来存储和传输各种类型的数据文件。然而…

DBSCAN聚类——基于密度的聚类算法(常用的聚类算法)

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)简称密度聚类或密度基础聚类,是一种基于密度的聚类算法,也是一种常用的无监督学习算法,特别适用于形状不规则的聚类和含有噪声的数据集。主要用于…

C++:指针和引用

指针的基础 数据在内存当中是怎么样被存储的 数据在内存中的存储方式取决于数据的类型和计算机的体系结构 基本数据类型 整数类型:整数在内存中以二进制补码的形式存储。对于有符号整数,最高位为符号位,0 表示正数,1 表示负数。…

LabVIEW多通道面阵烟雾透过率测试系统

LabVIEW面阵烟雾透过率测试系统通过高精度多通道数据采集和实时处理技术,能够实现对固体推进剂烟雾的透过率进行精确测量。系统利用了LabVIEW的图形化编程环境及其丰富的设备驱动接口,有效提升了测试的自动化程度和数据处理的实时性。 项目背景&#xf…

PDF电子发票信息转excel信息汇总

PDF电子发票信息提取,支持将pdf发票文件夹下的剩所有发票,转为excel格式的信息,对于发票量比较大,不好统计,需要一个一个去统计的情况,可节省2个点以上的时间,一次下载,终身有效。 使…

51c视觉~合集7

我自己的原文哦~ https://blog.51cto.com/whaosoft/11536996 #Arc2Face 身份条件化的人脸生成基础模型,高一致性高质量的AI人脸艺术风格照生成 将人脸特征映射到SD的CLIP的编码空间,通过微调SD实现文本编码器转换为专门为将ArcFace嵌入投影到CLIP潜在…

【西瓜书】机器学习的模型评估

来源于西瓜书、南瓜书等内容。 误差与偏差 学习器的实际预测输出与样本的真实输出之间的差异,称为”误差“(error)。学习器在训练集上的误差,称为”训练误差“(training error)或”经验误差“(…

Mac安装Docker Desktop搭建K8s集群,解决镜像无法下载的问题

使用 Docker Desktop可以在本地方便地搭建出 K8s集群,但开启 K8s集群后往往会遇到 K8s 镜像拉取失败问题,本文旨在解决该问题,从而在本地搭建 K8s 集群。 安装Docker Desktop 安装 Docker Desktop 建议安装历史版本, 不建议安装最新版。因为…

【Leecode】Leecode刷题之路第54天之旋转矩阵

题目出处 54-螺旋矩阵-题目出处 题目描述 个人解法 思路: todo代码示例:(Java) todo复杂度分析 todo官方解法 54-旋转矩阵-官方解法 方法1:模拟 思路: 代码示例:(Java&#xff…

【YOLOv8】安卓端部署-1-项目介绍

【YOLOv8】安卓端部署-1-项目介绍 1 什么是YOLOv81.1 YOLOv8 的主要特性1.2 YOLOv8分割模型1.2.1 YOLACT实例分割算法之计算掩码1.2.1.1 YOLACT 的掩码原型与最终的掩码的关系1.2.1.2 插值时的目标检测中提取的物体特征1.2.1.3 coefficients(系数)作用1.…

Cesium教程01_实现Cartesian3 三维坐标操作

在 Vue 项目中使用 Cesium 实现 Cartesian3 三维坐标操作 目录 一、引言二、Cesium 与 Cartesian3 的优势三、示例应用:在地图上标注和计算距离 1. 项目结构2. 主要代码实现3. 运行与效果 四、代码讲解与扩展 1. Cartesian3 的基础操作2. 距离计算与中点标注 五、…

Qt5-雷达项目

界面: widget.h #ifndef WIDGET_H #define WIDGET_H#include <QTimer> #include <QWidget>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Widget : public QWidget {Q_OBJECTpublic:Widget(QWidget *parent nullptr);~Widget(); pr…