Elasticsearch 和 Kibana 8.16:Kibana 获得上下文和 BBQ 速度并节省开支!

作者:来自 Elastic Platform Product Team

Elastic Search AI 平台(Elasticsearch、Kibana 和机器学习)的 8.16 版本包含大量新功能,可提高性能、优化工作流程和简化数据管理。

  • 使用更好的二进制量化 (Better Binary Quantization - BBQ) 和生成式 AI (GenAI) 来提高热度:向量搜索中速度快、精度高、成本节省惊人
    • Elasticsearch 的新 BBQ 算法重新定义了向量量化 — 提高查询速度、排名精度和成本效率。与乘积量化 (product quantization - PQ) 等替代方案相比,实现超过 90% 的召回率,延迟更低,并将 RAM 使用率降低 95%。
  • Kibana 获得上下文:探索更智能的数据调查的力量
    • 得益于其可扩展的上下文架构,Kibana Discover 可以动态适应你正在分析的数据类型。节省时间并提高生产力,使数据探索比以往更顺畅。
  • 查询演变:Elasticsearch 查询语言 (ES|QL) 中的快速跟踪、智能堆栈和地理黑客
    • 借助 Elastic 的三个新功能(推荐查询、快速距离排序和按聚合过滤),在 ES|QL 中解锁更快、更轻松、更灵活的查询。

深入了解这些更新和更多增强功能 - 所有这些都旨在提高速度、生产力和可用性。

Elastic 8.16 中还有什么新功能?查看 8.16 公告帖子以了解更多信息 >>

GenAI 中的增强功能

在 8.16 中,Elastic 通过提高效率、可扩展性和可用性,继续在生成 AI 领域保持创新步伐。借助 BBQ,通过将内存需求减少高达 97%,实现顶级查询速度和成本节省。新推出的正式版推理 API 只需单击几下即可提供对 Elastic 强大的 AI 模型的生产就绪访问以及实时交互。借助自适应资源和灵活的分块策略,你可以在高需求时获得最佳性能,在空闲时则无需支付任何费用。

BBQ

Elasticsearch 推出了一个全新的稠密向量量化算法,在查询延迟、排名质量和所需计算资源(成本)方面取得了令人惊讶的效果。

这一算法的整体概念与 PQ(Product Quantization)相似,因为 Elasticsearch 会生成一个比原始向量小得多的预测向量。初始搜索使用的是预测向量,随后对结果进行过采样以进行重新排序,并使用原始向量对其进行排序,从而产生一组针对查询的结果。生成预测向量的方法与 PQ 完全不同,基于生成一个比原始向量更节省存储空间的比特向量,同时仍能预测正确的排名。

关键点在于,BBQ 能够提供优秀的排名效果,达到超过 90% 的召回率(相比于对原始向量进行暴力搜索/brute force),并且通过 2x 到 5x 的过采样优化查询结果。查询延迟也优于其他替代方法,包括 PQ。最重要的是,BBQ 的内存需求仅为使用 HNSW 算法处理原始向量时所需内存的 3% 到 5%,大幅降低了成本。如需了解算法的更详细描述和一些测试结果,请查阅这篇博客。

要使用它,只需将 index_options 定义为 bbq_hnsw 或 bbq_flat 类型,并且不要忘记使用 script_score 查询对完整向量进行过采样和重新排序。该功能仍处于技术预览阶段,我们暂时计划在即将发布的版本中简化使用它的体验。

推理 API 已正式发布

我们很高兴地宣布,推理 API 现已正式发布。从 8.16 开始,它现在被推荐用于生产,提供生产级稳定性、稳健性和性能。Elastic 的推理 API 集成了最先进的 AI 推理,同时提供了无与伦比的易用性。它将 Elastic 的 AI 语义搜索模型 — Elastic Learned Sparse EncodeR (ELSER) — 以及你的 Elastic 托管模型和越来越多的知名外部模型和任务整合在一起,形成统一、精简的语法,供你的 Elastic 向量数据库使用。与 semantic_text 或 Elastic 向量数据库支持的向量字段一起使用,你可以无缝轻松地执行 AI 搜索、重新排名和完成。

在 8.16 中,我们还添加了流式完成,以改进流程和实时交互以及 GenAI 体验。推理 API 为你提供最先进的 AI 推理,并提供更多服务和任务供你使用。

ELSER、e5、训练模型自适应资源和分块策略

推理需要计算资源,因此模型部署必须自动适应推理负载 — 在高负载期间(例如在摄取高峰和繁忙搜索时间)扩大规模,并在推理负载下降时缩小规模。到目前为止,你必须主动管理这部分,即使启用了 Elastic Cloud ML 自动扩展功能也是如此。你如何控制所涉及的所有参数,以便在任何时间点实现搜索和摄取需求的最佳成本/性能权衡?

从 8.16 开始,ELSER 和你在 Elastic 中使用的其他 AI 搜索和自然语言处理 (natural language processing - NLP) 模型会根据推理负载自动调整资源消耗 — 在高峰时段提供你需要的性能,并在低谷时段降低成本,在空闲时间一直降至零成本。e5 模型在 Elastic 的标准保修范围内。

此外,不需要复杂的配置。通过用户友好的用户体验,你只需单击一下即可配置针对搜索优化和针对采集优化的模型部署。优化配置在后台透明地进行。你还可以轻松规划更多动态资源以用于搜索或采集。我们将继续改善这种体验。结合 Elastic Cloud 上 ML 自动扩展的灵活性和 Elastic Cloud Serverless 的惊人弹性,你可以完全控制性能和成本。

在 8.16 中,你可以选择使用单词或基于序列的分块策略来与训练模型一起使用,还可以自定义最大大小和重叠参数。合适的分块策略可以带来收益,具体取决于你使用的模型、文本的长度和性质以及搜索查询的长度和复杂性。

多层嵌套的检索器和 GA

检索器是一种抽象,可从查询中返回排名靠前的文档。它旨在允许嵌套,并使定义查询变得更容易。检索器还允许在定义查询时具有更大的灵活性。自从我们在 8.14 中发布该功能以来,它变得越来越流行,我们收到了允许多层嵌套的请求。例如,用户请求通过 RRF 检索器组合密集向量(kNN 检索器)、ELSER 和 BM25(标准检索器),然后使用文本相似性重新排序检索器通过外部服务对它们进行重新排序,该检索器现已受支持。在 8.16 中,我们还添加了对其他搜索功能(如折叠结果和突出显示)的支持。并且我们已将包括 RRF 在内的检索器公开发布。

快速查询:ES|QL 的高级新功能

Elastic 8.16 引入了三个强大的新功能,旨在使查询更快、更轻松、更灵活。推荐的 ES|QL 查询提供即时指导,包括自动完成选项和预构建的查询建议,非常适合任何技能水平的用户。按距离排序现在可将快速地理搜索和前 N 个查询的性能提升高达 100 倍。通过每个聚合过滤,你可以为每个聚合定义唯一的过滤器,为你的分析带来精确度。

推荐的 ES|QL 查询

现在,在 ES|QL 编辑器中创建查询比以往任何时候都更容易。推荐的查询有助于简化流程,尤其是对于不熟悉语法或数据结构的用户。此功能减少了查询创建时间,并简化了新用户和有经验用户的学习曲线。你现在可以从 ES|QL 帮助菜单中快速选择推荐的查询,或使用自动完成功能更快地开始使用。

ES|QL 中按距离排序的速度更快

在 ES|QL 中展示了完整的地理搜索功能后,我们将注意力转向性能优化 — 从常见的过滤情况开始,到按距离对结果进行排序。对于涉及在距离内搜索文档和/或按距离对文档进行排序的一系列查询,我们的性能提高了 10 倍到 100 倍。这还包括在 WHERE 和 SORT 命令中使用 EVAL 命令之前定义距离函数的能力。我们的最佳结果 — 查询速度提高了大约 100 倍 — 是非常有用的 top-N 查询,对结果进行排序和限制,如我们的每夜基准测试仪表板所示:

ES|QL 中的按聚合过滤

ES|QL 中的聚合在 8.16 中变得更加灵活。现在,你可以在查询中为每个聚合定义一个过滤器,例如根据不同组(如 Web 服务器的状态代码)的不同条件计算计数统计信息:

FROM web-logs | STATS success = COUNT(*) WHERE 200 <= code AND code < 300,
redirect = COUNT(*) WHERE 300 <= code AND code < 400,
client_err = COUNT(*) WHERE 400 <= code AND code < 500,
server_err = COUNT(*) WHERE 500 <= code AND code < 600,
total_count = COUNT(*)

仪表板闪耀与数据飞跃:Kibana 8.16 的新功能

Kibana 8.16 引入了强大的新功能,提升了 Discover、仪表板和导航的用户体验,旨在提高生产力并简化数据探索。Discover 现在会根据数据类型自适应数据表,使用户更容易分析日志。仪表板新增快速访问功能,包括最近查看、收藏和使用情况分析。此外,全新的解决方案导向左侧菜单导航为搜索、可观测性和安全用户量身定制界面,提供更直观且高效的 Kibana 使用体验。

发现上下文数据呈现

Kibana 8.16 中的 Discover 现在可以根据正在探索的数据类型自动调整数据表呈现。对于使用日志的用户,相关字段(如 log levels)现在会自动显示在表格中或 Discover 文档查看器中的自定义日志概览中。这种简化的上下文感知方法通过简化数据探索和突出显示关键日志见解(无需额外配置)来提高工作效率。

轻松高效地管理仪表板

作为 Kibana 仪表板管理的一系列改进的一部分(请参阅 8.15 中的仪表板视图创建器和编辑器),我们添加了旨在提高效率和可用性的新功能。现在,你可以通过三种方式轻松对仪表板进行排序 - 保留 “Recently Viewed” 默认设置、为你最喜欢的仪表板加注星标以便快速轻松地找到,以及查看详细的使用情况统计信息。

此外,新的使用情况洞察功能允许你单击仪表板列表视图中的 “info” 图标以访问过去 90 天内仪表板视图的直方图。这可以洞察仪表板的受欢迎程度,帮助你识别和删除未使用的仪表板,最终优化你的工作区。这些更新使仪表板的管理和组织更快、更直观。

解决方案视图左侧菜单导航

Kibana 的新解决方案视图左侧菜单导航(可在 Elastic Cloud Hosted 中使用)通过将左侧菜单导航重点放在搜索、可观察性或安全性的相关功能上,为用户提供更简化的体验。这种有针对性的方法消除了混乱,使 Kibana 用户更容易找到满足其特定需求的菜单项,并使用户能够更有效地导航。从 8.16 开始,用户可以从四个视图中进行选择:Search、Observability、Security 或 Classic(保留以前的布局以保持连续性)。简化的左侧菜单导航通过仅显示每个解决方案所需的菜单项来改善日常工作流程。

Search 解决方案视图

Observability 解决方案视图

Security 安全 解决方案视图

Dev Console UX 改进

我们很高兴地宣布 Dev Console 有了新的改进 — 它是我们用户中最受欢迎的应用之一!最新的改进包括入门指南,可帮助新用户快速熟悉控制台。对于经验丰富的用户,我们引入了新功能,例如将输出复制到剪贴板以及导入或导出文件。此外,整体响应能力得到了优化,同时还进行了多项生活质量改进,以简化工作流程并提高效率。这些更新使 Dev Console 更加用户友好,增强了所有用户的入门和日常操作。

亮点之外:Elastic 8.16 的其他值得关注的更新

除了主要功能外,Elastic 8.16 还带来了众多实用的增强功能,旨在优化性能、简化工作流程并简化管理。

使用事件摄取时间进行更高效的搜索

使用 “event.ingested” 字段根据其摄取日期时间搜索数据的查询现在与使用可搜索快照时使用 “@timestamp” 的查询具有相同的性能提升。这要归功于一项优化,该优化允许根据 “event.ingested” 集群状态中存储的最小值和最大值跳过分片。

数据流最大和默认保留的全局设置

数据流对于随时间高效摄取日志和指标至关重要,而管理数据保留对于保持系统效率和成本效益至关重要。在此版本中,管理员可以访问两个新的全局设置,允许他们定义部署中所有数据流的最大和默认保留期,确保删除过时的数据,同时保持成本可控。

Interval 查询与 span 查询功能相当

Inteval 查询旨在取代 span 查询。它更易于定义;它提供接近度分数;在某些情况下,它的性能更高。这两个查询通常用于法律和专利搜索。在 8.16 中,我们在interval 查询中启用了正则表达式和范围,并将多项 interval 查询(前缀/prefix、通配符/wildcard、模糊/fuzzy、正则表达式/regexp 和范围/range)的最大子句从 128 个增加到可配置参数(与跨度查询使用的参数相同)。

日志分析仪表板面板

使用日志模式分析将日志分组为模式,以加快洞察和解决问题的时间。使用 Elastic 的人工智能 IT 运营 (AIOps) 功能,在几秒钟内处理数千个日志并识别噪音中的信号。借助仪表板内提供的日志模式分析,AIOps 越来越多地嵌入到你的工作流中。过滤模式将相应地调整仪表板的数据,或者选择过滤以在 Discover 中过渡你以进行进一步探索。

直观的 Space 设置

Kibana 8.16 简化了角色分配,允许管理员直接从 Space 设置直观地分配角色和权限。新的 “Permissions” 选项卡可以对单个或多个空间进行高效的角色管理,为访问控制带来用户友好的方法。

支持异常检测中的夏令时 (DST) 变化

在 8.16 中,我们引入了对异常检测中 DST 变化的支持。通过选择正确的时区设置 DST 日历,并将其单独或分组应用于你的异常检测作业,以方便你使用。然后,让你的异常检测模型在未来许多年内无需任何与 DST 相关的干预即可工作。不再因 DST 变化而导致异常检测误报。让你的检测不间断地完成工作。

更多关于这个的描述,请参考文章 “在 Elasticsearch 中顺利管理季节性时间变化”。

文件上传器 PDF 支持

文件上传器提供了一种简单的数据上传方式,可在几秒钟内开始使用 Elastic。现在,你可以从 PDF 文件上传数据,只需单击一下即可前往 Search Playground。使用它可快速获取数据并利用 Elastic 技术。

试试吧!

在发行说明中了解这些功能和更多内容。

现有的 Elastic Cloud Hosted 和 Elastic Cloud Serverless 客户可以直接从 Elastic Cloud 控制台访问其中的许多功能。没有利用云上的 Elastic?开始免费试用。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或提到了第三方生成 AI 工具,这些工具由其各自的所有者拥有和运营。Elastic 无法控制第三方工具,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害承担任何责任。将 AI 工具用于个人、敏感或机密信息时,请谨慎行事。你提交的任何数据都可能用于 AI 培训或其他目的。我们无法保证你提供的信息会保持安全或保密。在使用任何生成 AI 工具之前,你应该熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 及其相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elasticsearch and Kibana 8.16: Kibana gets contextual and BBQ speed and savings! | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/14766.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

ubuntu20.04安装FLIR灰点相机BFS-PGE-16S2C-CS的ROS驱动

一、Spinnaker 安装 1.1Spinnaker 下载 下载地址为&#xff1a; https://www.teledynevisionsolutions.com/support/support-center/software-firmware-downloads/iis/spinnaker-sdk-download/spinnaker-sdk–download-files/?pnSpinnakerSDK&vnSpinnakerSDK 在上述地址中…

OCR+多模态数据技术,赋能海洋数据智能处理

海洋是推动高质量发展的关键区域&#xff0c;也是人类未来发展的宝库。然而&#xff0c;我们对海洋生态系统的深入理解尚不足5%。海洋大数据&#xff0c;通过观测、监测、调查、分析和统计等手段获得&#xff0c;已成为我们探索海洋世界的主要工具。 如图1所示&#xff0…

JUC学习笔记

文章目录 锁生产者消费者问题8锁现象集合类不安全Callable创建线程的三种方式 常用辅助类CountDownLatchCyclibarrierSamphore 本篇博客是之前学习JUC时记录的内容&#xff0c;对于并发编程知识只是浅浅谈及&#xff0c;并不深入。也算是给自己开新坑。建一个JUC的专栏&#xf…

集合卡尔曼滤波(EnsembleKalmanFilter)的MATLAB例程(三维、二维)

本 M A T L A B MATLAB MATLAB代码实现了一个三维动态系统的集合卡尔曼滤波&#xff08;Ensemble Kalman Filter, EnKF&#xff09;示例。代码的主要目的是通过模拟真实状态和测量值&#xff0c;使用 EnKF 方法对动态系统状态进行估计。 文章目录 参数设置初始化真实状态定义状…

OpenGL ES 共享上下文实现多线程渲染

OpenGL ES 共享上下文时,可以共享哪些资源? 共享上下文实现多线程渲染 EGL 概念回顾 EGL 是 OpenGL ES 和本地窗口系统(Native Window System)之间的通信接口,它的主要作用: 与设备的原生窗口系统通信; 查询绘图表面的可用类型和配置; 创建绘图表面; 在OpenGL ES 和…

如何安装和使用SSH远程连接工具MobaXterm

文章目录 一、下载二、安装三、使用四、配置1、配置默认编辑器2、配置右键粘贴3、SSH配置4、关闭X-Server服务 一、下载 1、进入官网&#xff1a;https://mobaxterm.mobatek.net/download-home-edition.html 2、Download——>Home Edition。 3、下载绿色安装版本。 二、安…

Java项目实战II基于微信小程序的原创音乐小程序(开发文档+数据库+源码)

目录 一、前言 二、技术介绍 三、系统实现 四、文档参考 五、核心代码 六、源码获取 全栈码农以及毕业设计实战开发&#xff0c;CSDN平台Java领域新星创作者&#xff0c;专注于大学生项目实战开发、讲解和毕业答疑辅导。获取源码联系方式请查看文末 一、前言 随着移动互…

linux-文件的读写

操作系统一切皆文件&#xff0c;访问文件实际上就是访问硬件&#xff0c;因为文件都保存在硬件上&#xff0c;或者文件就是硬件&#xff0c;而要访问硬件&#xff0c;就需要操作系统提供的系统调用&#xff0c;所以c/c函数中关于访问硬件设备&#xff0c;基本上是由系统调用封装…

「实战应用」如何可视化 DHTMLX Scheduler 中的资源工作量?

DHTMLX Scheduler是一个全面的 UI 组件&#xff0c;用于处理面向业务的 Web 应用程序中复杂的调度和任务管理需求。但是&#xff0c;某些场景可能需要自定义解决方案。例如&#xff0c;如果项目的资源&#xff08;即劳动力&#xff09;有限&#xff0c;则需要确保以更高的精度分…

RNA-seq 差异分析的点点滴滴(2)

引言 本系列[1]将开展全新的转录组分析专栏&#xff0c;主要针对使用DESeq2时可能出现的问题和方法进行展开。 Tximeta&#xff1a;自动导入并附加元数据 Bioconductor 家族中的 tximeta 包&#xff0c;在 tximport 的基础上进行了扩展&#xff0c;不仅保留了原有功能&#xff…

Pycharm PyQt5 环境搭建创建第一个Hello程序

第一步: 创建Pycharm项目,下载包: pip install PyQt5 -i https://pypi.tuna.tsinghua.edu.cn/simple/pip install PyQt5-tools -i https://pypi.tuna.tsinghua.edu.cn/simple/下载好了之后,可以看到相应包: PyQt5:PyQt5是一套Python绑定Digia QT5应用的框架。Qt库是最…

安装luasocket模块时提示“sudo: luarocks:找不到命令“问题,该如何解决?

大家好&#xff0c;我是袁庭新。分享一个我在使用luarocks来安装luarocks模块报错的解决方法。 在Unix系统中安装LuaRocks。本文我以CentOS 7.x系统为例&#xff0c;来讲解如何安装LuaRocks。 $ cd /opt $ wget https://luarocks.org/releases/luarocks-3.11.1.tar.gz $ tar …

Axure安装步骤及免费替代方案

Axure作为一款强大的原型设计工具&#xff0c;因其丰富的功能而受到设计师的青睐。它包括动态面板、复杂表格编辑、协同设计和高保真原型设计等&#xff0c;这些功能可以简化复杂的设计流程&#xff0c;提高团队效率。本文将介绍Axure的安装方法&#xff0c;并探索一款新兴的Ax…

分布式数据库:架构、优势与实践应用

&#x1f4dd;个人主页&#x1f339;&#xff1a;一ge科研小菜鸡-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 分布式数据库在现代信息技术中扮演着至关重要的角色&#xff0c;尤其在需要处理大规模数据和实现高可用性、可扩展性的应用中更是…

小试银河麒麟系统OCR软件

0 前言 今天在国产电脑上办公&#xff0c;需要从一些PDF文件中复制文字内容&#xff0c;但是这些PDF文件是图片转换生成的&#xff0c;不支持文字选择和复制&#xff0c;除了手工输入&#xff0c;我们还可以使用OCR。 1 什么是OCR OCR &#xff08;Optical Character Recogni…

np.zeros_like奇怪的bug

import numpy as np aa np.array([[1,2,3],[2,3,3]]) cc np.random.randn(2,3) print(aa) print(cc)bb np.zeros_like(aa) print(bb)for i in range(bb.shape[0]):for j in range(bb.shape[1]):bb[i,j] cc[i,j]print(bb)结果如下 这里发现这个bb的结果是没有赋值的 正确做…

C++(Qt)软件调试---内存泄漏分析工具MTuner (25)

C(Qt)软件调试—内存泄漏分析工具MTuner &#xff08;25&#xff09; 文章目录 C(Qt)软件调试---内存泄漏分析工具MTuner &#xff08;25&#xff09;[toc]1、概述&#x1f41c;2、下载MTuner&#x1fab2;3、使用MTuner分析qt程序内存泄漏&#x1f9a7;4、相关地址&#x1f41…

apk反编译修改教程系列-----apk应用反编译中AndroidManifest.xml详细代码释义解析 包含各种权限 代码含义

在反编译apk应用中。需要增加或者减少有些apk功能或者权限类的修改。其中大多都在于 AndroidManifest.xml文件中。了解AndroidManifest.xml其中每串代码代表的含义对修改apk有着至关重要的作用。 通过博文了解💝💝💝💝 1💝💝💝💝----AndroidManifest.xml中代…

项目功能--运营数据统计

一、需求分析 通过运营数据统计可以展示出体检机构的运营情况&#xff0c;包括会员数据、预约到诊数据、热门套餐等信息。我们要通过一个表格的形式来展示这些运营数据。如下图&#xff1a; 二、代码实现 实现步骤&#xff1a; 步骤一&#xff1a;定义数据模型&#xff0c;通过…

电子制造行业Top5贴片机品牌

在电子制造业的快速发展中&#xff0c;SMT&#xff08;Surface Mount Technology&#xff09;表面贴装技术扮演着至关重要的角色。贴片机作为SMT生产线的核心设备&#xff0c;其性能直接关系到整个生产线的效率和产品质量。 SPEA作为全球领先的自动化测试设备服务商&#xff0…