DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已有功能进行了改进,旨在提升更好的使用体验。

一. 更新日志

  • 新增 SOLR 服务:

    • 支持 Solr 服务的部署与维护,为用户提供强大的全文搜索和索引功能,方便对大数据集进行高效检索。
  • 新增 RANGER 服务:

    • 支持 RangerAdmin、RangerUserSync、RangerTagSync 的部署与管理,实现集中的权限控制和安全审计。

新增 RANGER 插件:

  • RANGER-HDFS 插件:
    • 支持文件和目录级别的权限控制。
    • 提供详细的访问审计日志,满足合规性要求。
  • RANGER-YARN 插件:
    • 管理作业提交和队列级别的访问权限。
    • 防止资源滥用,确保资源的公平分配和安全性。
  • RANGER-HBASE 插件:
    • 实现表、列族、列级别的权限管理。
    • 保障数据的读写安全,防止未经授权的操作。
  • RANGER-KAFKA 插件:
    • 设置主题和消费组的访问权限。
    • 保护消息的生产和消费环节,确保数据传输安全。
  • RANGER-HIVE 插件:
    • 提供行、列、单元格级别的访问控制。
    • 具备数据脱敏功能,保护敏感信息。
  • RANGER-SOLR 插件:
    • 控制查询和索引的访问权限。
    • 防止未经授权的搜索和数据泄露。
  • 优化日志管理的滚动效果:

    新增用户身份判定机制,解决了除 root 用户外其他普通用户无法登录的问题,提升了系统的安全性和用户友好性。

  • 优化配置文件联动机制:

    当 Ranger 服务部署或发生变动时,系统将自动联动修改相关服务的配置文件,减少手动操作的繁琐,降低错误发生的可能性。

  • 新增脚本耗时显示:

    在执行 datalight.sh 操作 Master 和 Worker 进程时,增加了耗时打印功能,方便用户了解操作执行时间,优化性能调试流程。

二. 部分更新内容预览

2.1 新增 Ranger、Solr 服务

2.2 RangerAdmin

提供友好的 Web 界面,可以方便地创建、修改和查看权限策略。

2.3 RangerUserSync

支持从 LDAP、Active Directory 或本地 Unix 系统同步用户和组信息,确保权限管理的准确性和同步性。

2.4 SolrServer

支持 Solr 集群部署,提供容错和负载均衡能力,且支持全文检索、模糊查询、范围查询等多种查询方式,满足多样化的业务需求。

2.5 一键启用、禁用 Ranger 插件

在 DataLight 平台上,可以一键启用或禁用各服务的 Ranger 插件,灵活控制权限管理功能。

2.6 Ranger 插件审计

详细记录各服务的访问和操作日志,帮助管理员监控用户行为,防范安全风险。

2.7 Ranger 插件状态

在平台上查看各 Ranger 插件的运行状态,及时发现和处理异常情况,保障系统稳定运行。

2.8 优化脚本耗时显示

增加了 datalight.sh 脚本操作过程的耗时打印,帮助用户分析和优化系统性能,提升运维效率。

三. 如何增量更新到 1.4.5 版本

我们提供了详细的升级指南,帮助您顺利将现有的 DataLight 平台更新到最新版本。

3.1 停止 Master/Worker进程

进入主节点,在所有服役的节点上,执行以下命令,停止并删除所有节点上的 Master、Worker 进程:

# 停止 Master 进程
/opt/datalight/bin/datalight.sh stop master# 停止 Worker 进程
/opt/datalight/bin/datalight.sh stop worker# 删除原有的 Master、Worker Jar 包
rm -rf /opt/datalight/app/*.jar

注:Master 进程所在节点称之为主节点,下同

3.2 更新主包

前往百度网盘,下载如下内容,获取最新的主程序包。

下载完成后,将新包覆盖至 /opt/datalight 目录下,替换原有文件。

3.3 更新插件包

前往百度网盘,下载如下插件包内容,将其覆盖更新至 /opt/datalight/plugins 目录下的相应位置,确保插件版本与主程序一致。

3.4 手动分发到所有节点

将更新后的 DataLight 目录从 主节点 推送至所有 从节点。可以使用 scp 或其他同步命令进行分发。例如,将更新内容推送至节点 node02

# 以推送至 node02 节点为例
scp -r /opt/datalight node02:/opt

3.6 重新启动 Master 进程

进入主节点,通过以下命令启动 Master 进程,Master 进程重启后,稍等片刻,Master 将自动拉起所有节点上的 Worker 进程。

/opt/datalight/bin/datalight.sh start master 8001

四. Ranger 的功能与场景

DataLight 平台现已支持与 Ranger 深度集成,实现对各大数据组件的统一权限管理和安全审计。

  • 4.1 Ranger 与 HDFS

    使用场景:数据分层存储

    在一个企业数据湖中,不同部门需要访问不同的数据集。Ranger 可以为每个部门设置特定的文件夹权限:

    • 场景: 财务部门需要访问财务报告,但不应该访问研发数据。
    • 解决方案: 使用 Ranger 创建规则,只允许财务部门的用户组访问 /data/finance 目录,而 /data/research 只能由研发部门访问。
    • 好处: 确保数据隔离,防止敏感信息泄露。

    4.2 Ranger 与 YARN

    使用场景:资源公平调度

    在共享计算资源的环境中,确保不同用户的公平使用:

    • 场景: 数据科学团队和营销团队共享一个 YARN 集群。
    • 解决方案: 通过 Ranger 限制每个团队提交的作业数量和资源使用量。
    • 好处: 防止某一团队过度占用资源,提升整体资源利用率。

    4.3 Ranger 与 HBase

    使用场景:客户数据保护

    公司需要存储和处理敏感的客户信息,确保数据安全:

    • 场景: 客户服务团队需要访问客户联系信息,但不应查看财务数据。
    • 解决方案: 使用 Ranger 在 HBase 中设置列级权限,允许访问 contact_info 列族,而限制 financial_data
    • 好处: 保护敏感数据,符合隐私法规要求。

    4.4 Ranger 与 Hive

    使用场景:敏感数据分析

    在执行大规模数据分析时,保护敏感数据:

    • 场景: 分析师需要访问销售数据进行趋势分析,但不应查看具体客户信息。
    • 解决方案: 在 Hive 中设置列级权限,允许访问销售数据列,但限制客户信息列。
    • 好处: 保证分析的同时,保护个人隐私。

    4.5 Ranger 与 Kafka

    使用场景:日志数据流管理

    管理跨部门的日志数据流:

    • 场景: 安全团队和开发团队需要访问不同的日志数据。
    • 解决方案: 使用 Ranger 设置 Kafka 主题权限,安全团队可以访问 security_logs 主题,而开发团队访问 app_logs
    • 好处: 确保数据流的安全性和隐私性。

    4.6 Ranger 与 Solr

    使用场景:搜索查询控制

    在企业搜索平台中,管理不同用户的查询权限:

    • 场景: 员工可以搜索公共文档,但只有人力资源可以搜索员工记录。
    • 解决方案: 使用 Ranger 控制 Solr 查询权限,限制员工只能搜索公共索引。
    • 好处: 防止敏感信息泄露,确保合规性。

关注我们,获取更多最新资讯。

一起见证数据世界的无限可能!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1547569.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

傅里叶级数在机器人中的应用(动力学参数辨识)

B站首发!草履虫都能看懂的【傅里叶变换】讲解,清华大学李永乐老师教你如何理解傅里叶变换,辨清美颜和变声原理,!!_哔哩哔哩_bilibiliB站首发!草履虫都能看懂的【傅里叶变换】讲解,清…

macOS安装MySQL以后如何配置环境变量

当安装了MySQL,解决了远程链接的问题以后, 还没有完事大捷, 还需要配置环境变量. 因为我需要使用mysql命令, 以及备份相关的命令. 下面是mysql的默认配置截图: 接着我查看了/usr/local/mysql/bin这个目录. 果然很多命令都在这个里面. 所以我将这个目录加载到了path中. e…

XSS | 反射型 XSS 攻击

关注这个漏洞的其他相关笔记:XSS 漏洞 - 学习手册-CSDN博客 0x01:反射型 XSS — 理论篇 反射型 XSS 又称非持久型 XSS,这种攻击方式往往具有一次性。 常见的攻击方式: 攻击者通过电子邮件等方式将包含 XSS 代码的恶意链接发送给…

Linux标准IO(五)-I/O缓冲详解

1.简介 出于速度和效率的考虑,系统 I/O 调用(即文件 I/O,open、read、write 等)和标准 C 语言库 I/O 函数(即标准 I/O 函数)在操作磁盘文件时会对数据进行缓冲,本小节将讨论文件 I/O 和标准 I/…

蓝桥杯--STM32G431RBT6(TIM定时器的输出频率和占空比,含详细原理介绍和使用方法)

目录 一、前言 二、代码 实现功能:​编辑 按如图配置 定义变量 编写执行代码 显示在LCD上 加入按键效果 三、效果展示 四、代码开源 一、前言 ARR 即自动重装载值(Auto Reload Register)。相当于一个水杯,水杯容量&am…

【EXCEL数据处理】000002 案列 条件格式之重复值。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来,方便查看。

【EXCEL数据处理】000002 案列 条件格式之重复值。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来,方便查看。 在日常的数据处理和分析工作中,Excel 是一款强大而广泛使用的工具。其中,条件格式中的重复值功能对于快…

Golang | Leetcode Golang题解之第438题找到字符串中所有字母异位词

题目&#xff1a; 题解&#xff1a; func findAnagrams(s, p string) (ans []int) {sLen, pLen : len(s), len(p)if sLen < pLen {return}count : [26]int{}for i, ch : range p {count[s[i]-a]count[ch-a]--}differ : 0for _, c : range count {if c ! 0 {differ}}if diff…

Java | Leetcode Java题解之第438题找到字符串中所有字母异位词

题目&#xff1a; 题解&#xff1a; class Solution {public List<Integer> findAnagrams(String s, String p) {int sLen s.length(), pLen p.length();if (sLen < pLen) {return new ArrayList<Integer>();}List<Integer> ans new ArrayList<Int…

滚珠丝杠在人形机器人及线控制动和转向中大放异彩

直线驱动器用于对旋转角度不大、高负载的场景,在人形机器人中多用于四肢。直线驱动器多采取“电机+丝杠”,将旋转运动转为关节末端的直线运动,能够起到较好的支撑和承重效果,能够较好的适配应用场景的负载需求。 特斯拉人形机器人Optimus 双足、双臂采用连杆结构,连杆末端…

25:stm32的低功耗模式

低功耗模式 1、PWR电源控制2、低功耗模式 1、PWR电源控制 PWR&#xff08;Power Control&#xff09;电源控制。PWR负责管理STM32内部的电源供电部分&#xff0c;可以实现可编程电压监测器和低功耗模式的功能&#xff0c;这里我们只学习低功耗模式的功能&#xff0c;低功耗模式…

MySQL --用户管理

文章目录 1.用户1.1用户信息1.2创建用户1.3删除用户1.4修改用户密码 2.数据库的权限2.1给用户授权2.2回收权限 如果我们只能使用root用户&#xff0c;这样存在安全隐患。这时&#xff0c;就需要使用MySQL的用户管理。 1.用户 1.1用户信息 MySQL中的用户&#xff0c;都存储在系…

性能调优知识点(mysql)一

Mysql 索引 索引介绍 1.索引是排好序的数据结构。他的目的是为了提升查询效率。 2.mysql存储引擎分为innodb和myisam。它是用来形容表的。 innodb支持事务、外键、行锁 myisam不支持事务、外键 3.myisam使用3个文件来存储每张表数据&#xff0c;每个文件名以表名开头&#x…

Python | Leetcode Python题解之第440题字典序的第K小数字

题目&#xff1a; 题解&#xff1a; class Solution:def getSteps(self, cur: int, n: int) -> int:steps, first, last 0, cur, curwhile first < n:steps min(last, n) - first 1first * 10last last * 10 9return stepsdef findKthNumber(self, n: int, k: int)…

GS-SLAM论文阅读笔记--MM3DGS SLAM

前言 多传感器融合GS-SLAM的另一个IROS2024,不过这篇没有用到激光雷达&#xff0c;而是相机和IMU结合而实现的。今天看一下这篇。 文章目录 前言1.背景介绍2.关键内容2.1 跟踪2.2 深度监督2.3 惯性融合2.4建图2.5 总体流程 3.文章贡献4.个人思考 1.背景介绍 虽然SLAM方法使用…

class 023 随机快速排序

这篇文章是看了“左程云”老师在b站上的讲解之后写的, 自己感觉已经能理解了, 所以就将整个过程写下来了。 这个是“左程云”老师个人空间的b站的链接, 数据结构与算法讲的很好很好, 希望大家可以多多支持左程云老师, 真心推荐. https://space.bilibili.com/8888480?spm_id_f…

MySql简介及发展

MySql简介及发展 1、MySql起源和分支 MySQL 是最流行的关系型数据库软件之一&#xff0c;由于其体积小、速度快、开源免费、简单易用、维护成本 低等&#xff0c;在集群架构中易于扩展、高可用&#xff0c;因此深受开发者和企业的欢迎。 Oracle和MySQL是世界市场占比最高的两…

从入门到入土:计算机视觉CV学习路线图

在当今这个被数据和图像淹没的世界&#xff0c;计算机视觉&#xff08;CV&#xff09;正如一位聪明绝顶的魔术师&#xff0c;能够从无数的图像中提取出有意义的信息。对于那些初入这个领域的新人&#xff0c;学习计算机视觉既是一场冒险&#xff0c;也是一场盛宴。让我作为一位…

C语言进阶之泛型列表(Generic List)

1.前言 数据结构是需要泛型的,而在C语言中实现泛型就只能去用指针魔法了,来跟我一起实现吧!所有代码经测试未发现明显bug,可放心食用. 2.代码截图展示 1.list.h 2.main.c 3.list.c 3.结语 这次分享的列表采用动态数组的方式实现,下次我会去用链表实现,两种实现方式各有优劣,希…

20 vue3之自定义hooks

Vue3 自定义Hook的作用 主要用来处理复用代码逻辑的一些封装 Vue3 的 hook函数 相当于 vue2 的 mixin, 不同在与 hooks 是函数Vue3 的 hook函数 可以帮助我们提高代码的复用性, 让我们能在不同的组件中都利用 hooks 函数 这个在vue2 就已经有一个东西是Mixins mixins就是将…

代码随想录算法训练营第57天 | 寻宝

寻宝 题目描述 在世界的某个区域&#xff0c;有一些分散的神秘岛屿&#xff0c;每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路&#xff0c;方便运输。 不同岛屿之间&#xff0c;路途距离不同&#xff0c;国王希望你可以规划建公路的方案&#xff0c;如何…