DataLight(V1.4.5) 版本更新,新增 Ranger、Solr
DataLight(V1.4.5) 版本更新,新增 Ranger、Solr
DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已有功能进行了改进,旨在提升更好的使用体验。
一. 更新日志
-
新增 SOLR 服务:
- 支持 Solr 服务的部署与维护,为用户提供强大的全文搜索和索引功能,方便对大数据集进行高效检索。
-
新增 RANGER 服务:
- 支持 RangerAdmin、RangerUserSync、RangerTagSync 的部署与管理,实现集中的权限控制和安全审计。
新增 RANGER 插件:
- RANGER-HDFS 插件:
- 支持文件和目录级别的权限控制。
- 提供详细的访问审计日志,满足合规性要求。
- RANGER-YARN 插件:
- 管理作业提交和队列级别的访问权限。
- 防止资源滥用,确保资源的公平分配和安全性。
- RANGER-HBASE 插件:
- 实现表、列族、列级别的权限管理。
- 保障数据的读写安全,防止未经授权的操作。
- RANGER-KAFKA 插件:
- 设置主题和消费组的访问权限。
- 保护消息的生产和消费环节,确保数据传输安全。
- RANGER-HIVE 插件:
- 提供行、列、单元格级别的访问控制。
- 具备数据脱敏功能,保护敏感信息。
- RANGER-SOLR 插件:
- 控制查询和索引的访问权限。
- 防止未经授权的搜索和数据泄露。
-
优化日志管理的滚动效果:
新增用户身份判定机制,解决了除
root
用户外其他普通用户无法登录的问题,提升了系统的安全性和用户友好性。 -
优化配置文件联动机制:
当 Ranger 服务部署或发生变动时,系统将自动联动修改相关服务的配置文件,减少手动操作的繁琐,降低错误发生的可能性。
-
新增脚本耗时显示:
在执行
datalight.sh
操作 Master 和 Worker 进程时,增加了耗时打印功能,方便用户了解操作执行时间,优化性能调试流程。
二. 部分更新内容预览
2.1 新增 Ranger、Solr 服务
2.2 RangerAdmin
提供友好的 Web 界面,可以方便地创建、修改和查看权限策略。
2.3 RangerUserSync
支持从 LDAP、Active Directory 或本地 Unix 系统同步用户和组信息,确保权限管理的准确性和同步性。
2.4 SolrServer
支持 Solr 集群部署,提供容错和负载均衡能力,且支持全文检索、模糊查询、范围查询等多种查询方式,满足多样化的业务需求。
2.5 一键启用、禁用 Ranger 插件
在 DataLight 平台上,可以一键启用或禁用各服务的 Ranger 插件,灵活控制权限管理功能。
2.6 Ranger 插件审计
详细记录各服务的访问和操作日志,帮助管理员监控用户行为,防范安全风险。
2.7 Ranger 插件状态
在平台上查看各 Ranger 插件的运行状态,及时发现和处理异常情况,保障系统稳定运行。
2.8 优化脚本耗时显示
增加了 datalight.sh
脚本操作过程的耗时打印,帮助用户分析和优化系统性能,提升运维效率。
三. 如何增量更新到 1.4.5 版本
我们提供了详细的升级指南,帮助您顺利将现有的 DataLight 平台更新到最新版本。
3.1 停止 Master/Worker进程
进入主节点,在所有服役的节点上,执行以下命令,停止并删除所有节点上的 Master、Worker 进程:
# 停止 Master 进程
/opt/datalight/bin/datalight.sh stop master# 停止 Worker 进程
/opt/datalight/bin/datalight.sh stop worker# 删除原有的 Master、Worker Jar 包
rm -rf /opt/datalight/app/*.jar
注:Master 进程所在节点称之为主节点,下同
3.2 更新主包
前往百度网盘,下载如下内容,获取最新的主程序包。
下载完成后,将新包覆盖至 /opt/datalight
目录下,替换原有文件。
3.3 更新插件包
前往百度网盘,下载如下插件包内容,将其覆盖更新至 /opt/datalight/plugins
目录下的相应位置,确保插件版本与主程序一致。
3.4 手动分发到所有节点
将更新后的 DataLight 目录从 主节点 推送至所有 从节点。可以使用 scp
或其他同步命令进行分发。例如,将更新内容推送至节点 node02
:
# 以推送至 node02 节点为例
scp -r /opt/datalight node02:/opt
3.6 重新启动 Master 进程
进入主节点,通过以下命令启动 Master 进程,Master 进程重启后,稍等片刻,Master 将自动拉起所有节点上的 Worker 进程。
/opt/datalight/bin/datalight.sh start master 8001
四. Ranger 的功能与场景
DataLight 平台现已支持与 Ranger 深度集成,实现对各大数据组件的统一权限管理和安全审计。
-
4.1 Ranger 与 HDFS
使用场景:数据分层存储
在一个企业数据湖中,不同部门需要访问不同的数据集。Ranger 可以为每个部门设置特定的文件夹权限:
- 场景: 财务部门需要访问财务报告,但不应该访问研发数据。
- 解决方案: 使用 Ranger 创建规则,只允许财务部门的用户组访问
/data/finance
目录,而/data/research
只能由研发部门访问。 - 好处: 确保数据隔离,防止敏感信息泄露。
4.2 Ranger 与 YARN
使用场景:资源公平调度
在共享计算资源的环境中,确保不同用户的公平使用:
- 场景: 数据科学团队和营销团队共享一个 YARN 集群。
- 解决方案: 通过 Ranger 限制每个团队提交的作业数量和资源使用量。
- 好处: 防止某一团队过度占用资源,提升整体资源利用率。
4.3 Ranger 与 HBase
使用场景:客户数据保护
公司需要存储和处理敏感的客户信息,确保数据安全:
- 场景: 客户服务团队需要访问客户联系信息,但不应查看财务数据。
- 解决方案: 使用 Ranger 在 HBase 中设置列级权限,允许访问
contact_info
列族,而限制financial_data
。 - 好处: 保护敏感数据,符合隐私法规要求。
4.4 Ranger 与 Hive
使用场景:敏感数据分析
在执行大规模数据分析时,保护敏感数据:
- 场景: 分析师需要访问销售数据进行趋势分析,但不应查看具体客户信息。
- 解决方案: 在 Hive 中设置列级权限,允许访问销售数据列,但限制客户信息列。
- 好处: 保证分析的同时,保护个人隐私。
4.5 Ranger 与 Kafka
使用场景:日志数据流管理
管理跨部门的日志数据流:
- 场景: 安全团队和开发团队需要访问不同的日志数据。
- 解决方案: 使用 Ranger 设置 Kafka 主题权限,安全团队可以访问
security_logs
主题,而开发团队访问app_logs
。 - 好处: 确保数据流的安全性和隐私性。
4.6 Ranger 与 Solr
使用场景:搜索查询控制
在企业搜索平台中,管理不同用户的查询权限:
- 场景: 员工可以搜索公共文档,但只有人力资源可以搜索员工记录。
- 解决方案: 使用 Ranger 控制 Solr 查询权限,限制员工只能搜索公共索引。
- 好处: 防止敏感信息泄露,确保合规性。
关注我们,获取更多最新资讯。
一起见证数据世界的无限可能!
相关文章:
DataLight(V1.4.5) 版本更新,新增 Ranger、Solr
DataLight(V1.4.5) 版本更新,新增 Ranger、Solr DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已…...
深度解析:Python蓝桥杯青少组精英赛道与高端题型概览
目录 一、蓝桥杯青少组简介二、赛项组别与年龄范围三、比赛内容与题型1. 基础知识范围2. 题型设置2.1 选择题2.2 编程题 3. 考试时长 四、奖项设置与激励措施五、总结 一、蓝桥杯青少组简介 蓝桥杯全国软件和信息技术专业人才大赛(简称“蓝桥杯”)是由工…...
如何使用SCCMSecrets识别SCCM策略中潜在的安全问题
关于SCCMSecrets SCCMSecrets是一款针对SCCM策略的安全扫描与检测工具,该工具旨在提供一种有关 SCCM 策略的全面安全检测方法。 该工具可以从各种权限级别执行,并将尝试发现与策略分发相关的潜在错误配置。除了分发点上托管的包脚本外,它还将…...
Qt 信号重载问题--使用lambda表达式--解决方法
在connect()中,使用lambda表达式时遇到信号重载,无法识别使用哪个参数时,可通过以下方法处理: 1. 使用QOverload: Qt5.7才有 connect(comboBox,QOverload<int>::of(&QComboBox::currentIndexChanged), [](int index)…...
并行编程实战——TBB框架的应用之一Supra的基础
一、TBB的应用 在前面分析了TBB框架的各种基本知识和相关的基础应用。这些基础的应用很容易通过学习文档或相关的代码来较为轻松的掌握。为了能够更好的理解TBB框架的优势,这里从一个开源的应用程序来分析一下TBB在其中的更高一层的抽象应用,以方便开发…...
std::vector
std::vector是C标准库中一个非常强大的容器类,它提供了动态数组的功能。std::vector可以自动调整大小,提供了随机访问的能力,同时还支持在序列的尾部高效地添加和删除元素。 当创建一个空的std::vector对象时,它不分配任何内存&a…...
Java Web 之 Cookie 详解
在 JavaWeb 开发中,Cookie 就像网站给浏览器贴的小纸条,用于记录一些用户信息或状态,方便下次访问时识别用户身份或进行个性化服务。 也可以这么理解: 场景一:想象一下,你去一家咖啡店,店员认…...
linux系统下让.py文件开机自启动
一 创建服务文件 1、打开终端 2、切换到root用户 sudo su3、创建一个新的systemd服务文件 nano /etc/systemd/system/total_test0619.service 4、在服务文件中添加以下内容 [Unit] DescriptionRun total_test0619.py at startup[Service] Typesimple ExecStart/usr/bin/n…...
linux远程桌面:xrdp 安装失败
window 如何远程 Linux 桌面 安装xrdp yum install xrdpsystemctl start xrdp 如果找不到软件包,就安装epel源,最好改成国内镜像的 在 /etc/yum.repos.d/ 下创建epel.repo,内容如下 [epel] nameExtra Packages for Enterprise Linux 7 - $basearch …...
9.30Python基础-元组(补充)、字典、集合
Python元组(tuple)补充 1、元组的不可变性 元组(tuple)是Python中的一种内置数据类型,用于存储不可变的序列。虽然元组本身不可变,但元组内的元素如果是可变对象(如列表)ÿ…...
桥接模式和NET模式的区别
桥接模式和NET模式的区别 NAT模式: NAT:网络地址转换(模式):借助宿主机来上网,没桥接那么麻烦,只用配置DNS即可。 缺点:扎根于宿主机,不能和局域网内其它真实的主机进行…...
Pigar:Python 项目的依赖管理利器
🌟 引言 在Python项目开发过程中,依赖管理是一个不可忽视的环节。一个精确且易于维护的requirements.txt文件对于项目的部署和协作至关重要。今天,我们将介绍一款名为Pigar的自动生成requirements.txt文件的依赖管理工具,它通过一…...
泰勒图 ——基于相关性与标准差的多模型评价指标可视化比较-XGBoost、sklearn
1、基于相关性与标准差的多模型评价指标可视化比较 # 数据读取并分割 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split plt.rcParams[font.family] = Times New Roman plt.rcParams[axes.unic…...
记录|Modbus-TCP产品使用记录【摩通传动】
目录 前言一、摩通传动实验图1.1 配置软件 IO_Studio1.2 测试软件Modbus Poll1.2.1 读写设置测试1.2.2 AI信号的读取 1.3 对应的C#连接Modbus的测试代码如下【自制,仅供参考】1.4 最终实验图 更新时间 前言 参考文章: 自己需要了解和对比某些产品的Modbu…...
工业交换机的RMON
工业交换机在现代网络中扮演着至关重要的角色,它不仅负责数据的高效传输,还具备强大的监控和管理能力。其中,RMON(远程监控)功能使得交换机的性能得以进一步提升,成为网络管理的重要工具。RMON提供了一种先…...
生态遥感数据下载分享
中国土壤湿度/土壤水分数据集(2000-2020) 下载网站:https://poles.tpdc.ac.cn/zh-hans/data/49b22de9-5d85-44f2-a7d5-a1ccd17086d2/#:~:text%E6%88%91%E4%BB%AC%E6%8F%90%E4%BE%9B%E4%BA%86%E4%B8%AD%E5%9B%BD%E8%8C%83 note: The data can …...
ECharts 快速使用
最终效果 使用介绍 echarts图表的绘制,大体分为三步: 根据 DOM实例,通过 echarts.init方法,生成 echarts实例构建 options配置对象,整个echarts的样式,皆有该对象决定最后通过实例.setOption方法…...
进程--消息队列和共享内存
目录 消息队列 创建消息队列 删除消息队列 发送消息和接收 消息队列 消息队列就是一个消息的列表,进程可以在消息队列中添加消息和的读取消息 消息队列具有FIFO的特性,具有无名管道与有名管道各自的优势,可以支持任意两个进程的进程间通讯…...
useCallback()
官网直达:https://zh-hans.react.dev/reference/react/useCallback 点击按钮,子组件会重新渲染 import { memo, useState, useCallback } from react;const Child (props) > {console.log(我是子组件!我在渲染呢!࿰…...
Python面试题精选及解析--第二篇
在Python的面试中,除了基础语法和常用库的知识外,面试官往往还会通过一系列的问题来考察应聘者的逻辑思维、问题解决能力以及项目经验。以下是一些精心挑选的Python面试题及其详细答案,旨在帮助求职者更好地准备面试。 面试题一:…...
Linux操作常用问题
目录 Ubuntu操作问题vi编辑方向键键盘乱码回退键不能使用的问题解决问题的方法 Ubuntu操作问题 vi编辑方向键键盘乱码回退键不能使用的问题 编辑/etc/systemd/resolved.conf文件来修改DNS,结果编辑时键盘乱码,按下方向键会出现ABCD,且回退键…...
汽车发动机系统(ems)详细解析
汽车发动机系统EMS,即Engine-Management-System(发动机管理系统),是现代汽车电子控制技术的重要组成部分。以下是对汽车发动机系统EMS的详细解析,内容将涵盖其定义、工作原理、主要组成、功能特点、技术发展以及市场应…...
对比学习训练是如何进行的
对比学习(Contrastive Learning)是一种自监督学习的方法,旨在通过拉近相似样本的表示、拉远不相似样本的表示来学习特征表示。在训练过程中,模型并不依赖标签,而是通过样本之间的相似性进行学习。以下是对比学习的基本…...
React 生命周期 - useEffect 介绍
在 React 中,useEffect 钩子可以被看作是函数组件中的一种副作用管理工具,它的行为可以模拟类组件中的不同生命周期方法。useEffect 的执行时机取决于其依赖项数组(第二个参数)的设置方式。 根据 useEffect 的使用方式,…...
OpenCV-指纹识别
文章目录 一、意义二、代码实现1.计算匹配点2.获取编号3.获取姓名4.主函数 三、总结 一、意义 使用OpenCV进行指纹识别是一个复杂且挑战性的任务,因为指纹识别通常需要高精度的特征提取和匹配算法。虽然OpenCV提供了多种图像处理和计算机视觉的工具,但直…...
IPD的核心思想
IPD是一套领先的、成熟的研发管理思想、模式和方法。它是根据大量成功的研发管理实践总结出来的,并被大量实践证明的高效的产品研发模式。 那么,按照IPD来开展产品研发与产品管理工作,应该基于哪些基本思想或原则?市场导向、客户…...
如何在算家云搭建MVSEP-MDX23(音频分离)
一、MVSEP-MDX23简介 模型GitHub网址:MVSEP-MDX23-music-separation-model/README.md 在 main ZFTurbo/MVSEP-MDX23-音乐分离模型 GitHub 上 在音视频领域,把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有…...
常用的Java安全框架
Spring Security: 就像Java安全领域的“瑞士军刀”,功能全面且强大。 支持认证、授权、加密、会话管理等安全功能。 与Spring框架无缝集成,使用起来特别方便。 社区活跃,文档丰富,遇到问题容易找到解决方案。 Apach…...
使用 PHP 的 strip_tags函数保护您的应用安全
在现代 web 开发中,处理用户输入是一项常见的任务。然而,用户输入的内容往往包含 HTML 或 PHP 标签,这可能会导致安全漏洞,如跨站脚本攻击(XSS)。为了解决这个问题,PHP 提供了一个非常有用的函数…...
您的计算机已被Lockbit3.0勒索病毒感染?恢复您的数据的方法在这里!
导言 在数字化时代,互联网已成为我们生活、工作和学习中不可或缺的一部分。然而,随着网络技术的飞速发展,网络安全威胁也日益严峻。其中,勒索病毒作为一种极具破坏性的网络攻击手段,正逐渐成为企业和个人面临的重大挑…...
自做装逼头像网站/关键词推广优化app
TCP主动关闭连接 appl: close(), --> FIN FIN_WAIT_1 //主动关闭socket方,调用close关闭socket,发FIN <-- ACK FIN_WAIT_2 //对方操作系统的TCP层,给ACK响应。然后给FIN <-- FIN …...
网站套餐/软文优化
环境配置 1、PHPstorm(不建议升级最新版,每次都会提醒输入密钥,超烦人!) 2、MySQL8.0 3、Navicat 15 for mysql 4、phpstudy也很好用 参考配置:https://blog.csdn.net/weixin_46336128/article/details/10…...
台州网站设计公司/宁波seo入门教程
2.标识项目的基础设施 2.1确立项目和战略策划之间的关系 1.外部环境分析 随着全球经济发展与人民生活水平的提高,游戏已成为人们不可或缺的主要娱乐部分。据360游戏2015年度报告,RPG游戏逐渐征服市场,呈现超越卡牌类游戏并取代其第一的位置 2…...
哪个网站可以做视频外链/百度识图查另一半情头
04年IM软件评测:表情贴图(转)测试项目三 聊天辅助之表情贴图 朗玛UC UC的表情图标看起来比较可爱,无论是创意和颜色选取都属于上乘之作,它的默认贴图总数高达80个了,软件支持自定义表情贴图上传,还能够进行聊天表情贴…...
网站单个页面做301/爱站网seo综合查询
j3_liuliang快捷(quick)点餐(dine)系统(sys)设计文档,前期暂定后期出现问题再改 项目相关文章导航: 快捷点餐项目简介餐饮系统设计概括餐饮系统店家后端基础功能构建快捷餐饮之店家…...
网站 黄色/如何做网站建设
核心代码 File file new File(PATH_LOGCAT);if (!file.exists()) {file.mkdirs();Log.e("wy","创建文件夹1");}全部代码 private void init(Context context) {if (Environment.getExternalStorageState().equals(Environment.MEDIA_MOUNTED)) {// 优先保…...