当前位置: 首页 > news >正文

HBase Java基础操作

Apache HBase 是一个开源的、分布式的、可扩展的大数据存储系统,它基于 Google 的 Bigtable 模型。使用 Java 操作 HBase 通常需要借助 HBase 提供的 Java API。以下是一个基本的示例,展示了如何在 Java 中连接到 HBase 并执行一些基本的操作,如创建表、插入数据、扫描表以及删除数据。

一、前提条件

HBase 安装和配置:确保 HBase 已经在你的环境中正确安装和配置。
Hadoop 环境:HBase 依赖于 Hadoop,因此 Hadoop 也需要正确安装和配置。
HBase Java 客户端库:你需要将 HBase 的客户端库添加到你的 Java 项目中。通常,这可以通过 Maven 或 Gradle 来完成。

二、Maven 依赖

使用 Maven 来管理项目依赖,可以在 pom.xml 文件中添加以下依赖:

<dependencies><dependency><groupId>org.apache.hbase</groupId><artifactId>hbase-client</artifactId><version>2.4.9</version> <!-- 请根据你的 HBase 版本选择合适的版本 --></dependency><dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-common</artifactId><version>3.3.1</version> <!-- 请根据你的 Hadoop 版本选择合适的版本 --></dependency>
</dependencies>

三、建立连接

在使用HBase Java API之前,首先需要建立与HBase的连接。这通常涉及到配置HBase的连接信息,如Zookeeper的地址和端口等。

Configuration configuration = HBaseConfiguration.create();
configuration.set("hbase.zookeeper.quorum", "your_zookeeper_quorum"); // 设置Zookeeper的地址
configuration.set("hbase.zookeeper.property.clientPort", "your_zookeeper_port"); // 设置Zookeeper的端口
Connection connection = ConnectionFactory.createConnection(configuration);

四、对表的操作

  1. 创建表
    创建表需要指定表名和列族。HBase中的表是由列族构成的,每个列族下可以包含多个列。
Admin admin = connection.getAdmin();
if (!admin.tableExists(TableName.valueOf("your_table_name"))) {HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf("your_table_name"));tableDescriptor.addFamily(new HColumnDescriptor("your_column_family"));admin.createTable(tableDescriptor);
}
  1. 删除表
    在删除表之前,需要先禁用该表。
if (admin.tableExists(TableName.valueOf("your_table_name"))) {admin.disableTable(TableName.valueOf("your_table_name"));admin.deleteTable(TableName.valueOf("your_table_name"));
}
  1. 判断表是否存在
boolean exists = admin.tableExists(TableName.valueOf("your_table_name"));
  1. 列出所有表
HTableDescriptor[] tables = admin.listTables();
for (HTableDescriptor table : tables) {System.out.println(table.getNameAsString());
}

五、对数据的操作

  1. 添加数据
    添加数据需要指定表名、行键、列族、列名以及对应的值。
Table table = connection.getTable(TableName.valueOf("your_table_name"));
Put put = new Put(Bytes.toBytes("your_row_key"));
put.addColumn(Bytes.toBytes("your_column_family"), Bytes.toBytes("your_column"), Bytes.toBytes("your_value"));
table.put(put);
table.close();
  1. 获取数据
    获取数据可以使用Get类来指定要获取的行键和列。
Table table = connection.getTable(TableName.valueOf("your_table_name"));
Get get = new Get(Bytes.toBytes("your_row_key"));
get.addColumn(Bytes.toBytes("your_column_family"), Bytes.toBytes("your_column"));
Result result = table.get(get);
byte[] value = result.getValue(Bytes.toBytes("your_column_family"), Bytes.toBytes("your_column"));
String valueStr = Bytes.toString(value);
table.close();
  1. 扫描数据
    扫描数据可以使用Scan类来指定要扫描的表、列族、列等条件。
Scan scan = new Scan();
scan.setCaching(500); // 设置每次扫描的缓存大小
scan.setCacheBlocks(false); // 设置是否缓存数据块
scan.addFamily(Bytes.toBytes("your_column_family")); // 添加要扫描的列族ResultScanner scanner = table.getScanner(scan);
for (Result result : scanner) {// 处理扫描结果byte[] rowKey = result.getRow();String rowKeyStr = Bytes.toString(rowKey);// 获取指定列的值byte[] value = result.getValue(Bytes.toBytes("your_column_family"), Bytes.toBytes("your_column"));String valueStr = Bytes.toString(value);// 输出结果System.out.println("RowKey: " + rowKeyStr + ", Value: " + valueStr);
}
scanner.close();
table.close();
  1. 删除数据
    删除数据需要指定表名、行键以及要删除的列(可选)。
Table table = connection.getTable(TableName.valueOf("your_table_name"));
Delete delete = new Delete(Bytes.toBytes("your_row_key"));
delete.addColumn(Bytes.toBytes("your_column_family"), Bytes.toBytes("your_column")); // 可选,指定要删除的列
table.delete(delete);
table.close();

六、关闭连接

在完成所有操作后,需要关闭与HBase的连接以释放资源。

connection.close();

七、示例代码

以下是一个完整的 Java 示例代码,展示了如何连接到 HBase 并执行基本的操作:

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;import java.io.IOException;public class HBaseExample {public static void main(String[] args) {// 创建 HBase 配置对象Configuration config = HBaseConfiguration.create();config.set("hbase.zookeeper.quorum", "localhost"); // 设置 Zookeeper 地址config.set("hbase.zookeeper.property.clientPort", "2181"); // 设置 Zookeeper 端口// 创建连接对象try (Connection connection = ConnectionFactory.createConnection(config);Admin admin = connection.getAdmin()) {// 创建表createTable(admin, "my_table", "my_column_family");// 插入数据insertData(connection, "my_table", "row1", "my_column_family", "column1", "value1");// 扫描表scanTable(connection, "my_table");// 删除数据deleteData(connection, "my_table", "row1", "my_column_family", "column1");// 删除表(可选)// deleteTable(admin, "my_table");} catch (IOException e) {e.printStackTrace();}}private static void createTable(Admin admin, String tableName, String columnFamily) throws IOException {TableName table = TableName.valueOf(tableName);if (!admin.tableExists(table)) {HTableDescriptor tableDescriptor = new HTableDescriptor(table);HColumnDescriptor columnDescriptor = new HColumnDescriptor(columnFamily);tableDescriptor.addFamily(columnDescriptor);admin.createTable(tableDescriptor);System.out.println("Table created: " + tableName);} else {System.out.println("Table already exists: " + tableName);}}private static void insertData(Connection connection, String tableName, String rowKey, String columnFamily, String column, String value) throws IOException {TableName table = TableName.valueOf(tableName);try (Table table = connection.getTable(table)) {Put put = new Put(Bytes.toBytes(rowKey));put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(column), Bytes.toBytes(value));table.put(put);System.out.println("Data inserted: " + rowKey + ", " + column + " = " + value);}}private static void scanTable(Connection connection, String tableName) throws IOException {TableName table = TableName.valueOf(tableName);try (Table table = connection.getTable(table);ResultScanner scanner = table.getScanner(new Scan())) {for (Result result : scanner) {System.out.println("Scanned row: " + Bytes.toString(result.getRow()));result.getNoVersionMap().forEach((family, familyMap) -> {familyMap.forEach((qualifier, value) -> {System.out.println("Family: " + Bytes.toString(family) + ", Qualifier: " + Bytes.toString(qualifier) + ", Value: " + Bytes.toString(value.get()));});});}}}private static void deleteData(Connection connection, String tableName, String rowKey, String columnFamily, String column) throws IOException {TableName table = TableName.valueOf(tableName);try (Table table = connection.getTable(table)) {Delete delete = new Delete(Bytes.toBytes(rowKey));delete.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(column));table.delete(delete);System.out.println("Data deleted: " + rowKey + ", " + column);}}private static void deleteTable(Admin admin, String tableName) throws IOException {TableName table = TableName.valueOf(tableName);if (admin.tableExists(table)) {admin.disableTable(table);admin.deleteTable(table);System.out.println("Table deleted: " + tableName);} else {System.out.println("Table does not exist: " + tableName);}}
}

说明

  1. 创建配置对象:使用 HBaseConfiguration.create() 创建 HBase 配置对象,并设置 Zookeeper 的地址和端口。
  2. 创建连接对象:使用 ConnectionFactory.createConnection(config) 创建 HBase 连接对象。
  3. 创建表:通过 Admin 接口的 createTable 方法创建表。
  4. 插入数据:使用 Put 对象将数据插入到指定的表中。
  5. 扫描表:使用 Scan 对象扫描表并获取数据。
  6. 删除数据:使用 Delete 对象删除指定的数据。
  7. 删除表:如果需要删除表,可以先禁用表,然后删除表(此操作在示例中是注释掉的,以防止意外删除)。

注意事项

  • 确保 HBase 和 Zookeeper 正在运行,并且配置正确。
  • 根据你的 HBase 和 Hadoop 版本调整依赖版本。
  • 在生产环境中,务必进行充分的错误处理和资源管理(如关闭连接和释放资源)。

相关文章:

HBase Java基础操作

Apache HBase 是一个开源的、分布式的、可扩展的大数据存储系统&#xff0c;它基于 Google 的 Bigtable 模型。使用 Java 操作 HBase 通常需要借助 HBase 提供的 Java API。以下是一个基本的示例&#xff0c;展示了如何在 Java 中连接到 HBase 并执行一些基本的操作&#xff0c…...

关于一次开源java spring快速开发平台项目RuoYi部署的记录

关于一次开源java spring快速开发平台项目RuoYi部署的记录 本次因为需要一些练习环境&#xff0c;想要快速搭建一个javaweb 项目作为练习环境&#xff0c;经过查询和实验找到一个文档详细&#xff0c;搭建简单&#xff0c;架构也相对比较新的开源项目RuoYi。 项目介绍&#xf…...

【AI编程实战】安装Cursor并3分钟实现Chrome插件(保姆级)

Cursor介绍 https://www.cursor.com/ 一句话介绍&#xff1a;AI代码编辑器&#xff0c;当前最火的AI编程器 软件下载与安装 下载 打开Cursor官网下载&#xff0c;会根据操作系统的差别进行选择 https://www.cursor.com/ 这里下载的内容很小&#xff0c;是个安装器&#x…...

【Chatgpt】如何通过分层Prompt生成更加细致的图文内容

如何通过分层Prompt生成更加细致的图文内容 利用ChatGPT和类似的生成式AI模型&#xff0c;通过分层Prompt设计可以生成更具层次感和细节的图文内容。分层Prompt的核心在于将需求分解成多层次的指令&#xff0c;从宏观到微观逐步细化&#xff0c;最终形成高质量的内容输出。 一…...

中间件--laravel进阶篇

laravel版本11.31,这中间件只有3种,分别是全局中间件,路由中间件,控制器中间件。相比thinkphp8,少了一个应用中间件。 一、创建中间件 laravel创建中间件可以使用命令的方式创建,非常方便。比如php artisan make:middleware EnsureTokenIsValid。EnsureTokenIsValid是中间…...

【vue】vue中.sync修饰符如何使用--详细代码对比

.sync修饰符作用 .sync修饰符是一个语法糖&#xff0c;可以简化父子组件通信操作&#xff0c;当子组件想改变父组件数值时&#xff0c;父组件只需要使用.sync修饰符&#xff0c;子组件使用props接收属性&#xff0c;再使用this.$emit(update:属性, 值);就可以实现子组件更新父…...

repmgr安装及常用运维指令

简介 repmgr 由 EDB 与其他个人和组织的贡献一起开发&#xff0c;安装部署相对较为简单 安装 repmgr官网上传对应的安装到服务器上 安装前/etc/hosts IP映射、始终同步、免密通信本文忽略 repmgr的安装相对较为简单,目前repmgr-5仅仅支持到postgresql-15 postgresql必要参数…...

RedHat系统配置静态IP

1、执行nmtui命令进入字符配置界面如下图所示 2、选择编辑连接进入 3、选择编辑进入后&#xff0c;将IPv4设置为手动模式后&#xff0c;选择显示后进行ip地址、网关、DNS的配置&#xff0c;配置完成后选择确定退出编辑 4、进入主界面后选择启用连接进入后&#xff0c;选择启用&…...

nvm和nrm的安装与使用

NVM相关请跳转&#xff1a; Node版本管理器nvm的安装与使用 nrm 的安装与使用 nrm&#xff08;NPM Registry Manager&#xff09;是一个用于管理和切换 NPM 源的工具。它允许你在多个 NPM 源之间快速切换&#xff0c;以提高包管理的速度和效率。以下是 nrm 的安装和使用方法&…...

10大核心应用场景,解锁AI检测系统的智能安全之道

随着工业化和自动化的快速推进&#xff0c;高风险作业场景的安全管理需求日益增加。思通数科AI检测系统以深度学习、计算机视觉和多模态数据融合技术为基础&#xff0c;通过智能化监控和实时反馈&#xff0c;为企业提供全面的作业安全和流程管理解决方案。本文将详细解读该系统…...

香豆烤馍:传统美食中的烟火记忆

食家巷香豆烤馍&#xff0c;承载着甘肃人的乡愁与记忆。它那朴实的外表下&#xff0c;蕴含着丰富的口感和深厚的文化底蕴。烤馍的制作过程充满了烟火气息。选用优质的面粉&#xff0c;经过发酵、揉制等多道工序&#xff0c;再放入传统的烤炉中慢慢烘烤。这个过程需要经验丰富的…...

金融量化交易模型的探索与发展

随着全球金融市场的不断变化与技术进步&#xff0c;量化交易逐渐成为机构和个人投资者的重要选择。作为数据驱动的交易方式&#xff0c;量化交易通过科学建模和技术手段&#xff0c;有效提升了交易效率与决策精准度。本文将探讨金融量化交易模型的创新探索与未来发展方向。 量化…...

灾难恢复计划 (DRP)

灾难恢复计划 (DRP)   目录 灾难恢复计划 (DRP) 1 1. 简介 2 2. 目的 2 3. 范围 3 4. 风险评估 3 5. 容灾方案 3 6. 关键系统恢复优先级 4 7. 恢复流程 4 8. 测试与维护 5 9. 联系信息 5 10. 批准与分发 5 11. 附录 5 1. 简介 灾难恢复计…...

Makefile 之 wordlist

wordlist $(wordlist <s>,<e>,<text> ) 名称&#xff1a;取单词串函数——wordlist。 功能&#xff1a;从字符串<text>中取从<s>开始到<e>的单词串。<s>和<e>是一个数字。 返回&#xff1a;返回字符串<text>中从…...

半导体工艺与制造篇1 绪论

我们为什么要研究半导体&#xff1f;半导体凭什么可以成为电子信息行业的基础呢&#xff1f; 这就要说到半导体的一个重要特点&#xff1a;可以通过控制掺杂率来控制它的导电性 集成电路IC的生产 集成电路IC的生产包括&#xff1a; #mermaid-svg-rWB59zU4pI2cGloo {font-fami…...

接雨水

接雨水 1、 题目描述2、解题思路 1、 题目描述 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&#xff0c;计算按此排列的柱子&#xff0c;下雨之后能接多少雨水。 2、解题思路 本题使用了双指针&#xff0c;根据下图可以得出&#xff0c;下标 i 处能接的雨水量由左边…...

Python蓝桥杯刷题1

1.确定字符串是否包含唯一字符 题解&#xff1a;调用count函数计算每一个字符出现的次数&#xff0c;如果不等于1就输出no&#xff0c;并且结束循环&#xff0c;如果等于1就一直循环直到计算到最后一个字符&#xff0c;若最后一个字符也满足条件&#xff0c;则输出yes import…...

实习冲刺第二十七天

3.无重复字符的最长字串 给定一个字符串 s &#xff0c;请你找出其中不含有重复字符的 最长 子串 的长度。 示例 1: 输入: s "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc"&#xff0c;所以其长度为 3。示例 2: 输入: s "bbbb…...

el-table-column自动生成序号在序号前插入图标

实现效果&#xff1a; 代码如下&#xff1a; 在el-table里加入这个就可以了&#xff0c;需要拿到值可以用scope.$index ​​​​​​​<el-table-column type"index" label"序号" show-overflow-tooltip"true" min-width"40">…...

前端工程化-node/npm/babel/polyfill/webpack 一文速通

文章主要介绍了前端工程化的相关内容&#xff0c;包括 Node 环境、npm 包管理器及其命令、配置和镜像&#xff0c;package.json 文件&#xff0c;babel 和 polyfill 用于解决 JavaScript 兼容性问题&#xff0c;以及 webpack 这一前端构建工具的作用、核心概念、构建流程、安装…...

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来

一、破局&#xff1a;PCB行业的时代之问 在数字经济蓬勃发展的浪潮中&#xff0c;PCB&#xff08;印制电路板&#xff09;作为 “电子产品之母”&#xff0c;其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透&#xff0c;PCB行业面临着前所未有的挑战与机遇。产品迭代…...

Oracle查询表空间大小

1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...

相机Camera日志实例分析之二:相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我&#xff0c;后续持续新增专题博文&#xff0c;谢谢&#xff01;&#xff01;&#xff01;】 上一篇我们讲了&#xff1a; 这一篇我们开始讲&#xff1a; 目录 一、场景操作步骤 二、日志基础关键字分级如下 三、场景日志如下&#xff1a; 一、场景操作步骤 操作步…...

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

解密LSTM与GRU&#xff1a;如何让RNN变得更聪明&#xff1f; 在深度学习的世界里&#xff0c;循环神经网络&#xff08;RNN&#xff09;以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而&#xff0c;传统RNN存在的一个严重问题——梯度消失&#…...

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张(Windows/Linux)

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况&#xff0c;可以通过以下几种方式模拟或触发&#xff1a; 1. 增加CPU负载 运行大量计算密集型任务&#xff0c;例如&#xff1a; 使用多线程循环执行复杂计算&#xff08;如数学运算、加密解密等&#xff09;。运行图…...

全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比

目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec&#xff1f; IPsec VPN 5.1 IPsec传输模式&#xff08;Transport Mode&#xff09; 5.2 IPsec隧道模式&#xff08;Tunne…...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合

在汽车智能化的汹涌浪潮中&#xff0c;车辆不再仅仅是传统的交通工具&#xff0c;而是逐步演变为高度智能的移动终端。这一转变的核心支撑&#xff0c;来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒&#xff08;T-Box&#xff09;方案&#xff1a;NXP S32K146 与…...

MFC 抛体运动模拟:常见问题解决与界面美化

在 MFC 中开发抛体运动模拟程序时,我们常遇到 轨迹残留、无效刷新、视觉单调、物理逻辑瑕疵 等问题。本文将针对这些痛点,详细解析原因并提供解决方案,同时兼顾界面美化,让模拟效果更专业、更高效。 问题一:历史轨迹与小球残影残留 现象 小球运动后,历史位置的 “残影”…...

Razor编程中@Html的方法使用大全

文章目录 1. 基础HTML辅助方法1.1 Html.ActionLink()1.2 Html.RouteLink()1.3 Html.Display() / Html.DisplayFor()1.4 Html.Editor() / Html.EditorFor()1.5 Html.Label() / Html.LabelFor()1.6 Html.TextBox() / Html.TextBoxFor() 2. 表单相关辅助方法2.1 Html.BeginForm() …...