OceanBase v4.2 特性解析:对Json与Xml的扩展支持
1. 背景
OceanBase的Oracle模式当前已实现对XMLType类型的支持,不仅包含了基本的构造、查询、更新以及格式转换功能,还支持使用Xpath查询从XML数据中提取特定值。在V 4.2.2 版本中,我们进一步扩展了Oracle模式下对XMLType的支持,新增了通过XMLTable将XML数据转换为关系表的能力,同时提供了在XML中删除和插入特定片段的功能。此外,OB在MySQL模式下也提供了与MySQL 8.0相同的XML表达式。
关于Json,本期特性在 MySQL模式下,补充了JSON Schema的校验能力,MySQL模式已经支持了MySQL 8.0的所有Json表达式;此外,在OB-Oracle模式下补充了PL下的JSON_ARRAY_T类型。
1.1. XML部分
特性1: 将XML数据从半结构化数据转为结构化数据
新增XMLTABLE、XMLSEQUENCE两个表达式,在原来增删改查的基础上拓展了XML功能。
XMLTABLE能力包括:
- 数据抽取能力。
XMLTABLE中可以指定父xpath抽取所需数据。
- 半结构化数据结构化能力。
XMLTABLE可以将XML数据的各个部分映射到虚拟表的行和列中,生成一个结构化的表信息,方便查询。也可以将生成的虚拟表插入到新表或者视图中。
XMLSEQUENCE将一个XML中的顶层原元素放到一个数组中,结合Table函数也可实现部分XMLTABLE的能力。
特性2: 补充对XML内容修改的能力
- 插入: INSERTCHILDXML在XML内容中插入指定XML片段;
- 删除: DELETEXML删除指定XML片段。
特性3: MySQL模式下的XML功能
补充MySQL的XML表达式功能:EXTRACTVALUE、UPDATEXML。
1.2. JSON部分
特性1: JSON SCHEMA功能支持
新增JSON SCHEMA相关2个表达式:JSON_SCHEMA_VALID和JSON_SCHEMA_VALIDATION_REPORT。使用JSON SCHEMA 验证输入的JSON数据是否符合要求。
特性2: JSON表达式补齐
补充JSON_ARRAY_T、JSON_ARRAY_APPEND表达式。
2. 使用操作
2.1. 本次特性支持的表达式总览
| 模块 | 表达式名称 | 功能简述 |
| MySQL | JSON_SCHEMA_VALID | 符合SCHEMA则返回true,不符合则返回false。 |
| JSON_SCHEMA_VALIDATION_REPORT | 返回JSON SCHEMA验证报告,验证报告为JSON格式。 | |
| Oracle | INSERTCHILDXML | 插入孩子节点到XML中。 |
| DELETEXML | 删除xpath表达式再XML中匹配的一个或多个节点。 | |
| MySQL | EXTRACTVALUE | 依据Xpath抽取一个XML片段,返回文本内容。 |
| UPDATEXML | 更新指定XML。 | |
| MySQL | JSON_ARRAY_APPEND | 追加值到指定路径所指向的JSON数据的末尾,并返回追加后的结果。 |
| Oracle | XMLTABLE | 将 Xpath 返回的结果映射到关系表的行和列中。 |
| Oracle | XMLSEQUENCE | 生成包含XML文档内容的XML array。 |
| Oracle | JSON_ARRAY_T | 生成JSON_ARRAY_T类型,并提供相关udf使用 |
2.2. JSON SCHEMA表达式
JSON SCHEMA 是描述 JSON 格式的一个标准模板,用于验证输入的JSON数据是否符合要求。JSON SCHEMA 本身也是一个 JSON数据,且一定是Object类型。使用Json Schema进行校验时,会同步遍历Schema和校验数据,根据遍历到的数据对应的规范去检验是否符合要求。
2.2.1. JSON_SCHEMA_VALID
符合SCHEMA则返回true,不符合则返回false。可用作列约束。
-- 符合JSON SCHEMA规范返回1, 不符合则返回0
MySQL [mydb]> SELECT JSON_SCHEMA_VALID('{"type": "string"}', '"JSON_doc"');
+-------------------------------------------------------+
| JSON_SCHEMA_VALID('{"type": "string"}', '"JSON_doc"') |
+-------------------------------------------------------+
| 1 |
+-------------------------------------------------------+
1 row in set (0.00 sec)
2.2.2. JSON_SCHEMA_VALIDATION_REPORT
返回验证报告,验证报告为JSON格式;
MySQL [mydb]> SELECT JSON_SCHEMA_VALIDATION_REPORT('{"type": "string"}', '"JSON_doc"');
+-------------------------------------------------------------------+
| JSON_SCHEMA_VALIDATION_REPORT('{"type": "string"}', '"JSON_doc"') |
+-------------------------------------------------------------------+
| {"valid": true} |
+-------------------------------------------------------------------+
1 row in set (0.00 sec)
2.3. Table相关表达式
2.3.1. Oracle XMLTABLE
XMLTABLE将 Xpath 返回的结果映射到关系行和列中。您可以使用 SQL 将函数返回的结果作为虚拟关系表进行查询。
OceanBase(SYS@SYS)>SELECT * FROM -> XMLTABLE('/ROWS/ROW' -> passing XMLtype(-> '<ROWS>'> <ROW id="20">'> <COUNTRY_ID>EG</COUNTRY_ID>'> <COUNTRY_NAME>Egypt</COUNTRY_NAME>'> <REGION_ID>1</REGION_ID>'> </ROW>'> </ROWS>')) XMLTABLE;
+---------------------------------------------------------------------------------------------------------------------+
| COLUMN_VALUE |
+---------------------------------------------------------------------------------------------------------------------+
| <ROW id="20"><COUNTRY_ID>EG</COUNTRY_ID><COUNTRY_NAME>Egypt</COUNTRY_NAME><REGION_ID>1</REGION_ID>
</ROW>|
+---------------------------------------------------------------------------------------------------------------------+
1 row in set (0.005 sec)
2.3.2. Oracle XMLSEQUENCE
返回一个varray,其中包括输入XML数据的所有顶层节点。
OceanBase(SYS@SYS)>SELECT rownum,-> column_value-> FROM TABLE(XMLSEQUENCE(extract(XMLtype('<Videogame>'> <Type>Racing</Type>'> <Name>NFS Most Wanted</Name>'> <Version>2.0</Version>'> <Size>5.5 GB</Size>'> </Videogame>'),'/Videogame/*')));
+--------+-------------------------------+
| ROWNUM | COLUMN_VALUE |
+--------+-------------------------------+
| 1 | <Type>Racing</Type>|
| 2 | <Name>NFS Most Wanted</Name>|
| 3 | <Version>2.0</Version>|
| 4 | <Size>5.5 GB</Size>|
+--------+-------------------------------+
4 rows in set (0.051 sec)
2.4. 修改XML数据的表达式
2.4.1. Oracle INSERTCHILDXML
在xpath指定的位置插入孩子节点到XML中。
OceanBase(SYS@SYS)>select INSERTCHILDXML(XMLtype(-> '<bookstore><book att="old"></book>'> <author>carrot</author>'> </bookstore>'), -> '/bookstore', -> 'price', -> XMLtype('<price>99.9</price>')) -> as result from dual;
+-----------------------------------------------------------------------------------------------+
| RESULT |
+-----------------------------------------------------------------------------------------------+
| <bookstore><book att="old"/><author>carrot</author><price>99.9</price>
</bookstore>|
+-----------------------------------------------------------------------------------------------+
1 row in set (0.007 sec)
2.4.2. Oracle DELETEXML
删除xpath表达式在XML中匹配的一个或多个节点。
OceanBase(SYS@SYS)>select DELETEXML(XMLtype('<bookstore>'> <book att="old"></book>'> <author>carrot</author>'> </bookstore>'), -> '/bookstore/author')-> as result-> from dual;
+-----------------------------------------------+
| RESULT |
+-----------------------------------------------+
| <bookstore><book att="old"/>
</bookstore>|
+-----------------------------------------------+
1 row in set (0.006 sec)
2.4.3. MySQL EXTRACTVALUE
依据Xpath抽取一个XML片段,返回文本内容。
OceanBase(root@test)>select EXTRACTVALUE('<a><b>x</b><b>y</b></a>', '/a/b') ;
+-------------------------------------------------+
| EXTRACTVALUE('<a><b>x</b><b>y</b></a>', '/a/b') |
+-------------------------------------------------+
| x y |
+-------------------------------------------------+
1 row in set (0.003 sec)
2.4.4. MySQL UPDATEXML
将XML中被Xpath指定的部分替换为新值。
OceanBase(root@test)>select UPDATEXML('<a/><b/>', '/a', '<x>carrot</x>');
+----------------------------------------------+
| UPDATEXML('<a/><b/>', '/a', '<x>carrot</x>') |
+----------------------------------------------+
| <x>carrot</x><b></b> |
+----------------------------------------------+
1 row in set (0.003 sec)
2.5. 修改JSON数据的表达式
2.5.1. JSON_ARRAY_APPEND
JSON_APPEND用于追加值到指定路径所指向的JSON数据的末尾,并返回追加后的结果。如果是数组,将追加到数组的最后,如果是非数组,则会自动生成一个JSON array并返回结果。
SET @j = '["a", ["b", "c"], "d"]';
SELECT JSON_APPEND(@j, '$[1]', 1);
+----------------------------------+
| JSON_APPEND(@j, '$[1]', 1) |
+----------------------------------+
| ["a", ["b", "c", 1], "d"] |
+----------------------------------+
2.6. Oracle JSON表达式
2.6.1. JSON_ARRAY_T
2.6.1.1. 构造函数
构造JSON_ARRAY_T
declarejo JSON_ARRAY_T;
beginjo := JSON_ARRAY_T('[123]');dbms_output.put_line(jo.to_String);
end;
/
2.6.1.2. 通过下标获取元素
declarejo JSON_ARRAY_T;jo_val JSON_ELEMENT_T;
beginjo := JSON_ARRAY_T.parse('[123,{"abc":456},[789], true, null,"test"]');FOR I IN 0 .. 5 LOOPjo_val := jo.get(i);dbms_output.put_line(jo_val.to_String);END LOOP;
end;
/
3. 未来规划
Oracle模式下,基于高频用户场景进一步补充 XML,和Json能力,如PL下的XMLGEN,XMLDOM package。MySQL模式下的XML,JSON表达式能力已经与MySQL 8.0完全对齐,MySQL模式下的JSON多值索引已在近期规划中,未来也有计划对JSON场景做进一步的性能优化。
相关文章:
OceanBase v4.2 特性解析:对Json与Xml的扩展支持
1. 背景 OceanBase的Oracle模式当前已实现对XMLType类型的支持,不仅包含了基本的构造、查询、更新以及格式转换功能,还支持使用Xpath查询从XML数据中提取特定值。在V 4.2.2 版本中,我们进一步扩展了Oracle模式下对XMLType的支持,…...
《框架封装 · 统一异常处理和返回值包装》
📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…...
深入WebKit:揭秘复杂文档的高效渲染之道
深入WebKit:揭秘复杂文档的高效渲染之道 在当今信息爆炸的时代,网页不再仅仅是简单的文本和图片的集合,而是充满了复杂布局和丰富媒体内容的交互式平台。WebKit 作为众多流行浏览器的心脏,其布局引擎承担着将 HTML、CSS 代码转换…...
进程的控制-孤儿进程和僵尸进程
孤儿进程 : 一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被 init 进程( 进程号为 1) 所收养,并由 init 进程对它们完成状态收集工作 为了释放子进程的占用的系统资源: …...
【Unity navigation面板】
【Unity navigation面板】 Unity的Navigation面板是一个集成在Unity编辑器中的界面,它允许开发者对导航网格(NavMesh)进行配置和管理。 Unity Navigation面板的一些关键特性和功能: 导航网格代理(NavMesh Agent&…...
二刷算法训练营Day53 | 动态规划(14/17)
目录 详细布置: 1. 392. 判断子序列 2. 115. 不同的子序列 详细布置: 1. 392. 判断子序列 给定字符串 s 和 t ,判断 s 是否为 t 的子序列。 字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余…...
将缓冲文件写到磁盘中的命令sync
将缓冲文件写到磁盘中的命令sync There is no nutrition in the blog content. After reading it, you will not only suffer from malnutrition, but also impotence. The blog content is all parallel goods. Those who are worried about being cheated should leave quick…...
灵活视图变换器:为扩散模型设计的革新图像生成架构
在自然界中,图像的分辨率是无限的,而现有的图像生成模型在跨任意分辨率泛化方面存在困难。虽然扩散变换器(DiT)在特定分辨率范围内表现出色,但在处理不同分辨率的图像时却力不从心。为了克服这一限制,来自上…...
[终端安全]-1 总体介绍
有朋友一直在和笔者研讨智驾安全这个热门话题,笔者十多年工作从不离终端安全这个核心话题(芯片安全、操作系统安全、应用安全),近来也一直在梳理终端安全体系;手机、汽车皆是我们生活中应用最普遍的智能终端࿰…...
Mysql5.7并发插入死锁问题
死锁的产生条件 互斥、请求和保持、不可剥夺、循环等待 MySQL锁类型 死锁复现 环境:Mysql 5.7版本,Innodb引擎,可重复度隔离级别 并发场景下使用duplicate key update插入或更新数据可能会造成死锁,下面就产生死锁的条件进行模…...
网络“ping不通”,如何排查和解决呢?
网络问题往往复杂且难以预测,其中“ping不通”是常见的网络故障之一。 1. 确认问题现象 首先,明确问题是完全无法ping通(无响应)还是ping通但有高延迟或丢包。这有助于缩小问题范围。 2. 本地检查 网络接口状态:使用ifconfig(Linux)或ipc…...
日常学习--20240706
1、udp协议的特点有哪些? a、无连接,发送和接收数据不需要建立连接,开销小,实时性好 b、不可靠传输,不保证数据包能够到达目的地,也不保证数据包的顺序 c、面向数据报的,以数据报形式发送数据…...
入门PHP就来我这(高级)12 ~ 获取数据
有胆量你就来跟着路老师卷起来! -- 纯干货,技术知识分享 路老师给大家分享PHP语言的知识了,旨在想让大家入门PHP,并深入了解PHP语言。 1 从结果集中获取一行作为对象 表中数据行如下: 利用mysqli_fetch_array()函数获…...
AIGC专栏12——EasyAnimateV3发布详解 支持图文生视频 最大支持960x960x144帧视频生成
AIGC专栏12——EasyAnimateV3发布详解 支持图&文生视频 最大支持960x960x144帧视频生成 学习前言项目特点生成效果相关地址汇总项目主页Huggingface体验地址Modelscope体验地址源码下载地址 EasyAnimate V3详解技术储备Diffusion Transformer (DiT)Hybrid Motion ModuleU-V…...
【python】python猫眼电影数据抓取分析可视化(源码+数据集+论文)【独一无二】
👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…...
Android 四大组件
1. Activity 应用程序中,一个Activity通常是一个单独的屏幕,它上面可以显示一些控件,也可以监听并对用户的事件做出响应。 Activity之间通过Intent进行通信,在Intent 的描述结构中,有两个最重要的部分:动…...
【Python】已解决:ModuleNotFoundError: No module named ‘nltk’
文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决:ModuleNotFoundError: No module named ‘nltk’ 一、分析问题背景 在使用Python进行自然语言处理或文本分析时,我们经常会用到各种库来辅助我们的工…...
【Docker系列】Docker 命令行输出格式化指南
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...
使用Netty构建高性能的网络应用
使用Netty构建高性能的网络应用 大家好,我是微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! Netty是一个基于Java NIO的异步事件驱动的网络应用框架,专为快速开发高性能、高可靠性的网络服务器和客户…...
C++11新特性【下】{lambda表达式、可变模板参数、包装器}
一、lambda表达式 在C98中,如果想要对一个数据集合中的元素进行排序,可以使用std::sort方法。如果待排序元素为自定义类型,需要用户定义排序时的比较规则,随着C语法的发展,人们开始觉得上面的写法太复杂了,…...
Python爬虫实战:研究MechanicalSoup库相关技术
一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...
Cursor实现用excel数据填充word模版的方法
cursor主页:https://www.cursor.com/ 任务目标:把excel格式的数据里的单元格,按照某一个固定模版填充到word中 文章目录 注意事项逐步生成程序1. 确定格式2. 调试程序 注意事项 直接给一个excel文件和最终呈现的word文件的示例,…...
PHP和Node.js哪个更爽?
先说结论,rust完胜。 php:laravel,swoole,webman,最开始在苏宁的时候写了几年php,当时觉得php真的是世界上最好的语言,因为当初活在舒适圈里,不愿意跳出来,就好比当初活在…...
中南大学无人机智能体的全面评估!BEDI:用于评估无人机上具身智能体的综合性基准测试
作者:Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位:中南大学地球科学与信息物理学院论文标题:BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接:https://arxiv.…...
C++ 基础特性深度解析
目录 引言 一、命名空间(namespace) C 中的命名空间 与 C 语言的对比 二、缺省参数 C 中的缺省参数 与 C 语言的对比 三、引用(reference) C 中的引用 与 C 语言的对比 四、inline(内联函数…...
自然语言处理——Transformer
自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,但是它有一个很大的缺陷——很难并行化。 我们可以考虑用CNN来替代RNN,但是…...
CSS设置元素的宽度根据其内容自动调整
width: fit-content 是 CSS 中的一个属性值,用于设置元素的宽度根据其内容自动调整,确保宽度刚好容纳内容而不会超出。 效果对比 默认情况(width: auto): 块级元素(如 <div>)会占满父容器…...
用机器学习破解新能源领域的“弃风”难题
音乐发烧友深有体会,玩音乐的本质就是玩电网。火电声音偏暖,水电偏冷,风电偏空旷。至于太阳能发的电,则略显朦胧和单薄。 不知你是否有感觉,近两年家里的音响声音越来越冷,听起来越来越单薄? —…...
【Redis】笔记|第8节|大厂高并发缓存架构实战与优化
缓存架构 代码结构 代码详情 功能点: 多级缓存,先查本地缓存,再查Redis,最后才查数据库热点数据重建逻辑使用分布式锁,二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...
CSS3相关知识点
CSS3相关知识点 CSS3私有前缀私有前缀私有前缀存在的意义常见浏览器的私有前缀 CSS3基本语法CSS3 新增长度单位CSS3 新增颜色设置方式CSS3 新增选择器CSS3 新增盒模型相关属性box-sizing 怪异盒模型resize调整盒子大小box-shadow 盒子阴影opacity 不透明度 CSS3 新增背景属性ba…...
