百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

从上百个字段到1个CLOB:Oracle JSON存储实战指南

wptr33 2025-07-24 22:32 28 浏览

陆沉盯着左右两个屏幕上显示的数据格式文档,右手小拇指无意思地一下又一下的敲击着机械键盘的Ctrl键,在清脆的“哒哒”声中思考着。


[又有新的字段设计……]


面前的小屏幕上显示的是公司Oracle数据库里面的目标表,看着上百个字段的表结构,还有历史记录中先辈们留下里面一大堆`ALTER TABLE ADD COLUMN`语句……


[不是吧?不是吧!难道现在还有人不知道关系型数据库也可以存储对象吗……]


陆沉双手放上键盘,快速敲击起来……




建表

Oracle12c以上的版本已经开始支持JSON格式的存储,并且原生带有json操作函数,可以灵活的实现JSON格式校验、JSON数据抽取、甚至将JSON字段值作为查询条件!


只需要定义一个`CLOB`字段,就可以存储JSON了。当然如果想要限定长度,也可以使用`VARCHAR2`


CREATE TABLE source_raw_data (
    id               NUMBER DEFAULT seq_raw_data_id.NEXTVAL,
    source           VARCHAR2(50),
    raw_data         CLOB,
    
    CONSTRAINT pk_source_raw_data PRIMARY KEY (id),          -- 主键约束
    CONSTRAINT ensure_json  CHECK (raw_data IS JSON)       -- JSON格式校验约束
);



在这个表里面陆沉耍了个小心机,用`IS JSON`检查来约束格式,这样做方便后续使用内置的JSON函数而不会出错。


插入

JSON数据本质上就是一段格式化的文本,直接当成文本插入数据表就可以了,不过要小心,如果JSON里面的字段值带有双引号,记得转义。

INSERT INTO source_raw_data (source, raw_data) 
VALUES (
    'source_A',
    '{
        "NAV_DATE": "2025-03-03",
        "FUND": "ABCD",
        "FUND_DATA": {
            "Data_A": "XXX",
            "DATA_B": "YYYY",
            "MARKET_A_VALUE": 1234,
            "CREATED_AT": "2025-03-03"
        },
        "TAGS": ["CN", "EA", "PR"]
    }'
);


INSERT INTO source_raw_data (source, raw_data) 
VALUES (
    'source_B',
    '{
        "VALUE_DATE": "2025-03-03",
        "FUND_NAME": "ABCD",
        "FUND_DATA": {
            "FUND_DATA_C": "XXX",
            "MARKET_C_VALUE": "1234",
            "CREATED_AT": "2025-03-13"
        },
        "TAGS": ["UK", "RD", "PR"]
    }'
);

看着测试数据稳稳落入表中,陆沉扶了扶左眼的防蓝光单片眼镜,在技术文档中敲下新的章节标题。


查询

可以直接使用JSON路径进行查询,用`从上百个字段到1个CLOB:Oracle JSON存储实战指南 - 今日头条

作为路径的开头!


- 在查询结果中直接显示出JSON的特定字段值


SELECT 
    JSON_VALUE(raw_data, '$.FUND_DATA.MARKET_A_VALUE') AS A_VALUE  --  类型自动转换
    JSON_VALUE(raw_data, '$.FUND_DATA.CREATED_AT' RETURNING DATE) AS CREATED
FROM source_raw_data;


陆沉还细心地在设计文档中写道:`JSON_VALUE`是Oracle的内置函数,可以解析JSON格式的文本,通过路径直接抽取字段值,并且可以在函数中通过`RETUNING`关键字直接转换为目标格式,比如范例中的时间格式。


- 将JSON中的字段作为查询条件

SELECT * 
FROM source_raw_data 
WHERE JSON_VALUE(raw_data, '$.FUND') = 'ABCD';  --  支持复杂条件

同样是使用`JSON_VALUE`函数解析后查询。

肯定会有人会找茬,这样查询性能会有问题吧?

想到这里,陆沉嘴角微微一翘……


- 解决性能陷阱,给JSON字段创建索引


CREATE INDEX idx_source_fund_created 
ON source_raw_data (
    JSON_VALUE(raw_data, '$.FUND_DATA.CREATED_AT')
);  --  给JSON字段上索引



当然如果还有人一定要like来查询JSON文本,只能说尊重他人命运吧。


- 特殊类型:JSON字段中的数组查询


SELECT 
    id, 
    JSON_QUERY(raw_data, '$.TAGS') AS tags  -- 提取TAGS数组字段
FROM source_raw_data
WHERE 
    JSON_EXISTS(raw_data, '$.TAGS?(@ == "PR")');  -- 过滤包含"PR"的记录



这里用到的 `JSON_QUERY` 可以将`raw_data`字段中的 `TAGS` 数组的全部内容提取出来,查询结果的格式大概是这样: `["UK", "RD", "PR"]`


其中 `@` 符号是一种遍历操作的声明,代表要对数组元素进行遍历访问的操作。


- 高级解析:将JSON转成临时表


SELECT 
    jt.nav_date, 
    jt.fund, 
    jt.data_a, 
    jt.data_b, 
    jt.market_a_value, 
    jt.created_at
FROM 
    source_raw_data s,
    JSON_TABLE(
        s.raw_data, 
        '#39; 
        COLUMNS (
            nav_date         VARCHAR2(10) PATH '$.NAV_DATE' NULL ON EMPTY,
            fund             VARCHAR2(10) PATH '$.FUND' NULL ON EMPTY,
            data_a           VARCHAR2(10) PATH '$.FUND_DATA.Data_A' NULL ON EMPTY,
            data_b           VARCHAR2(10) PATH '$.FUND_DATA.DATA_B' NULL ON EMPTY,
            market_a_value   NUMBER       PATH '$.FUND_DATA.MARKET_A_VALUE' NULL ON EMPTY,
            created_at       VARCHAR2(10) PATH '$.FUND_DATA.CREATED_AT' NULL ON EMPTY
        )
    ) jt
WHERE 
    s.source = 'source_A';



JSON_TABLE也是Oracle内置函数,可以用来将JSON数据映射为临时表,进而可以执行更加复杂的查询操作。

在每个字段后面加上 `NULL ON EMPTY` 是为了避免字段确实的时候查询会报错。


- 更新操作

没错,我们可以直接更新JSON数据中的某个字段!


UPDATE source_raw_data
SET raw_data = JSON_MERGEPATCH(
    raw_data,
    '{"nav_date": "2025-03-12"}'
)
WHERE id = 2;


- 路径大小写敏感

陆沉在自己写的范例中,埋藏了个JSON操作中要严格区分大小写的彩蛋……




屏幕上弹出技术文档保存成功的提示,陆沉右眼闪过一丝红光,随手切出黑色的IDEA编辑器,打开那个陈年的Java项目……


MyBatis Plus的隐藏技能——自动JSON转换!


通过 MyBatisPlus 的 `@TableName(autoResultMap=true)` 开启自动结果集映射,配合 `@TableField` 注解的 `typeHandler` 属性,可以实现:


- 写入时自动将对象序列化为JSON字符串


- 读取时自动将JSON反序列化为对象


- 完全注解式开发,零XML配置


实现步骤

1. 实体类配置


@TableName(autoResultMap = true)
public class SourceRawData {
    @TableField(typeHandler = JsonTypeHandler.class)
    private RawData rawData;  //  自动序列化/反序列化
}

注意这里使用了自动创建 ResultMap 映射关系,避免手动编写XML配置,同时JSON字段自动反序列化功能,需要依赖此特性实现。


2. 自定义 `TypeHandler`(只在需要特殊处理逻辑的时候添加,否则可以直接使用原生的JsonTypeHandler)


public class SpecialJsonTypeHandler extends BaseTypeHandler<Object> {
    private static final ObjectMapper mapper = new ObjectMapper();


    @Override
    public void setNonNullParameter(...) {  // 写入时转JSON
        ps.setString(i, mapper.writeValueAsString(parameter));
    }


    @Override
    public Object getNullableResult(...) {  // 读取时转对象
        return mapper.readValue(json, returnType);
    }
}


3. 高级配置(如有自定义的TypeHandler,需要这一步)

// 注册TypeHandler到 MyBatis 配置
@Configuration
public class MybatisConfig {


    @Bean
    public ConfigurationCustomizer configurationCustomizer() {
        return configuration -> 
            configuration.getTypeHandlerRegistry()
                             .register(SpecialJsonTypeHandler.class);
    }
}


踩坑记录


  • 类型匹配问题:如果有自己写的`TypeHandler`,一定要确保TypeHandler 处理的Java类型与字段类型一致。


  • 空值处理:如果害怕出现空值,可以使用 `@TableField(updateStrategy = FieldStrategy.IGNORED)`。


  • 日期格式:统一配置ObjectMapper的日期序列化格式,默认的 `ObjectMapper` 用的可是`UTC+0` 时区。

  • 存储占用过高:格式化的JSON文本有很多冗余的空格,可以尝试对CLOB字段添加压缩 `ALTER TABLE source_raw_data MODIFY raw_data CLOB COMPRESS;`


凌晨两点半,陆沉跑完最后一个JSON存储与读取测试用例,一口喝光那罐标着[3.21MB算力]的黑牛。

忽然电脑桌面上弹出架构团队的通知:[经公司董事会批准,公司将升级底层数据库为Oracle21c+。]

伴随着右眼中的电子义眼散发出的红光,陆沉在技术文档的最后一段添加上一句话:构建新表时,强制使用Oracle原生 `JSON` 数据类型。

[哼,在我写出这句话之前的都算是旧表,无需遵守这个约定……]



相关推荐

oracle数据导入导出_oracle数据导入导出工具

关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...

继续学习Python中的while true/break语句

上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个...

python continue和break的区别_python中break语句和continue语句的区别

python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...

简单学Python——关键字6——break和continue

Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...

2-1,0基础学Python之 break退出循环、 continue继续循环 多重循

用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...

Python 中 break 和 continue 傻傻分不清

大家好啊,我是大田。...

python中的流程控制语句:continue、break 和 return使用方法

Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...

L017:continue和break - 教程文案

continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...

作为前端开发者,你都经历过怎样的面试?

已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...

面试被问 const 是否不可变?这样回答才显功底

作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...

2023金九银十必看前端面试题!2w字精品!

导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。...

前端面试总结_前端面试题整理

记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...

由浅入深,66条JavaScript面试知识点(七)

作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录...

2024前端面试真题之—VUE篇_前端面试题vue2020及答案

添加图片注释,不超过140字(可选)...

今年最常见的前端面试题,你会做几道?

在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...