mysql和postgresql差异?gorm如何同时兼容?
wptr33 2024-12-04 16:07 13 浏览
1. 背景
在日常开发业务时可能会遇到这种问题:原本使用mysql数据库,由于迁移或某种原因,把数据源切换为postgresql,那么项目还能正常运作吗?其实在大部分场景下或许没有问题,但是在如数据结构、DDL/DML语法等有特殊差别的话,可能就无法兼容。因此,总结了一下mysql和postgresql上的差异,以及在gorm对于两个不同数据库中的兼容性问题。
本文不讲述两者的选型优劣,仅描述常见的基本差异,如基本类型、语法、DDL/DML、字符集、SDK以及平时使用时存在的问题做举例和总结,避免在业务改造兼容两者时花精力又踩坑。
为了方便书写,后续postgresql简称pg。
Mysql 5.7/pg 11为例
2. 两者差异
2.1 基本类型
mysql与pg在基本数据类型中也是有些许差异。有些类型只有在mysql中存在,有些则是pg存在,为了兼容两者,我们在创建表时使用的类型一定需要具有通用性,下面总结了一份两者兼容类型表格提供参考:
类型 | 兼容类型 | 备注 |
数字类型 | smallint/integer/bigint/decimal/serial | 在mysql和pg中serial理解是不同的,在mysql中为bigint unsigned not null auto_increament unique缩写,在pg表示自增32位整数。另外pg使用bigserial建立主键,其内部转为sequence + nextval进行的 |
字符类型 | char(n)/varchar(n)/text | 在字符类型中pg支持较少,mysql支持较多如ENUM/MEDIUMTEXT等 |
二进制类型 | blob | pg和mysql对于二进制类型定义分别为bytea和blob |
日期类型 | timestamp/date/time | 暂无 |
布尔类型 | boolean | mysql布尔默认存储类型是tinyint,两者在建表时都兼容boolean写法的。如果在pg中使用smallint,那么不兼容true和false,mysql则兼容。 |
json支持 | json | pg对json支持较好,并且可以添加索引,拥有较好的查询性能。mysql则没有。json类型尽量还是不要使用,因为会出现兼容性问题,可用text代替 |
2.2 字符集
在mysql5.7中,默认的字符集为latin1,所以在创建表时时要指定charset,否则对于中文以及部分符号支持不好。需要注意的是,charset=utf8在mysql5.7中为utf8mb3,这种字符集无法对表情等特殊符号支持,但是在mysql8.0之后默认字符集变为utf8mb4。
在pg11中默认使用UTF-8字符集。
2.3 DDL
2.3.1 创建表
mysql与pg在create语法中有许多不同点。mysql的建表语句通常无法在pg中执行,需要一定的改动,这里举一个例子:?
mysql:
CREATE TABLE IF NOT EXISTS `tasks`
(
`id` bigint UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 'id',
`project_name` varchar(128) NOT NULL ,
`scenario_id` bigint UNSIGNED NOT NULL DEFAULT 0 ,
`media_id` bigint UNSIGNED NOT NULL DEFAULT 0 ,
`report_id` bigint UNSIGNED NOT NULL DEFAULT 0 ,
`engine_run_id` varchar(512) NOT NULL DEFAULT '' ,
`task_name` varchar(128) NOT NULL DEFAULT '' ,
`status` tinyint(3) NOT NULL DEFAULT '0',
`rules` mediumtext ,
`created_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ,
`updated_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP ,
`deleted` tinyint UNSIGNED NOT NULL ,
PRIMARY KEY (`id`),
UNIQUE KEY `uniq_project_name_task_name` (`project_name`, `task_name`),
KEY `idx_scenario_id` (`scenario_id`),
KEY `idx_created_time` (`created_time`)
) ENGINE = InnoDB
DEFAULT CHARSET = utf8mb4 COMMENT ='任务表';
复制代码
pg:
CREATE SEQUENCE tasks_seq;
CREATE TABLE tasks
(
id bigint NOT NULL DEFAULT NEXTVAL('tasks_seq'),
project_name varchar(128) NOT NULL,
scenario_id bigint NOT NULL DEFAULT 0,
media_id bigint NOT NULL DEFAULT 0,
report_id bigint NOT NULL DEFAULT 0,
engine_run_id varchar(512) NOT NULL DEFAULT '',
task_name varchar(128) NOT NULL DEFAULT '',
status smallint NOT NULL DEFAULT 0,
rules text,
created_time timestamp(0) NOT NULL DEFAULT CURRENT_TIMESTAMP,
updated_time timestamp(0) NOT NULL DEFAULT CURRENT_TIMESTAMP,
deleted smallint NOT NULL,
PRIMARY KEY (id),
CONSTRAINT uniq_project_name_task_name UNIQUE (project_name, task_name)
);
CREATE INDEX idx_tasks_scenario_id ON tasks (scenario_id);
CREATE INDEX idx_tasks_created_time ON tasks (created_time);
复制代码
总结create语句常见不同:
类型? | mysql? | pg? |
自增id? | mysql可通过serial或bigint UNSIGNED NOT NULL AUTO_INCREMENT加自增主键id? | pg可通过bigserial,或者上述方式创建自增主键id? |
索引? | 在创建表时指定任何索引类型,普通索引,唯一索引都可以? | 仅可以指定唯一、主键索引,对于普通索引需要额外执行ddl语句创建? |
文本类型? | 有tinytext/text/mediumtext/longtext等不同长度类型,如果插入长度超过会被截断? | 仅有text,可存储无限变长的字符串?? |
字符串类型? | 最多只能存25565字节数据? | 大约能存1GB的数据? |
注释? | 直接在字段后方使用COMMENT即可添加? | 对注释支持不友好,需要在表外执行COMMENT ON table/column [table_name] IS 'xxxx'来设置 |
另外需要注意的是,在pg相同库不同表建立相同名字的索引是不被允许的。
2.3.2 列操作
2.3.3 约束操作
2.3.4 索引操作
2.3.5 用户操作
2.3.6 小结
- 在表创建上,pg和mysql有许多不同。mysql可以在创建表时设置注释,设置索引等;pg则没有上述能力,只能通过再执行ddl语句进行。
- 在列操作上,正常情况下,新增列和删除列没有太大区别,唯一注意的是修改列的语法是不同的。?
- 在约束操作上,pg有额外的check约束,mysql则在8.0之后才有。?
- 在索引操作上,两者没过多区别。?
- 在用户操作上,两者语法不同。?
- pg在ALTER TABLE时可以添加IF EXISTS参数来判断只有表存在时才执行,MYSQL并没有。?
- 两者在用户权限控制上,pg显得更灵活,可以基于角色控制实现。
2.4 DML
2.4.1 插入数据
- 语法
pg和mysql插入语句十分相似,省略列名时VALUES候需要跟表所有列值,也都支持批量插入。
INSERT INTO table_name (column1, column2, column3, ...) VALUES (value1, value2, value3, ...);
复制代码
- 插入时处理冲突的语法不同
在mysql和pg,如果插入过程中发生唯一键冲突时,可以根据自己的需求修改该行的值(如时间),在这里mysql和pg是不同的,具体区别如下:?
mysql:
INSERT INTO table_name (column1, column2, column3, ...) VALUES (value1, value2, value3, ...) ON DUPLICATE KEY UPDATE `name`='update'
复制代码
pg:
INSERT INTO table_name (column1, column2, column3, ...) VALUES (value1, value2, value3, ...); ON CONFLICT ("column1") DO UPDATE SET "column2"='xxx' RETURNING "column1"
复制代码
可见mysql和pg在处理冲突上是不同的,另外pg可以指定冲突列,mysql则不行。
- 插入时数据类型自动转换的规则不同
在MySQL中,如果插入的数据类型与表中的列不匹配,MySQL会自动将数据类型转换为适当的类型。例如,如果将一个字符串插入到整数列中,MySQL会将字符串转换为整数。这种自动转换可能会导致数据丢失或格式错误。
在PostgreSQL中,转换没有mysql灵活,比如:INSERT INTO test(status,name) VALUES ('1.5', 'nihao3')插入整数类型status,在pg中无法插入,在mysql中会转为整数2插入。但是如果值为1.5浮点数,那么pg和mysql都可以插入并且自动转换。
另外mysql的boolean类型实质上使用tinyint整数类型,所以在mysql中TRUE=1和FALSE=0,但是在pg中的boolean类型只能由TRUE ('1'/'yes'/'true'/'on')和FALSE('0'/'no'/'false'/'off')表示,数字0/1在pg中无法匹配boolean类型。
2.4.2 更新数据?
- 语法
mysql更新数据的语法兼容pg,两者一样。举个例子如下:
UPDATE table_name SET column1=value1, column2=value2 WHERE some_column=some_value;
复制代码
- pg更新数据的扩展语法
pg还支持FROM或RETURNING语法,分别表示从其他表中获取数据,以及返回被更新行的信息。?
① 将table1中column1的值设置为table2的value1。
UPDATE table1 SET column1 = table2.value1
FROM table2
WHERE table1.key = table2.key;
复制代码
② 更新后返回所更新的行
UPDATE table_name SET column1=value1, column2=value2 WHERE some_column=some_value RETURNING id;
复制代码
这里需要注意一点:mysql并没有提供RETURNING函数,所以在create后返回主键的操作其实是分插入+查询主键两步完成的。因此,如果使用gorm线程池时,在create时一定要加上事务,否则在高并发下会发生不可预计错误。
2.4.3 删除数据
- 语法
mysql和pg删除的语法类似,如下:
DELETE FROM table_name WHERE some_column=some_value;
复制代码
但是pg除此之外还有扩展语法,DELETE同时使用RETURNING。下面例子表示,在删除列值为some_value后并返回删除的所有行。
DELETE FROM table_name WHERE some_column=some_value RETURNING *;
复制代码
2.4.4 查询数据
查询语句mysql和pg其实也是类似的,这里主要简单介绍下连接查询的区别。
mysql | pg |
INNER JOIN(default)、LEFT JOIN、RIGHT JOIN、FULL OUTER JOIN | INNER JOIN(default)、LEFT JOIN、RIGHT JOIN、FULL OUTER JOIN、CROSS JOIN |
2.4.5 小结
- 正常使用的话,pg和mysql的dml语法其实十分接近,只有在数据类型转换上会有区别,
- 使用pg时,双引号代表的是列,单引号代表的是字符串;这和mysql不同,mysql反斜杠代表列,单引号和双引号都可以用作字符串。
- 在pg中数字0或1是无法代表boolean类型的,但是mysql可以。
3. SDK
3.1 gorm
这里主要介绍gorm,兼容mysql和pg。
gorm可以同时兼容mysql和pg,但是需要注意的是避免使用raw或者exec的语句,这样如果切换数据库将会可能发生兼容性问题,具体需要根据业务使用需要来看。下面我总结了一部分在使用gorm兼容mysql和pg上的一些可能出现的问题并附上解决方案。
温馨提醒:mysql和pg的dsn格式是不一样的。
- 时间戳相关问题
- 时间戳默认值
mysql和pg数据库都支持default CURRENT_TIMESTAMP,所以基本可以不需要考虑这个问题。不过gorm的tag上也可以设置default默认值,但是设置时需要考虑兼容性,否则会出错,如default:CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,该tag只可以用在mysql中,pg则无效。
解决方案:使用autoCreateTime或者default:CURRENT_TIMESTAMP都可以解决兼容性问题,gorm中推荐使用前者,既可以兼容int64类型也可以兼容time.Time类型。
- 更新数据时同时更新时间戳
mysql和pg在数据更新上提供的方法不同,mysql可以使用on update方式更新时间列,但是pg不行,只能通过函数的方式实现。
解决方案:这里使用gorm提供的tag autoUpdateTime即可解决,如此在更新数据时,gorm会自动更新时间戳。
3.1.2 插入冲突问题
日常业务有可能发生插入时冲突,此时根据业务需求可能需要更改指定列的值,mysql与pg由于在写法上不同,因此需要依赖gorm来完成。
解决方案:通过gorm的Clauses(clause.OnConflict{}).Create()解决。举个栗子:下面实现当uid冲突时更改name,此写法兼容mysql和pg。
err := MysqlGorm.Table("test").Clauses(clause.OnConflict{
Columns: []clause.Column{{Name: "uid"}},
DoUpdates: clause.Assignments(map[string]interface{}{
"name": "update1",
}),
}).Create(t2).Error
复制代码
这了有坑:
mysql和pg通过分别Clauses(clause.OnConflict{}).Create()方式插入时,有些许不同。
mysql:
第一次插入,没有冲突时,会返回主键ID,RowAffected=1。
第二次插入,有冲突,但修改的列值和表中值不同,会返回主键ID,RowAffected=2。
第三次插入,有冲突,但修改的列值和表中值相同,不会返回主键ID,RowAffected=0.
pg:
不管第一次插入还是冲突修改,都会返回主键ID,这是因为pg的RETURNING语法,并且RowAffected=1。
所以,我们可以通过RowAffected来判断是否更新成功来确定是否返回主键ID。
3.1.3 连接查询问题
mysql和pg在连接查询的语法上没有太大区别,但是需要注意的是,pg在连接查询时,对于其他表的条件设置,必须要加上双引号,否则会报错。下面举例:
gorm中使用join进行连接时,如果要求在where中设置条件,不能使用where("column = ?", x)方式,使用这个方式会导致上述兼容性问题。可以使用struct或map[string]interface{}方式。但是这两个方式仅支持=操作符,所以为了扩展,gorm推出了gormx解决这个问题。
3.1.4 时区问题
使用gorm往pg插入时间在数据库显示的时间和本地时间是一致的,唯一的区别就是在查询的时候,pg查询出来的是UTC时区的当前时间,mysql则是+8时区的当前时间,但是如果不转换时区的话,使用起来其实没什么区别。具体如下图
mysql:
pg:
当然如果使用int64时间戳作为存储类型,就不需要考虑这些问题。
3.1.5 转义问题
转义问题在mysql和pg都存在。gorm中如果使用?占用符来预编译字符',gorm会默认将其转义为'。但是对于模糊查询,仅仅一个单引号转义是不够的,还有%、_、/这几个符号都需要进行转义,否则会发生一些问题。
解决方案:
- 使用gormx,这是一个专门支持查询,更新的gorm扩展工具。但需要注意,如果模糊查询文本中存在%还是需要自己手动转义,gorm不会转义%。
- 自己转义:
// escapeLike 函数将 SQL LIKE 子句中的保留字符进行转义
func escapeLike(str string) string {
str = strings.ReplaceAll(str, "\", "\\")
str = strings.ReplaceAll(str, "%", "\%")
str = strings.ReplaceAll(str, "_", "\_")
//str = strings.ReplaceAll(str, "'", "\'") // gorm里面已经将'进行转义了
return str
}
复制代码
4. 总结
mysql和pg在各方面还是存在较多不同的地方,具体还是需要根据自己的业务需求去使用。总的来说各有优劣,pg在性能上可能不如mysql,但是pg安全性高,具有许多扩展能力(如支持并发创建索引等)。
业务上如果需要兼容两者,那么在数据的定义、表结构的定义、结构体的定义等上面需要注意使用通用性更强的方式,否则很有可能会发生未知错误。
- 上一篇:MySQL的索引有哪些
- 下一篇:sql注入之布尔盲注
相关推荐
- C++企业级开发规范指南(c++开发gui)
-
打造高质量、可维护的C++代码标准一、前言C++作为一门功能强大的系统级编程语言,被广泛应用于操作系统、游戏引擎、高性能服务器、数据库系统等领域。知名互联网公司(如Google、Microsoft、腾...
- C++|整型的最值、上溢、下溢、截断、类型提升和转换
-
整数在计算机内以有限字长表示,当超出最值(有限字长)时,需要截断(溢出,求模)操作。不同字长的整型具有不同的值域,混合运算时,需要类型提升和转换。1整形最值在<limit.h>中有整型的...
- C++|漫谈STL细节及内部原理(c++ std stl)
-
1988年,AlexanderStepanov开始进入惠普的PaloAlto实验室工作,在随后的4年中,他从事的是有关磁盘驱动器方面的工作。直到1992年,由于参加并主持了实验室主任BillWo...
- C++11新特性总结 (二)(c++11新特性 pdf)
-
1.范围for语句C++11引入了一种更为简单的for语句,这种for语句可以很方便的遍历容器或其他序列的所有元素vector<int>vec={1,2,3,4,5,6};f...
- C++ STL 漫谈(c++中的stl到底指的什么)
-
标准模板库(StandardTemplateLibrary,STL)是惠普实验室开发的一个函数库和类库。它是由AlexanderStepanov、MengLee和DavidRMusser在...
- C++学习教程_C++语言随到随学_不耽误上班_0基础
-
C++学习教程0基础学C++也可以,空闲时间学习,不耽误上班.2019年C语言新课程已经上线,随到随学,互动性强,效果好!带你征服C++语言,让所有学过和没有学过C++语言的人,或是正准备学习C++语...
- C++遍历vector元素的四种方式(c++ 遍历vector)
-
vector是相同类型对象的集合,集合中的每个对象有个对应的索引。vector常被称为容器(container)。C++中遍历vector的所有元素是相当常用的操作,这里介绍四种方式。1、通过下标访问...
- 一起学习c++11——c++11中的新增的容器
-
c++11新增的容器1:array当时的初衷是希望提供一个在栈上分配的,定长数组,而且可以使用stl中的模板算法。array的用法如下:#include<string>#includ...
- C++编程实战基础篇:一维数组应用之投票统计
-
题目描述班上有N个同学,有五位候选人“A,B,C,D,E”,请所有的同学投票并选举出班长,现在请你编写程序来他们计算候选人的得票总数,每位同学投票将以数字的形式投票“12345”分别代表五位候选人,...
- C++20 新特性(6):new表达式也支持数组大小推导
-
new表达式也支持数组大小推导在C++17标准中,在定义并初始化静态数组时,是可以忽略数组大小,然后通过初始化数据来推导数组的大小。但使用new来定义并初始化动态数组时,并不支持这种自动推导数组大...
- C++ 结构体(struct)最全详解(c++结构体用法)
-
一、定义与声明1.先定义结构体类型再单独进行变量定义structStudent{intCode;charName[20];charSex;intA...
- 自学 C++ 第 6 课 二维数组找最值
-
键盘输入一个m×n的二维数组,通过C++编程找出元素中的最大值,并输出其所在的位置坐标。例如,输入一个4×5的二维数组,数组元素分别为{{556623749},{578964563},...
- 从缺陷中学习C/C++:聊聊 C++ 中常见的内存问题
-
在写C/C++程序时,一提到内存,大多数人会想到内存泄露。内存泄露是一个令人头疼的问题,尤其在开发大的软件系统时。一个经典的现象是,系统运行了10天、1个月都好好的,忽然有一天宕机了:OOM(Out...
- C++开发者都应该使用的十个C++11特性(上)
-
在C++11新标准中,语言本身和标准库都增加了很多新内容,本文只涉及了一些皮毛。不过我相信这些新特性当中有一些,应该成为所有C++开发者的常规装备。你也许看到过许多类似介绍各种C++11特性的文章。下...
- 深度解读C/C++指针与数组(c++指针和数组的区别)
-
指针和数组是密切相关的。事实上,指针和数组在很多情况下是可以互换的。例如,一个指向数组开头的指针,可以通过使用指针的算术运算或数组索引来访问数组。今天我们就来聊一聊数组和指针千丝万缕的关系;一维数组与...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)