如何使用Ora2Pg迁移Oracle数据库到openGauss
wptr33 2025-01-12 19:03 30 浏览
ra2Pg介绍
Ora2Pg是一个将Oracle迁移至PostgreSQL的开源工具,通过连接Oracle数据库,自动扫描并提取其中的对象结构及数据,产生SQL脚本,通过手动或自动的方式将其应用到PostgreSQL。
官方网站:https://ora2pg.darold.net/
Ora2Pg优秀特性
- 支持导出数据库绝大多数对象类型,包括表、视图、序列、索引、外键、约束、函数、存储过程等。
- 提供PL/SQL到PL/PGSQL语法的自动转换,一定程度避免了人工修正。
- 可生成迁移报告,包括迁移难度评估、人天估算。
- 可选对导出数据进行压缩,节约磁盘开销。
- 配置选项丰富,可自定义迁移行为。
Ora2Pg在openGauss的应用
Ora2Pg主要语言是perl,使用Perl DBI模块,通过DBD:Pg连接PostgreSQL目标数据库,openGauss兼容PostgreSQL的通信协议以及绝大部分语法,因此只需作部分命名上的修改,Ora2Pg同样可应用于openGauss。
Ora2Pg使用示例
对于对象结构,Ora2Pg将其DDL语句导出到SQL文件中,对于表数据,则既可以以INSERT或COPY命令导出到文件,也支持直接导入到目标数据库,不需要产生中间SQL文件。
为了完成上述过程,Ora2Pg工具同时支持命令行和一键式脚本的方式完成迁移。命令行方式通过Ora2Pg二进制分布执行各条命令,来完成对应的步骤;一键式脚本通过创建迁移项目,分别得到导出导入脚本以及迁移目录模板,脚本集成了若干Ora2Pg命令以及导入SQL文件所需的psql命令(openGauss为gsql),用户只需要执行两个脚本即可完成迁移。本次主要演示脚本的方式。
1. 依赖安装
Ora2Pg语言为perl,故需安装所需perl模块。
# root用户下操作
yum install -y perl-ExtUtils-CBuilder perl-ExtUtils-MakeMaker
yum install perl-CPAN
安装DBI、DBD:Pg、DBD:Oracle,Ora2Pg依赖这些软件去连接数据库。
perl -MCPAN -e 'install DBI'
perl -MCPAN -e 'install DBD::Pg'
安装DBD:Oracle,需要先安装Oracle Instant Client或者本地已安装Oracle数据库。
# 从Oracle官方下载并安装Oracle Instant Client
rpm -ivh oracle-instantclient19.11-basic-19.11.0.0.0-1.x86_64.rpm
rpm -ivh oracle-instantclient19.11-devel-19.11.0.0.0-1.x86_64.rpm
rpm -ivh oracle-instantclient19.11-jdbc-19.11.0.0.0-1.x86_64.rpm
rpm -ivh oracle-instantclient19.11-sqlplus-19.11.0.0.0-1.x86_64.rpm
# 设置环境变量ORACLE_HOME
export ORACLE_HOME=/usr/lib/oracle/19.11/client64/
# 或者本地已安装有Oracle数据库
ORACLE_HOME如下设置
export ORACLE_HOME=/opt/oracle/product/19c/dbhome_1
export LD_LIBRARY_PATH=$ORACLE_HOME/lib
# 安装DBD:Oracle
perl -MCPAN -e 'install DBD::Oracle'
2. Ora2Pg安装并创建迁移项目
源码路径:https://github.com/darold/ora2pg
# 进到代码目录下,<you_install_dir>为目标安装路径
perl Makefile.PL PREFIX=<your_install_dir>
make && make install
# 设置环境变量,查看是否安装成功.<source_code_dir>为下载的代码路径
export PERL5LIB=<source_code_dir>/lib
export PATH=$PATH:<your_install_dir>/usr/local/bin
ora2pg --help
# 创建迁移项目
ora2pg --init_project oramig
创建迁移项目后会在当前目录下生成oramig目录模板,如下所示。其中主要包含两个脚本export_schema.sh和import_all.sh,后续导出和导入即使用这两个脚本。schema和sources目录存放各对象的DDL语句,区别在于schema存放PL/SQL语法转化为PL/PGSQL后的语句, sources目录存放转化前PL/SQL的语句,data目录存放表数据文件,config目录包含配置文件ora2pg.conf,reports目录存放迁移报告。
至此您已可以使用Ora2Pg命令,以下是使用该命令时允许指定的部分命令行参数,这些参数都可以在ora2pg.conf设置,指定配置文件时,命令行选项指定的值会覆盖配置文件中的对应值。
Usage: ora2pg [-dhpqv --estimate_cost --dump_as_html] [--option value]
-a | --allow str : 指定允许导出的对象列表,使用逗号分隔。
-b | --basedir dir: 设置默认的导出目录,用于存储导出SQL文件。
-c | --conf file : 设置配置文件路径。
-e | --exclude str: 指定导出时排除的对象列表,使用逗号分隔。
-i | --input file : 指定要导入的SQL文件,导入文件时不需要连接到 Oracle 数据库。
-o | --out file : 设置导出的 SQL 文件的存储路径。默认值为当前目录下的 output.sql 文件。
-p | --plsql : 启用 PLSQL 代码到 PLPGSQL 代码的转换。
-s | --source DSN : 设置 Oracle DBI 数据源。
-t | --type export: 设置导出类型。该参数将会覆盖配置文件中的导出类型(TYPE)。
-u | --user name : 设置连接 Oracle 数据库连接的用户名。也可以使用 ORA2PG_USER 环境变量。
-w | --password pwd : 设置连接 Oracle 数据库的用户密码。也可以使用 ORA2PG_PASSWD 环境变量。
--init_project NAME: 初始化典型的Ora2Pg项目,生成目录模板。
--view_as_table str: 将视图导出为表,多个视图使用逗号分隔。
3. 配置Ora2Pg
ora2pg.conf文件包含所有配置选项,通过配置项可以自定义迁移时的行为。这里简单介绍几个常用的配置项。
ORACLE_HOME:设置环境变量ORACLE_HOME,DBD:Oracle模块使用该变量查找所需的Oracle库。设置方式在依赖安装中已涉及。
ORACLE_DSN:该参数以标准DBI DSN形式设置数据源名称,例如:
ORACLE_DSN dbi:Oracle:host=oradb_host.myhost.com;sid=DB_SID;port=1521
或者
ORACLE_DSN dbi:Oracle:DB_SID
第二种方式需要在$ORACLE_HOME/network/admin/tnsnames.ora 文件或者环境变量 TNS_ADMIN 指定目录下的 tnsnames.ora 文件中定义 SID。
ORACLE_USER, ORACLE_PWD:这两个参数用于定义Oracle数据库连接的用户名和密码。请注意,如果可以的话,以Oracle超级管理员身份登录,以避免在数据库扫描时遇到权限问题,以及丢失内容。
PG_DSN:设置目标数据库名称,如下为openGauss示例,连接IP为localhost,端口为5432,名称为mydb的数据库。
PG_DSN dbi:Pg:dbname=mydb;host=localhost;port=5432
PG_USER,PG_PWD:设置目标数据库的用户、密码。请注意,这里使用的用户需要有远程连接openGauss的权限,以及对对应数据库的读写权限,具体是运行Ora2Pg所在的机器和该用户需要在openGauss的远程访问白名单里。
SCHEMA:此参数用于设置要导出的schema。如下,将提取APPS下的对象。
SCHEMA APPS
ORA_INITIAL_COMMAND:该参数可用于在连接之后向Oracle发送初始命令。例如,在读取对象前关闭访问限制策略,或设置一些会话参数。
TYPE:设置要导出的对象类型,包括表、视图、序列、索引、外键、约束、函数、存储过程等,默认为TABLE。如下,将导出普通表和视图。
TYPE TABLE VIEW
更多更详细的配置项说明,可查看官网:
https://ora2pg.darold.net/documentation.html
连接测试:配置好Oracle数据库的DSN之后,可执行以下命令测试数据库的连接。
ora2pg -t SHOW_VERSION -c config/ora2pg.conf
以上命令将显示Oracle数据库的版本。
4. 执行迁移脚本
本次演示的配置如下,以system用户连接目标数据库
修改export_schema.sh中导出类型,本次迁移导出表和函数。
执行导出脚本,等待迁移完成。结束后在schema和source的子目录下生成对应类型的DDL文件,并在末尾给出导出表数据的命令。
sh export_schema.sh
同时reports目录下也生成html格式的迁移报告。
执行导入脚本之前需要做如下准备:
1. 先在openGauss库中创建数据库,并在该数据库下创建用户,把mydb属主设为该用户。(import_all.sh中使用PostgreSQL特有的createuser和createdb创建用户和数据库)
2. 为了使用openGauss命令行工具gsql,需要将数据库的bin和lib加在操作系统的环境变量PATH和LD_LIBRARY_PATH中。
3. 将import_all.sh里的psql修改为gsql。
4. 当使用普通用户导入数据时,可增加一个执行该脚本的选项,指定用户密码,避免频繁输入密码。
执行导入脚本,表示使用用户testuser登录名为mydb的数据库,ip和端口分别是127.0.0.1和5432,-f选项表示跳过用户和数据库是否需要创建的检查。
sh import_all.sh -d mydb -o testuser –h 127.0.0.1 -p 5432 –f
执行后会交互式提示是否导入各对象结构及数据,如下所示。(其中的-w是手动修改import_all.sh脚本,添加密码选项)
对于表的索引和约束,可选择延迟导入,即在导入数据之后。
登录openGauss数据库查看迁移结果。
Ora2Pg不足
Ora2Pg对PL/SQL和PL/PGSQL的语法转换处理采用正则表达式和文本替换的方式,先天设计不足,很难覆盖所有的语法,目前仅支持部分转换。因此,Ora2Pg可以满足SQL简单的应用迁移,对于复杂的语法,并不能完全保证转换的正确性,需要对生成的SQL语句进行核对,必要时需要人工修正。
更多内容请参考:
https://docs.opengauss.org/zh/docs/3.1.0/docs/BriefTutorial/BriefTutorial.html
相关推荐
- MySQL进阶五之自动读写分离mysql-proxy
-
自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...
- 3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?
-
引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...
- 一文由浅入深带你完全掌握MySQL的锁机制原理与应用
-
本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...
- 验证Mysql中联合索引的最左匹配原则
-
后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...
- MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)
-
目录1.索引基础...
- 你会看 MySQL 的执行计划(EXPLAIN)吗?
-
SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...
- MySQL 从入门到精通(四)之索引结构
-
索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...
- mysql总结——面试中最常问到的知识点
-
mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...
- mysql总结——面试中最常问到的知识点(2)
-
首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...
- MySQL基础全知全解!超详细无废话!轻松上手~
-
本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...
- 深入剖析 MySQL 中的锁机制原理_mysql 锁详解
-
在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...
- Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析
-
引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...
- MySQL基础篇:DQL数据查询操作_mysql 查
-
一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...
- MySql:索引的基本使用_mysql索引的使用和原理
-
一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
程序员的开源月刊《HelloGitHub》第 71 期
-
详细介绍一下Redis的Watch机制,可以利用Watch机制来做什么?
-
假如有100W个用户抢一张票,除了负载均衡办法,怎么支持高并发?
-
如何将AI助手接入微信(打开ai手机助手)
-
Java面试必考问题:什么是乐观锁与悲观锁
-
redission YYDS spring boot redission 使用
-
SparkSQL——DataFrame的创建与使用
-
一文带你了解Redis与Memcached? redis与memcached的区别
-
如何利用Redis进行事务处理呢? 如何利用redis进行事务处理呢英文
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)