百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

如何使用 Python 操作 Git 代码?GitPython 入门介绍

wptr33 2025-05-24 17:33 40 浏览

花下猫语: 今天,我在查阅如何用 Python 操作 Gitlab 的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作 Git 的方法,后续有机会的话,再陆续分享之~~

作者:匿蟒

出处:
https://note.qidong.name/2018/01/gitpython

有时,需要做复杂的 Git 操作,并且有很多中间逻辑。 用 Shell 做复杂的逻辑运算与流程控制就是一个灾难。 所以,用 Python 来实现是一个愉快的选择。 这时,就需要在 Python 中操作 Git 的库。

GitPython 简介

GitPython是一个与Git库交互的Python库,包括底层命令(Plumbing)与高层命令(Porcelain)。 它可以实现绝大部分的Git读写操作,避免了频繁与Shell交互的畸形代码。 它并非是一个纯粹的Python实现,而是有一部分依赖于直接执行git命令,另一部分依赖于GitDB。

GitDB也是一个Python库。 它为.git/objects建立了一个数据库模型,可以实现直接的读写。 由于采用流式(stream)读写,所以运行高效、内存占用低。

GitPython安装

 pip install GitPython

其依赖GitDB会自动安装,不过可执行的git命令需要额外安装。

基本用法

init

 
 import git
 repo = git.Repo.init(path='.')

这样就在当前目录创建了一个Git库。 当然,路径可以自定义。

由于git.Repo实现了__enter__与__exit__,所以可以与with联合使用。

 
 with git.Repo.init(path='.') as repo:
 # do sth with repo

不过,由于只是实现了一些清理操作,关闭后仍然可以读写,所以使用这种形式的必要性不高。 详见附录。

clone

clone分两种。 一是从当前库clone到另一个位置:

 
 new_repo = repo.clone(path='../new')

二是从某个URL那里clone到本地某个位置:

 
 new_repo = git.Repo.clone_from(url='git@github.com:USER/REPO.git', to_path='../new')

commit

 with open('test.file', 'w') as fobj:
 fobj.write('1st line\n')
 repo.index.add(items=['test.file'])
 repo.index.commit('write a line into test.file')
 
 with open('test.file', 'aw') as fobj:
 fobj.write('2nd line\n')
 repo.index.add(items=['test.file'])
 repo.index.commit('write another line into test.file')

status

GitPython并未实现原版git status,而是给出了部分的信息。

 
 >>> repo.is_dirty()
 False
 >>> with open('test.file', 'aw') as fobj:
 >>> fobj.write('dirty line\n')
 >>> repo.is_dirty()
 True
 
 >>> repo.untracked_files
 []
 >>> with open('untracked.file', 'w') as fobj:
 >>> fobj.write('')
 >>> repo.untracked_files
 ['untracked.file']

checkout(清理所有修改)

 
 >>> repo.is_dirty()
 True
 >>> repo.index.checkout(force=True)
 <generator object <genexpr> at 0x7f2bf35e6b40>
 >>> repo.is_dirty()
 False

branch

获取当前分支:

 
 head = repo.head

新建分支:

 
 new_head = repo.create_head('new_head', 'HEAD^')

切换分支:

 
 new_head.checkout()
 head.checkout()

删除分支:

 
 git.Head.delete(repo, new_head)
 # or
 git.Head.delete(repo, 'new_head')

merge

以下演示如何在一个分支(other),merge另一个分支(master)。

 
 master = repo.heads.master
 other = repo.create_head('other', 'HEAD^')
 other.checkout()
 repo.index.merge_tree(master)
 repo.index.commit('Merge from master to other')

remote, fetch, pull, push

创建remote:

 
 remote = repo.create_remote(name='gitlab', url='git@gitlab.com:USER/REPO.git')

远程交互操作:

 
 remote = repo.remote()
 remote.fetch()
 remote.pull()
 remote.push()

删除remote:

 
 repo.delete_remote(remote)
 # or
 repo.delete_remote('gitlab')

其它

其它还有Tag、Submodule等相关操作,不是很常用,这里就不介绍了。

GitPython的优点是在做读操作时可以方便地获取内部信息,缺点是在做写操作时感觉很不顺手,隔靴搔痒。 当然,它还支持直接执行git操作。

 
 git = repo.git
 git.status()
 git.checkout('HEAD', b="my_new_branch")
 git.branch('another-new-one')
 git.branch('-D', 'another-new-one')

这……感觉又回到了老路,而且仍然感觉怪怪的。

其它操作Git的方法

subprocess

这就是所谓『老路』。 在另一个进程,执行Shell命令,并通过stdio来解析返回结果。

 
 import subprocess
 subprocess.call(['git', 'status'])

dulwich

dulwich是一个纯Python实现的Git交互库,以后有空再研究吧。

官方网站:https://www.dulwich.io/

pygit2

pygit2是基于libgit2实现的一个Python库。 底层是C,而上层Python只是接口,运行效率应该是最高的,然而孤还是放弃了。 其缺点是,需要环境中预先安装libgit2。 相比之下,GitPython只需要环境预置Git,简单多了。

官方网站:http://www.pygit2.org/

参考

  • 《GitPython Documentation》
  • 《Welcome to GitDB’s documentation!》
  • 《Git - 底层命令 (Plumbing) 和高层命令 (Porcelain)》
  • 《GitPython | Hom》

附录

在git.Repo中对context相关接口的实现如下:

 
 def __enter__(self):
 return self
 
 def __exit__(self, exc_type, exc_value, traceback):
 self.close()
 
 def __del__(self):
 try:
 self.close()
 except:
 pass
 
 def close(self):
 if self.git:
 self.git.clear_cache()
 gc.collect()
 gitdb.util.mman.collect()
 gc.collect()

可见只是一些清理操作,关闭的必要性不高。 即使关闭,也仍然可以对这个git.Repo的instance进行读写操作。

相关推荐

MySQL进阶五之自动读写分离mysql-proxy

自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...

Postgres vs MySQL_vs2022连接mysql数据库

...

3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?

引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...

一文由浅入深带你完全掌握MySQL的锁机制原理与应用

本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...

验证Mysql中联合索引的最左匹配原则

后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...

MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)

目录1.索引基础...

你会看 MySQL 的执行计划(EXPLAIN)吗?

SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...

MySQL 从入门到精通(四)之索引结构

索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...

mysql总结——面试中最常问到的知识点

mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...

mysql总结——面试中最常问到的知识点(2)

首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...

MySQL基础全知全解!超详细无废话!轻松上手~

本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...

深入剖析 MySQL 中的锁机制原理_mysql 锁详解

在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...

Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析

引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...

MySQL基础篇:DQL数据查询操作_mysql 查

一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...

MySql:索引的基本使用_mysql索引的使用和原理

一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...