百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

如何使用 Python 操作 Git 代码?GitPython 入门介绍

wptr33 2025-05-24 17:33 48 浏览

花下猫语: 今天,我在查阅如何用 Python 操作 Gitlab 的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作 Git 的方法,后续有机会的话,再陆续分享之~~

作者:匿蟒

出处:
https://note.qidong.name/2018/01/gitpython

有时,需要做复杂的 Git 操作,并且有很多中间逻辑。 用 Shell 做复杂的逻辑运算与流程控制就是一个灾难。 所以,用 Python 来实现是一个愉快的选择。 这时,就需要在 Python 中操作 Git 的库。

GitPython 简介

GitPython是一个与Git库交互的Python库,包括底层命令(Plumbing)与高层命令(Porcelain)。 它可以实现绝大部分的Git读写操作,避免了频繁与Shell交互的畸形代码。 它并非是一个纯粹的Python实现,而是有一部分依赖于直接执行git命令,另一部分依赖于GitDB。

GitDB也是一个Python库。 它为.git/objects建立了一个数据库模型,可以实现直接的读写。 由于采用流式(stream)读写,所以运行高效、内存占用低。

GitPython安装

 pip install GitPython

其依赖GitDB会自动安装,不过可执行的git命令需要额外安装。

基本用法

init

 
 import git
 repo = git.Repo.init(path='.')

这样就在当前目录创建了一个Git库。 当然,路径可以自定义。

由于git.Repo实现了__enter__与__exit__,所以可以与with联合使用。

 
 with git.Repo.init(path='.') as repo:
 # do sth with repo

不过,由于只是实现了一些清理操作,关闭后仍然可以读写,所以使用这种形式的必要性不高。 详见附录。

clone

clone分两种。 一是从当前库clone到另一个位置:

 
 new_repo = repo.clone(path='../new')

二是从某个URL那里clone到本地某个位置:

 
 new_repo = git.Repo.clone_from(url='git@github.com:USER/REPO.git', to_path='../new')

commit

 with open('test.file', 'w') as fobj:
 fobj.write('1st line\n')
 repo.index.add(items=['test.file'])
 repo.index.commit('write a line into test.file')
 
 with open('test.file', 'aw') as fobj:
 fobj.write('2nd line\n')
 repo.index.add(items=['test.file'])
 repo.index.commit('write another line into test.file')

status

GitPython并未实现原版git status,而是给出了部分的信息。

 
 >>> repo.is_dirty()
 False
 >>> with open('test.file', 'aw') as fobj:
 >>> fobj.write('dirty line\n')
 >>> repo.is_dirty()
 True
 
 >>> repo.untracked_files
 []
 >>> with open('untracked.file', 'w') as fobj:
 >>> fobj.write('')
 >>> repo.untracked_files
 ['untracked.file']

checkout(清理所有修改)

 
 >>> repo.is_dirty()
 True
 >>> repo.index.checkout(force=True)
 <generator object <genexpr> at 0x7f2bf35e6b40>
 >>> repo.is_dirty()
 False

branch

获取当前分支:

 
 head = repo.head

新建分支:

 
 new_head = repo.create_head('new_head', 'HEAD^')

切换分支:

 
 new_head.checkout()
 head.checkout()

删除分支:

 
 git.Head.delete(repo, new_head)
 # or
 git.Head.delete(repo, 'new_head')

merge

以下演示如何在一个分支(other),merge另一个分支(master)。

 
 master = repo.heads.master
 other = repo.create_head('other', 'HEAD^')
 other.checkout()
 repo.index.merge_tree(master)
 repo.index.commit('Merge from master to other')

remote, fetch, pull, push

创建remote:

 
 remote = repo.create_remote(name='gitlab', url='git@gitlab.com:USER/REPO.git')

远程交互操作:

 
 remote = repo.remote()
 remote.fetch()
 remote.pull()
 remote.push()

删除remote:

 
 repo.delete_remote(remote)
 # or
 repo.delete_remote('gitlab')

其它

其它还有Tag、Submodule等相关操作,不是很常用,这里就不介绍了。

GitPython的优点是在做读操作时可以方便地获取内部信息,缺点是在做写操作时感觉很不顺手,隔靴搔痒。 当然,它还支持直接执行git操作。

 
 git = repo.git
 git.status()
 git.checkout('HEAD', b="my_new_branch")
 git.branch('another-new-one')
 git.branch('-D', 'another-new-one')

这……感觉又回到了老路,而且仍然感觉怪怪的。

其它操作Git的方法

subprocess

这就是所谓『老路』。 在另一个进程,执行Shell命令,并通过stdio来解析返回结果。

 
 import subprocess
 subprocess.call(['git', 'status'])

dulwich

dulwich是一个纯Python实现的Git交互库,以后有空再研究吧。

官方网站:https://www.dulwich.io/

pygit2

pygit2是基于libgit2实现的一个Python库。 底层是C,而上层Python只是接口,运行效率应该是最高的,然而孤还是放弃了。 其缺点是,需要环境中预先安装libgit2。 相比之下,GitPython只需要环境预置Git,简单多了。

官方网站:http://www.pygit2.org/

参考

  • 《GitPython Documentation》
  • 《Welcome to GitDB’s documentation!》
  • 《Git - 底层命令 (Plumbing) 和高层命令 (Porcelain)》
  • 《GitPython | Hom》

附录

在git.Repo中对context相关接口的实现如下:

 
 def __enter__(self):
 return self
 
 def __exit__(self, exc_type, exc_value, traceback):
 self.close()
 
 def __del__(self):
 try:
 self.close()
 except:
 pass
 
 def close(self):
 if self.git:
 self.git.clear_cache()
 gc.collect()
 gitdb.util.mman.collect()
 gc.collect()

可见只是一些清理操作,关闭的必要性不高。 即使关闭,也仍然可以对这个git.Repo的instance进行读写操作。

相关推荐

oracle数据导入导出_oracle数据导入导出工具

关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...

继续学习Python中的while true/break语句

上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个else解...

python continue和break的区别_python中break语句和continue语句的区别

python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...

简单学Python——关键字6——break和continue

Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...

2-1,0基础学Python之 break退出循环、 continue继续循环 多重循

用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...

Python 中 break 和 continue 傻傻分不清

大家好啊,我是大田。今天分享一下break和continue在代码中的执行效果是什么,进一步区分出二者的区别。一、continue例1:当小明3岁时不打印年龄,其余年龄正常循环打印。可以看...

python中的流程控制语句:continue、break 和 return使用方法

Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...

L017:continue和break - 教程文案

continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...

作为前端开发者,你都经历过怎样的面试?

已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...

面试被问 const 是否不可变?这样回答才显功底

作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...

2023金九银十必看前端面试题!2w字精品!

导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。答案:CSS的盒模型是用于布局和定位元素的概念。它由内容区域...

前端面试总结_前端面试题整理

记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...

由浅入深,66条JavaScript面试知识点(七)

作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录由浅入深,66条JavaScript面试知识点(一)由浅入深,66...

2024前端面试真题之—VUE篇_前端面试题vue2020及答案

添加图片注释,不超过140字(可选)1.vue的生命周期有哪些及每个生命周期做了什么?beforeCreate是newVue()之后触发的第一个钩子,在当前阶段data、methods、com...

今年最常见的前端面试题,你会做几道?

在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...