如何使用 Python 操作 Git 代码?GitPython 入门介绍
itomcoil 2025-07-28 17:21 6 浏览
花下猫语: 今天,我在查阅如何用 Python 操作 Gitlab 的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作 Git 的方法,后续有机会的话,再陆续分享之~~
作者:匿蟒
出处:
https://note.qidong.name/2018/01/gitpython
有时,需要做复杂的 Git 操作,并且有很多中间逻辑。 用 Shell 做复杂的逻辑运算与流程控制就是一个灾难。 所以,用 Python 来实现是一个愉快的选择。 这时,就需要在 Python 中操作 Git 的库。
GitPython 简介
GitPython是一个与Git库交互的Python库,包括底层命令(Plumbing)与高层命令(Porcelain)。 它可以实现绝大部分的Git读写操作,避免了频繁与Shell交互的畸形代码。 它并非是一个纯粹的Python实现,而是有一部分依赖于直接执行git命令,另一部分依赖于GitDB。
GitDB也是一个Python库。 它为.git/objects建立了一个数据库模型,可以实现直接的读写。 由于采用流式(stream)读写,所以运行高效、内存占用低。
GitPython安装
pip install GitPython
其依赖GitDB会自动安装,不过可执行的git命令需要额外安装。
基本用法
init
import git repo = git.Repo.init(path='.')
这样就在当前目录创建了一个Git库。 当然,路径可以自定义。
由于git.Repo实现了__enter__与__exit__,所以可以与with联合使用。
with git.Repo.init(path='.') as repo: # do sth with repo
不过,由于只是实现了一些清理操作,关闭后仍然可以读写,所以使用这种形式的必要性不高。 详见附录。
clone
clone分两种。 一是从当前库clone到另一个位置:
new_repo = repo.clone(path='../new')
二是从某个URL那里clone到本地某个位置:
new_repo = git.Repo.clone_from(url='git@github.com:USER/REPO.git', to_path='../new')
commit
with open('test.file', 'w') as fobj: fobj.write('1st line\n') repo.index.add(items=['test.file']) repo.index.commit('write a line into test.file') with open('test.file', 'aw') as fobj: fobj.write('2nd line\n') repo.index.add(items=['test.file']) repo.index.commit('write another line into test.file')
status
GitPython并未实现原版git status,而是给出了部分的信息。
>>> repo.is_dirty() False >>> with open('test.file', 'aw') as fobj: >>> fobj.write('dirty line\n') >>> repo.is_dirty() True >>> repo.untracked_files [] >>> with open('untracked.file', 'w') as fobj: >>> fobj.write('') >>> repo.untracked_files ['untracked.file']
checkout(清理所有修改)
>>> repo.is_dirty() True >>> repo.index.checkout(force=True) <generator object <genexpr> at 0x7f2bf35e6b40> >>> repo.is_dirty() False
branch
获取当前分支:
head = repo.head
新建分支:
new_head = repo.create_head('new_head', 'HEAD^')
切换分支:
new_head.checkout() head.checkout()
删除分支:
git.Head.delete(repo, new_head) # or git.Head.delete(repo, 'new_head')
merge
以下演示如何在一个分支(other),merge另一个分支(master)。
master = repo.heads.master other = repo.create_head('other', 'HEAD^') other.checkout() repo.index.merge_tree(master) repo.index.commit('Merge from master to other')
remote, fetch, pull, push
创建remote:
remote = repo.create_remote(name='gitlab', url='git@gitlab.com:USER/REPO.git')
远程交互操作:
remote = repo.remote() remote.fetch() remote.pull() remote.push()
删除remote:
repo.delete_remote(remote) # or repo.delete_remote('gitlab')
其它
其它还有Tag、Submodule等相关操作,不是很常用,这里就不介绍了。
GitPython的优点是在做读操作时可以方便地获取内部信息,缺点是在做写操作时感觉很不顺手,隔靴搔痒。 当然,它还支持直接执行git操作。
git = repo.git git.status() git.checkout('HEAD', b="my_new_branch") git.branch('another-new-one') git.branch('-D', 'another-new-one')
这……感觉又回到了老路,而且仍然感觉怪怪的。
其它操作Git的方法
subprocess
这就是所谓『老路』。 在另一个进程,执行Shell命令,并通过stdio来解析返回结果。
import subprocess subprocess.call(['git', 'status'])
dulwich
dulwich是一个纯Python实现的Git交互库,以后有空再研究吧。
官方网站:https://www.dulwich.io/
pygit2
pygit2是基于libgit2实现的一个Python库。 底层是C,而上层Python只是接口,运行效率应该是最高的,然而孤还是放弃了。 其缺点是,需要环境中预先安装libgit2。 相比之下,GitPython只需要环境预置Git,简单多了。
官方网站:http://www.pygit2.org/
参考
- 《GitPython Documentation》
- 《Welcome to GitDB’s documentation!》
- 《Git - 底层命令 (Plumbing) 和高层命令 (Porcelain)》
- 《GitPython | Hom》
附录
在git.Repo中对context相关接口的实现如下:
def __enter__(self): return self def __exit__(self, exc_type, exc_value, traceback): self.close() def __del__(self): try: self.close() except: pass def close(self): if self.git: self.git.clear_cache() gc.collect() gitdb.util.mman.collect() gc.collect()
可见只是一些清理操作,关闭的必要性不高。 即使关闭,也仍然可以对这个git.Repo的instance进行读写操作。
相关推荐
- pip 设置镜像源
-
pip是python必不可少的的包管理工具,但是要在国内用得爽,必须要配置镜像源。我常用的是清华镜像站。pipconfigsetglobal.index-urlhttps://pypi...
- 定制构建OpenWrt发行版镜像及插件安装包,升级插件到最新版本
-
最近Tailscale提示OpenWrt路由器上的版本太低,建议升级到最新版本。OpenWrt用的23.05的,因为23.05中带的tailscale版本比较老,之前升级都是从主线版本中下载最新的ta...
- 第十节 Dockerfile 核心指南:从基础概念到镜像构建实践
-
一、Dockerfile基础概念(一)本质与作用Dockerfile是用于定义Docker镜像构建流程的文本文件,包含一系列指令和说明,指导Docker引擎生成定制化镜像。其核心价值在于:...
- Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置
-
你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...
- Docker-镜像
-
1、获取镜像在Docker中,获取(下载)镜像通常使用dockerpull命令:基本用法:dockerpull镜像名称[:标签]例如:dockerpullnginx...
- 第十二节 Ubuntu 系统 Docker 镜像安装与容器运行指南
-
一、Ubuntu镜像版本选择(一)DockerHub镜像库浏览Ubuntu官方镜像在DockerHub上提供多版本支持,访问地址:https://hub.docker.com/_/ubu...
- Docker-使用Dockerfile 定制镜像
-
一、什么是Dockerfile?Dockerfile是一个文本文件,其中包含一条条构建镜像所需的指令。Docker引擎会按顺序执行这些指令,逐步构建出最终的自定义镜像。二、Dockerfil...
- 在Windows的WSL环境中本地安装watercrawl和Python3.13
-
这段时间在折腾Dify环境调用网络爬虫工具去自动化抓取网页信息的功能,就希望在本地Windows11的WSL环境中docker方式部署watercrawl,但每次都报错如下:用命令pip--ver...
- 1分钟搞定!Python超速工具uv换国内镜像,下载速度飙升10倍
-
1分钟搞定!Python超速工具uv换国内镜像,下载速度飙升10倍作为搞运维的老手,我太清楚Python包下载速度慢是啥滋味了。今天我来教你用3行代码给uv换上清华或者阿里云的镜像,这样就...
- Dockerfile 教程:构建你的第一个自定义镜像!
-
Dockerfile就是你自定义镜像的“说明书”,学会它,你就能打造属于自己的开发环境、部署环境,甚至可以把你的应用一键打包。一、什么是Dockerfile?Dockerfile是一个文本文件...
- 提升Python编程效率的10点建议
-
程序员的时间很宝贵,Python这门语言虽然足够简单、优雅,但并不是说你使用Python编程,效率就一定会高。要想节省时间、提高效率,还是需要注意很多地方的。今天就与大家分享资深Python程序员总结...
- 掌握线性代数: 奇异值分解 (SVD)
-
奇异值分解(SVD)什么是SVD?奇异值分解是一种矩阵分解方法,它将矩阵A分解为三个分量:哪里:U是正交矩阵(mxm)Σ是包含奇异值(mxn)的对角矩阵V^T是另一个正交矩...
- 用 Docker+K8s 部署模型,再也不怕流量暴增和服务器崩溃了
-
上周朋友公司的AI模型又出问题了——电商大促期间,预测接口突然崩溃,眼睁睁看着订单流失。老板气得拍桌子:“花了几十万训练的模型,连个大促都扛不住?”这其实是很多企业的通病:模型在实验室跑得好好...
- Python 图像处理
-
以前照相从来没有那么容易。现在你只需要一部手机。拍照是免费的,如果我们不考虑手机的费用的话。就在上一代人之前,业余艺术家和真正的艺术家如果拍照非常昂贵,并且每张照片的成本也不是免费的。我们拍照是为了及...
- 一文让你掌握22个神经网络训练技巧
-
作者丨匡吉来源丨深蓝学院神经网络训练是一个非常复杂的过程,在这过程中,许多变量之间相互影响,因此我们研究者在这过程中,很难搞清楚这些变量是如何影响神经网络的。而本文给出的众多tips就是让大家,在神经...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)