百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

小白也能学会的 Git 原理—图解 git add 命令

wptr33 2025-05-15 21:28 3 浏览

通过本章节的学习,你会了解 git add 命令背后发生的故事,以及 Git 中最重要的概念“对象”的形成原理!

一、文件状态与 Git 状态

我们工作目录下的每一个文件基本上处于两种状态之中:已跟踪 或 未跟踪。

  • 已跟踪:被纳入了版本控制的文件,即 Git 已经知道的文件。
  • 未跟踪:未被纳入了版本控制的文件,即 Git 不知道的文件。

Git 有三种状态,你的文件可能处于其中之一:

  • 已提交(committed):表示数据已经安全地保存在本地版本库中。
  • 已修改(modified): 表示对一个已修改文件的当前版本做了标记。
  • 已暂存(staged):表示修改了文件,但还没保存到版本库中。

那文件状态与 Git 状态之间有关联关系么?当然有!已跟踪的文件,在工作一段时间后, 它们的状态可能是未修改,已修改或已暂存。如果是已暂存状态,就可以提交到版本库,从而变为已提交状态,反复如此。如下图所示:

二、git add 命令解析

使用命令 git add 会告知 Git 开始跟踪文件。那 git add 命令背后究竟都做了什么?

经查询得知,git add 底层对应着两个命令:

  • git hash-object:保存对象。
  • git update-index:记录暂存区。

(1)git hash-object

该命令的作用主要有两个方面:

  1. 用于将文件内容压缩成二进制,并保存到 .git/objects 目录
  2. 计算当前内容的 SHA1 哈希值(长度40的字符串),作为该对象的文件名
git status  #查看文件状态,保证工作区干净

echo 'hello world' > test.txt  #新建一个 test.txt 文件

# 1、把test.txt的当前内容压缩成二进制文件,称为Git对象,保存在.git/objects目录
# 2、计算当前内容的 SHA1 哈希值(长度40的字符串),作为该对象的文件名
git hash-object -w test.txt

由上可以看出,计算当前内容的 SHA1 哈希值(长度40的字符串)的前两位作为对象的目录名,后38位作为该对象的文件名

(2)、git update-index

通过学习上篇文章,我们知道可以通过 git ls-files --stage 命令查看"暂存区"的内容,经查看知,生成的二进制对象目前还没有被记录到 Git 暂存区中。

目前,文件只是被保存成二进制对象,那怎么通知 Git 哪些文件发生了变动,又如何让 Git 记录在"暂存区"(英文叫做 index 或者 stage)中呢?

#向暂存区写入文件名test.txt、二进制对象名(哈希值)和文件权限。
git update-index --add --cacheinfo 100644 3b18e512dba79e4c8300dd08aeb37f8e728b8dad test.txt

#显示暂存区当前的内容
git ls-files --stage

此时,暂存区里面只有一个新文件 test.txt,等待被提交至版本库。

三、Git 对象

Git 中对象有很多种,如 blob 对象、tree 对象、commit 对象、tag 对象等,今天我们主要讲解其中一种,也是最重要的一种:blob 对象!

初始化 Git 仓库时,程序会自动创建名为 objects 的目录(即 对象数据库),该目录下有两个空的文件夹:info 和 pack。存放到 objects 目录的文件主要有两种形式:

  • 压缩包文件:通过执行 git gc 命令将 objects/ 下对象打包压缩到 pack 目录下
  • hash 文件:Git 向磁盘保存对象时默认使用的格式,即松散对象 (loose object),又可称为数据对象(blob object)。

由上可知,当我们执行 git add 命令后,程序会自动将工作区的文件保存成二进制 blob 对象,并放入暂存区中。那这个 blob 对象是怎么计算出来的呢?

blob 对象数值 = sha1(blob + 空格 + 内容长度 + 内容)

故,当你对同一个文件修改哪怕一行,git 都会使用全新的文件存储这个修改了的文件,放在了 objects 中。

那我们怎么知道 objects 目录中哪些对象是 blob 对象,哪些是其他类型的对象呢?

git cat-file -t 3b18e512dba79e4c8300dd08aeb37f8e728b8dad

下章节内容预告

通过本章节的学习,你会了解 git commit 命令背后发生的故事,以及 Git 中 tree 对象的形成原理!

相关推荐

如何使用git clone克隆包含子模块的仓库

技术背景在软件开发中,当项目规模逐渐增大时,为了更好地管理代码,我们常常会使用子模块将项目拆分成多个独立的部分。Git作为目前最流行的版本控制系统,提供了管理子模块的功能。但在克隆包含子模块的仓库时...

基于Docker构建安装Git/GitLab,以及制作springboot工程镜像

今天给大家分享的是《领先的开源自动化服务器Jenkins的应用实战》之基于Docker安装构建Git/GitLab版本控制与代码云存储的场所;使用Git管理项目,springboot工程制作镜像知识体...

Windows误删急救!3步找回+防删秘籍,免费工具一键恢复

“Shift+Delete一时爽,数据火葬场?”误删工作文档、清空珍贵照片、手滑格式化硬盘……这份Windows专属“后悔药”攻略,从...

Git分支创建与合并

首先,我们创建dev分支,然后切换到dev分支:12$gitcheckout-bdev...

Java项目版本控制的最佳实践

Java项目版本控制的最佳实践在Java开发的世界里,版本控制是构建高效协作和管理代码变更的基础。想象一下,如果没有版本控制,就像一群人在沙滩上画画,每个人都在修改别人的画作,很快就会变得混乱不堪。今...

10分钟搭建自己的Git仓库

10分钟搭建自己的Git仓库...

GIT,如何恢复修改过的文件,回到过去呢?

我们知道git系统有三个区域:工作目录、暂存区域和git仓库所以恢复修改过的文件,需要考虑到三种情况。第一种情况,修改了文件,之后就再也没有任何的git操作了。这种情况只需要将当前版本的暂存区的状态还...

打造企业级自动化漏洞修复系统结( GitOps + Trivy + Argo CD )

在当今DevSecOps流水线中,实现漏洞自动检测+自动修复+自动部署是关键环节。本指南将结合:...

如何搭建一个git服务器?

GitHub是一个免费托管开源代码的Git服务器,如果我们不想公开项目的源代码,又不想付费使用,那么我们可以自己搭建一台Git服务器。首先你需要一台client和一台server。client可以是w...

Python进阶-day27: 版本控制与协作

1.学习Git基本命令Git是一个强大的分布式版本控制系统,用于跟踪代码更改和团队协作。以下是课程要求的四个基本命令的说明和使用方法:(1)gitclone作用...

git 基础分支管理基础操作

两个仓库git有两个仓库,一个本地仓库,一个远端仓库。大部分开发工作都是在本地仓库完成,程序没有问题后提交到远端仓库。一般是多用户维护一个git仓库...

Git新手入门

欢迎各位准开发者与技术爱好者!如果你曾好奇专业开发者如何协作大型项目而不丢失修改记录(更不用说覆盖他人代码),那么你来对地方了。答案就是Git——已成为开发者工具库中不可或缺的利器。这份详尽指...

Git推送错误:failed to push some refs to 'git@gitee.com:XXX'

项目推送时遇Git推送错误:error:failedtopushsomerefsto‘git@gitee.com:name/project.git’...

常用git命令-从远程更新代码合并分支、提交代码等

gitconfig设置gitconfiguser.name""...

迁移GIT仓库并带有历史提交记录

迁移git仓库开发在很多时候,会遇到一个问题。GIT仓库的管理,特别是仓库的迁移。我需要保留已有的历史记录,而不是重新开发,重头再来。...