百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

小白也能学会的 Git 原理—图解 git add 命令

wptr33 2025-05-15 21:28 35 浏览

通过本章节的学习,你会了解 git add 命令背后发生的故事,以及 Git 中最重要的概念“对象”的形成原理!

一、文件状态与 Git 状态

我们工作目录下的每一个文件基本上处于两种状态之中:已跟踪 或 未跟踪。

  • 已跟踪:被纳入了版本控制的文件,即 Git 已经知道的文件。
  • 未跟踪:未被纳入了版本控制的文件,即 Git 不知道的文件。

Git 有三种状态,你的文件可能处于其中之一:

  • 已提交(committed):表示数据已经安全地保存在本地版本库中。
  • 已修改(modified): 表示对一个已修改文件的当前版本做了标记。
  • 已暂存(staged):表示修改了文件,但还没保存到版本库中。

那文件状态与 Git 状态之间有关联关系么?当然有!已跟踪的文件,在工作一段时间后, 它们的状态可能是未修改,已修改或已暂存。如果是已暂存状态,就可以提交到版本库,从而变为已提交状态,反复如此。如下图所示:

二、git add 命令解析

使用命令 git add 会告知 Git 开始跟踪文件。那 git add 命令背后究竟都做了什么?

经查询得知,git add 底层对应着两个命令:

  • git hash-object:保存对象。
  • git update-index:记录暂存区。

(1)git hash-object

该命令的作用主要有两个方面:

  1. 用于将文件内容压缩成二进制,并保存到 .git/objects 目录
  2. 计算当前内容的 SHA1 哈希值(长度40的字符串),作为该对象的文件名
git status  #查看文件状态,保证工作区干净

echo 'hello world' > test.txt  #新建一个 test.txt 文件

# 1、把test.txt的当前内容压缩成二进制文件,称为Git对象,保存在.git/objects目录
# 2、计算当前内容的 SHA1 哈希值(长度40的字符串),作为该对象的文件名
git hash-object -w test.txt

由上可以看出,计算当前内容的 SHA1 哈希值(长度40的字符串)的前两位作为对象的目录名,后38位作为该对象的文件名

(2)、git update-index

通过学习上篇文章,我们知道可以通过 git ls-files --stage 命令查看"暂存区"的内容,经查看知,生成的二进制对象目前还没有被记录到 Git 暂存区中。

目前,文件只是被保存成二进制对象,那怎么通知 Git 哪些文件发生了变动,又如何让 Git 记录在"暂存区"(英文叫做 index 或者 stage)中呢?

#向暂存区写入文件名test.txt、二进制对象名(哈希值)和文件权限。
git update-index --add --cacheinfo 100644 3b18e512dba79e4c8300dd08aeb37f8e728b8dad test.txt

#显示暂存区当前的内容
git ls-files --stage

此时,暂存区里面只有一个新文件 test.txt,等待被提交至版本库。

三、Git 对象

Git 中对象有很多种,如 blob 对象、tree 对象、commit 对象、tag 对象等,今天我们主要讲解其中一种,也是最重要的一种:blob 对象!

初始化 Git 仓库时,程序会自动创建名为 objects 的目录(即 对象数据库),该目录下有两个空的文件夹:info 和 pack。存放到 objects 目录的文件主要有两种形式:

  • 压缩包文件:通过执行 git gc 命令将 objects/ 下对象打包压缩到 pack 目录下
  • hash 文件:Git 向磁盘保存对象时默认使用的格式,即松散对象 (loose object),又可称为数据对象(blob object)。

由上可知,当我们执行 git add 命令后,程序会自动将工作区的文件保存成二进制 blob 对象,并放入暂存区中。那这个 blob 对象是怎么计算出来的呢?

blob 对象数值 = sha1(blob + 空格 + 内容长度 + 内容)

故,当你对同一个文件修改哪怕一行,git 都会使用全新的文件存储这个修改了的文件,放在了 objects 中。

那我们怎么知道 objects 目录中哪些对象是 blob 对象,哪些是其他类型的对象呢?

git cat-file -t 3b18e512dba79e4c8300dd08aeb37f8e728b8dad

下章节内容预告

通过本章节的学习,你会了解 git commit 命令背后发生的故事,以及 Git 中 tree 对象的形成原理!

相关推荐

oracle数据导入导出_oracle数据导入导出工具

关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...

继续学习Python中的while true/break语句

上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个else解...

python continue和break的区别_python中break语句和continue语句的区别

python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...

简单学Python——关键字6——break和continue

Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...

2-1,0基础学Python之 break退出循环、 continue继续循环 多重循

用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...

Python 中 break 和 continue 傻傻分不清

大家好啊,我是大田。今天分享一下break和continue在代码中的执行效果是什么,进一步区分出二者的区别。一、continue例1:当小明3岁时不打印年龄,其余年龄正常循环打印。可以看...

python中的流程控制语句:continue、break 和 return使用方法

Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...

L017:continue和break - 教程文案

continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...

作为前端开发者,你都经历过怎样的面试?

已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...

面试被问 const 是否不可变?这样回答才显功底

作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...

2023金九银十必看前端面试题!2w字精品!

导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。答案:CSS的盒模型是用于布局和定位元素的概念。它由内容区域...

前端面试总结_前端面试题整理

记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...

由浅入深,66条JavaScript面试知识点(七)

作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录由浅入深,66条JavaScript面试知识点(一)由浅入深,66...

2024前端面试真题之—VUE篇_前端面试题vue2020及答案

添加图片注释,不超过140字(可选)1.vue的生命周期有哪些及每个生命周期做了什么?beforeCreate是newVue()之后触发的第一个钩子,在当前阶段data、methods、com...

今年最常见的前端面试题,你会做几道?

在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...