百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

为什么 Git 这么难?

wptr33 2025-02-15 17:38 19 浏览

【CSDN 编者按】作为一种分布式版本控制系统,Git 主要用于跟踪和管理文件和项目的变化。它由 Linus Torvalds 创建,最初是为了管理 Linux 内核的开发而设计的,现如今被广泛用于许多其他软件开发项目中。不过,在使用过程中,很多人觉得好用的 Git 学习曲线非常陡峭,这到底是为什么?

原文链接:
https://roadrunnertwice.dreamwidth.org/596185.html

未经允许,禁止转载!


作者 | Nick Eff 译者 | 弯月
责编 | 夏萌
出品 | CSDN(ID:CSDNnews)

在工作中,我经常需要教其他人学习如何使用 Git 及其更高级的功能。在这个过程中,这些聪明且坚持学习的人往往连基础知识都无法掌握,这令我十分恼火,因为我自诩擅长解释事物。有时,我给他们解释 rebase 就像解释波粒二象性一样,满屋子的人以一种听天书的眼神看着我。

所以,这个周末之前我花了一些时间来思考为什么学习 Git 这么难的问题。

不是因为 Git 的命令行界面太差

有一个很明显的原因,Git 的命令行界面太差。但这个理由还不够充分,因为我们都见过更差的界面(或者,几乎差不多的情况)。

只要你对想完成的目标有详细的了解,就应该可以通过记忆和外部的参考资料来解决这个问题。虽然很麻烦,但至少有一条已知的学习途径。而学习 Git 的人并没有这个问题。

奇怪的思维模式

这个问题可以分为两部分讨论:

  • 除非你掌握了 Git核心概念的思维模式和相应的类比(对象以及可以执行的操作),否则不可能安全地使用 Git。

  • Git 的核心概念完全不同于大多数人看待世界的方式。因此,用户倾向于采用更舒服(但不可行)的类比,这会导致混乱和结果不可预测。(此外,Git 的 命令行界面极大地模糊了这些核心概念,因此任何人学习的时候都要经历一场艰难的考验,即使他们的思维方式正确也无济于事。

我发现真正的问题在于,新手用户无法针对想要完成的任务制定有效的计划。有时,我会尝试让他们描述自己正在做什么,通常得到的答案不仅不完整或幼稚,而且非常混乱。

以下各项是 Git 超出人们的想象力和理解力的一些重要方面:

  • 提交是 Git 世界线的唯一组成部分

  • 提交内容既是快照也是补丁

  • 远程操作的定义模糊,还有一定的延迟

  • 分支并不完全是分支,它们更像是小书签

  • 合并冲突非常难

  • git pull 操作存在

提交是 Git 世界线的唯一组成部分

提交是唯一且不可变的,而且还被固定到了历史与因果关系图中的特定点。这意味着,提交的身份由内容和上下文组成。(如果提交的内容相同,但父项不同,则不是同一个提交。)反过来,这意味着你需要适应分支多世界宇宙学,能够区分具有相同意图和内容的变更与快照,明白它们完全不可互换,并且代表完全不同的历史事件流程。

新手 Git 用户往往认为内容本身就构成了身份,这种思维方式虽然更自然,但会给你带来很多麻烦。

提交内容既是快照也是补丁

Git提交作为快照存储在磁盘上,但你不一定要将它们当成快照。各种 Git 命令不仅将提交视为完整的代码库快照,还会将其视为变更集合,具体取决于执行的操作。(作为补丁的提交并没有持久存储在某个地方,而是根据需要通过与其父级进行比较而派生。)

举个例子,cherry-pick 或 revert 之类的命令将提交视为补丁。show 将提交视为两者兼而有之,具体取决于参数!

Git新手用户往往很难理解自己的操作将提交视为了快照还是补丁,这给制定可靠的计划增加了一些额外的困难。

远程操作身份模糊,还有一定的延迟

你需要了解下述概念:

  • 本地代码库。

  • 上游远程库的“真正”版本,位于网络中的另一台计算机上。

  • 最后一次获取的上游远程分支的本地缓存副本。

  • 本地代码库的分支,标记为与上游远程中的某个分支同步。

  • 以上后三者的更多实例,因为你可能有多个远程和许多跟踪分支。

Git新手用户根本无法区分这些概念。命令行界面未能消除歧义,而且关系和交互也很复杂。举个例子,考虑如下:

  • 你的本地克隆也叫 remote。

  • 分支名称在多个远程代码库之间完全独立。(通常我们会认为名称表示全局身份。然而,在 Git 中却并非如此!你的 main 与上游的 main 或分支的 main 没有特殊联系,这只是一种习惯约定。

  • 但是,提交有一个稳定的全局身份!标签也是,虽然其身份比提交弱一些。

  • 顺便问一下,origin是什么意思?并没有特别规定,它只是 git clone 创建的默认名称,但它指的究竟是上游代码库、你的 GitHub 分叉,还是别的东西?重命名远程到很后面才会接触,这意味着在推送的时候,你经常会感到困惑。(我建议重命名origin,这样任何远程都代表某个上游或某个代码库,但这只是我个人的经验之谈。

  • “跟踪分支”实际上并不特殊,它们只是注册一些方便使用的命令的方式。你可以推送或合并任何事物。

  • 正斜杠(/)有时是特殊的命名空间分隔符,用于表示缓存的远程分支,有时则不然。

  • 但是,将分支推送到远程时,切勿使用斜杠,而应使用空格。(因为这时你操作对远程代码库,而不是本地的缓存远程库。

  • 当报告跟踪分支的状态时,Git 会使用缓存的远程内容,但这些内容可能已经过期,并且根据真实的远程状态你的推送可能会被拒绝。

分支并不完全是分支,它们更像是小书签

对此,我不知道如何更好地解释,但你可以理解为:分支的有向无环图结构是不可变提交历史所固有的,而 Git“分支”实际上只是一个元数据,可以帮助你更方便地浏览结构:

  • 分支就像书签一样,你可以在它们之间快速切换。

  • 当前分支会随着你所做的每一次新提交而向前推进,可以更轻松地跟踪你的工作。

  • 但是,你可以挑选一个分支,并将其放置在图的任意一点(git reset)。

  • 分支并不相互排斥,它们并不“拥有”自身所处的历史分支。

所以,分支就是可以移动的小书签。你可以把它们想象成其他东西,而且最终你发现它们的行为方式确实令人困惑。

合并冲突非常难

这实际上并不是一个概念问题,通常人们会理解为“我们的改动相互冲突”。分析并解决冲突本来就很难。“如果我事先看到了你的改动,我会怎么改?”这是一个非常复杂的问题,这个问题的出现远远早于一小部分改动出现冲突,何况现有的界面在将冲突概念化方面做得非常糟糕,很容易让人头昏脑胀。

git pull 操作存在

也许只有我一个人这么想,但这个问题确实让我感到很困惑,我们教给新用户的第一件事就是依赖一个命令,而且这个命令的意思翻译过来就是:立即改变我的本地分支,以反映上游发生过的编辑,但根据定义,我没有机会通过任何明确的行为(这些行为由配置控制,但一般新手都不太理解配置)审核代码,也无法确定我的改动是否有可能破坏分支的现有因果历史。

我更喜欢的行为是按照某人的建议设置 pull.rebase = true,然后让新手将他们协作的分支 pull 到其他人刚刚合并过的 origin/main 上。这样就可以减少混乱!

“pull”代表了一种幻象:你只希望 Git 完美地做好一切,让你能够正确地 push,而不用理解究竟发生了什么。如上所述,这与 Git 的工作原理完全相悖。这种幻像非常有害!我们在教新手时,能不能先让他们理解“fetch,观察,理解之后再决定是做 fast-forward 还是 merge 还是 rebase 还是 reset”?

那么怎么办?

我不知道。

好吧,我有个很强烈的想法:在教新手时,你必须不断强化核心概念。不厌其烦地要求新手解释他们对于任务的理解,阐明他们的思维模型,直到他们能够准确预测 Git 怎样执行各种命令。采用各种解释和比喻,直到找到一种适合他们的思维的比喻,而且要接受,你永远不是最后一个使用这种比喻的人。

但我还没有找到任何放之四海而皆准的比喻。有一些有趣的可视化的确有帮助,但并没有解释“代码变更内容本身并不是身份的全部”。

一些工具可以帮助用户提升对这些概念的理解,从而不断改进预期和估计。我特别喜欢展示历史图,可以通过外部应用程序和 gitx/gitk 等工具,以及我最爱的 log --date=format:'%a %b %e, %Y' --pretty=format:'%C(yellow)%h%C(reset) %s %C(cyan)%cd%C(reset) %C(blue)%an%C(reset) %C(green)%d%C(reset)' --graph 命令(可以放到.gitconfig 中并起个别名 lg,如果行太长,可以使用-S 作为换行)。但历史图至少需要部分理解概念,否则只不过是另一个令人头晕目眩的东西。

毕竟,这才是 Git 难学的真正原因。

相关推荐

MySQL进阶五之自动读写分离mysql-proxy

自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...

Postgres vs MySQL_vs2022连接mysql数据库

...

3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?

引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...

一文由浅入深带你完全掌握MySQL的锁机制原理与应用

本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...

验证Mysql中联合索引的最左匹配原则

后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...

MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)

目录1.索引基础...

你会看 MySQL 的执行计划(EXPLAIN)吗?

SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...

MySQL 从入门到精通(四)之索引结构

索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...

mysql总结——面试中最常问到的知识点

mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...

mysql总结——面试中最常问到的知识点(2)

首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...

MySQL基础全知全解!超详细无废话!轻松上手~

本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...

深入剖析 MySQL 中的锁机制原理_mysql 锁详解

在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...

Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析

引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...

MySQL基础篇:DQL数据查询操作_mysql 查

一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...

MySql:索引的基本使用_mysql索引的使用和原理

一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...