简体中文 ▾ 主题 ▾ 最新版本 ▾ git-diff-index 上次更新于 2.48.0

名称

git-diff-index - 比较树与工作区或索引

概要

git diff-index [-m] [--cached] [--merge-base] [<common-diff-options>] <tree-ish> [<path>…​]

描述

将树对象中找到的 blob 的内容和模式与工作区中相应的已跟踪文件或索引中相应的路径进行比较。如果存在 <path> 参数,则只比较与这些模式匹配的路径。否则,比较所有已跟踪文件。

选项

-p
-u
--patch

生成补丁(参见 使用 -p 生成补丁文本)。

-s
--no-patch

抑制所有来自 diff 机制的输出。对于默认显示补丁的命令(例如 git show)很有用,可以取消其输出,或用于在别名中取消命令行中较早出现的 --patch--stat 等选项的效果。

-U<n>
--unified=<n>

生成包含 <n> 行上下文(而不是通常的三行)的 diff。隐含 --patch

--output=<file>

输出到特定文件而不是标准输出。

--output-indicator-new=<char>
--output-indicator-old=<char>
--output-indicator-context=<char>

指定用于指示生成补丁中新行、旧行或上下文行的字符。通常它们分别是 +- 和 ' '。

--raw

以原始格式生成 diff。这是默认设置。

--patch-with-raw

-p --raw 的同义词。

--indent-heuristic

启用启发式算法,该算法会移动差异块边界,使补丁更易于阅读。这是默认设置。

--no-indent-heuristic

禁用缩进启发式算法。

--minimal

花费额外时间以确保生成最小的差异。

--patience

使用“patience diff”算法生成差异。

--histogram

使用“histogram diff”算法生成差异。

--anchored=<text>

使用“anchored diff”算法生成差异。

此选项可以多次指定。

如果一行在源和目标中都存在,只存在一次,并且以 <text> 开头,则此算法会尝试阻止其在输出中显示为删除或添加。它内部使用“patience diff”算法。

--diff-algorithm=(patience|minimal|histogram|myers)

选择一种差异算法。变体如下:

default
myers

基本的贪婪差异算法。目前,这是默认值。

minimal

花费额外时间以确保生成最小的差异。

patience

生成补丁时使用“patience diff”算法。

histogram

此算法扩展了 patience 算法以“支持低出现率的常见元素”。

例如,如果您将 diff.algorithm 变量配置为非默认值,但希望使用默认值,则必须使用 --diff-algorithm=default 选项。

--stat[=<width>[,<name-width>[,<count>]]]

生成 diffstat。默认情况下,文件名部分将使用尽可能多的空间,其余空间用于图表部分。最大宽度默认为终端宽度,如果未连接到终端则为 80 列,并且可以通过 <width> 覆盖。文件名部分的宽度可以通过在逗号后给定另一个宽度 <name-width> 或通过设置 diff.statNameWidth=<name-width> 来限制。图表部分的宽度可以通过使用 --stat-graph-width=<graph-width> 或通过设置 diff.statGraphWidth=<graph-width> 来限制。使用 --stat--stat-graph-width 会影响所有生成 stat 图表的命令,而设置 diff.statNameWidthdiff.statGraphWidth 不会影响 git format-patch。通过给定第三个参数 <count>,可以将输出限制为前 <count> 行,如果还有更多行,则后面跟 ...

这些参数也可以使用 --stat-width=<width>--stat-name-width=<name-width>--stat-count=<count> 单独设置。

--compact-summary

在 diffstat 中输出扩展头信息的精简摘要,例如文件创建或删除(“new”或“gone”,如果是符号链接则可选 +l)和模式更改(+x-x 分别用于添加或删除可执行位)。该信息位于文件名部分和图表部分之间。隐含 --stat

--numstat

类似于 --stat,但以十进制表示法显示添加和删除的行数,并且不缩写路径名,以使其更具机器友好性。对于二进制文件,输出两个 - 而不是 0 0

--shortstat

仅输出 --stat 格式的最后一行,其中包含修改文件的总数,以及添加和删除的行数。

-X [<param>,...]
--dirstat[=<param>,...]

输出每个子目录的相对更改量分布。--dirstat 的行为可以通过向其传递逗号分隔的参数列表进行自定义。默认值由 diff.dirstat 配置变量控制(参见 git-config[1])。以下参数可用:

changes

通过计算从源文件删除或添加到目标文件的行数来计算目录统计数字。这会忽略文件内部纯粹的代码移动量。换句话说,文件中的行重排不像其他更改那样被计算在内。这是未给定参数时的默认行为。

lines

通过执行常规的基于行的 diff 分析并汇总已删除/已添加的行数来计算目录统计数字。(对于二进制文件,改为计算 64 字节块,因为二进制文件没有自然的行概念)。这是一种比 changes 行为更昂贵的 --dirstat 行为,但它确实会将文件内重排的行与其他更改一样计算在内。最终输出与您从其他 --*stat 选项获得的输出一致。

files

通过计算更改的文件数量来计算目录统计数字。在目录统计分析中,每个更改的文件都同等重要。这是计算成本最低的 --dirstat 行为,因为它根本不需要查看文件内容。

cumulative

也计算子目录中对父目录的更改。请注意,当使用 cumulative 时,报告的百分比总和可能超过 100%。默认(非累积)行为可以通过 noncumulative 参数指定。

<limit>

一个整数参数,指定一个截止百分比(默认为 3%)。对更改贡献低于此百分比的目录不会显示在输出中。

示例:以下命令将计算更改的文件,同时忽略更改文件总量少于 10% 的目录,并在父目录中累积子目录计数:--dirstat=files,10,cumulative

--cumulative

--dirstat=cumulative 的同义词。

--dirstat-by-file[=<param>,...]

--dirstat=files,<param>,... 的同义词。

--summary

输出扩展头信息的精简摘要,例如创建、重命名和模式更改。

--patch-with-stat

-p --stat 的同义词。

-z

当给定 --raw--numstat--name-only--name-status 时,不修改路径名,并使用 NUL 作为输出字段终止符。

如果没有此选项,包含“不寻常”字符的路径名将按照配置变量 core.quotePath 的解释进行引用(参见 git-config[1])。

--name-only

仅显示后像树中每个已更改文件的名称。文件名通常以 UTF-8 编码。有关更多信息,请参阅 git-log[1] 手册页中关于编码的讨论。

--name-status

仅显示每个已更改文件的名称和状态。有关状态字母的含义,请参见 --diff-filter 选项的描述。与 --name-only 类似,文件名通常以 UTF-8 编码。

--submodule[=<format>]

指定如何显示子模块中的差异。当指定 --submodule=short 时,使用 short 格式。此格式仅显示范围开头和结尾的提交名称。当指定 --submodule--submodule=log 时,使用 log 格式。此格式像 git-submodule[1] summary 一样列出范围内的提交。当指定 --submodule=diff 时,使用 diff 格式。此格式以内联 diff 的形式显示提交范围内子模块内容的更改。如果配置选项未设置,则默认为 diff.submoduleshort 格式。

--color[=<when>]

显示彩色 diff。--color(即不带 =<when>)与 --color=always 相同。<when> 可以是 alwaysneverauto 之一。

--no-color

关闭彩色 diff。它与 --color=never 相同。

--color-moved[=<mode>]

移动的代码行以不同颜色显示。如果未给出选项,<mode> 默认为 no;如果给定无模式的选项,则默认为 zebra。模式必须是以下之一:

no

移动的行不进行高亮显示。

default

zebra 的同义词。未来可能会更改为更合理的模式。

plain

在一个位置添加并在另一个位置删除的任何行都将使用 color.diff.newMoved 着色。类似地,color.diff.oldMoved 将用于在 diff 中添加到其他位置的已删除行。此模式会检测任何移动的行,但在审查中确定代码块是否在没有置换的情况下移动时,它不是很有用。

blocks

至少包含 20 个字母数字字符的移动文本块会被贪婪地检测到。检测到的块将使用 color.diff.(old|new)Moved 颜色绘制。相邻块无法区分。

zebra

移动文本块的检测方式与 blocks 模式相同。这些块将使用 color.diff.(old|new)Moved 颜色或 color.diff.(old|new)MovedAlternative 颜色进行绘制。两种颜色之间的变化表示检测到一个新块。

dimmed-zebra

类似于 zebra,但对移动代码中不感兴趣的部分进行了额外的变暗处理。两个相邻块的边界行被认为是感兴趣的,其余部分不感兴趣。dimmed_zebra 是一个已弃用的同义词。

--no-color-moved

关闭移动检测。这可以用于覆盖配置设置。它与 --color-moved=no 相同。

--color-moved-ws=<mode>,...

这配置了在执行 --color-moved 的移动检测时如何忽略空白。这些模式可以作为逗号分隔的列表给出:

no

执行移动检测时不忽略空白。

ignore-space-at-eol

忽略行尾空格的更改。

ignore-space-change

忽略空格数量的变化。这会忽略行尾的空格,并将所有其他一个或多个空格序列视为等效。

ignore-all-space

比较行时忽略空格。即使一行有空格而另一行没有,这也忽略了差异。

allow-indentation-change

在移动检测中最初忽略所有空白,然后仅当每行的空白更改相同时,才将移动的代码块分组为一个块。这与其他模式不兼容。

--no-color-moved-ws

执行移动检测时不忽略空白。这可以用于覆盖配置设置。它与 --color-moved-ws=no 相同。

--word-diff[=<mode>]

默认情况下,单词由空白分隔;参见下面的 --word-diff-regex<mode> 默认为 plain,并且必须是以下之一:

color

仅使用颜色高亮显示更改的单词。隐含 --color

plain

将单词显示为 [-removed-]{added}。如果分隔符出现在输入中,不尝试转义它们,因此输出可能不明确。

porcelain

使用专门的基于行的格式,旨在供脚本使用。添加/删除/未更改的运行以通常的统一 diff 格式打印,行首以 +/-/` ` 字符开头并延伸到行尾。输入中的换行符由单独一行上的波浪号 ~ 表示。

none

再次禁用单词 diff。

请注意,尽管第一个模式的名称如此,如果启用,所有模式都使用颜色高亮显示更改的部分。

--word-diff-regex=<regex>

使用 <regex> 来决定什么是单词,而不是将非空白字符的连续序列视为一个单词。除非已启用,否则这也隐含 --word-diff

<regex> 的每个非重叠匹配都被视为一个单词。这些匹配之间的任何内容都被视为空白,并为查找差异的目的而忽略(!)您可能希望将 |[^[:space:]] 附加到您的正则表达式中,以确保它匹配所有非空白字符。包含换行符的匹配将在换行符处静默截断(!)。

例如,--word-diff-regex=. 会将每个字符视为一个单词,并相应地逐字符显示差异。

正则表达式也可以通过 diff 驱动程序或配置选项设置,参见 gitattributes[5]git-config[1]。显式给定它会覆盖任何 diff 驱动程序或配置设置。Diff 驱动程序会覆盖配置设置。

--color-words[=<regex>]

相当于 --word-diff=color 加上(如果指定了正则表达式)--word-diff-regex=<regex>

--no-renames

关闭重命名检测,即使配置文件默认开启。

--[no-]rename-empty

是否使用空 blob 作为重命名源。

--check

警告更改是否引入了冲突标记或空白错误。哪些被认为是空白错误由 core.whitespace 配置控制。默认情况下,行尾空白(包括仅由空白组成的行)以及行初始缩进中紧跟制表符的空格字符都被认为是空白错误。如果发现问题,则以非零状态退出。与 --exit-code 不兼容。

--ws-error-highlight=<kind>

高亮显示 diff 的 contextoldnew 行中的空白错误。多个值用逗号分隔,none 重置先前的值,default 将列表重置为 newallold,new,context 的缩写。如果未给定此选项,并且未设置配置变量 diff.wsErrorHighlight,则仅高亮显示 new 行中的空白错误。空白错误将用 color.diff.whitespace 颜色着色。

--full-index

在生成补丁格式输出时,不在“index”行上显示前几个字符,而是显示完整的原图像和后图像 blob 对象名称。

--binary

除了 --full-index 之外,还输出一个二进制 diff,该 diff 可以用 git-apply 应用。隐含 --patch

--abbrev[=<n>]

在 diff-raw 格式输出和 diff-tree 头行中,不显示完整的 40 字节十六进制对象名称,而是显示最短且至少 <n> 位十六进制数字长的唯一引用对象的短前缀。在 diff-patch 输出格式中,--full-index 优先级更高,即如果指定了 --full-index,无论 --abbrev 如何,都将显示完整的 blob 名称。非默认位数的数字可以使用 --abbrev=<n> 指定。

-B[<n>][/<m>]
--break-rewrites[=[<n>][/<m>]]

将完整的重写更改分解为删除和创建对。这有两个目的:

它影响将文件完全重写视为单个旧内容删除后跟单个新内容插入的方式,而不是删除和插入与少量文本匹配行作为上下文混合在一起的序列。数字 <m> 控制 -B 选项的这一方面(默认为 60%)。-B/70% 指定如果结果中保留的原始内容少于 30%,Git 才将其视为完全重写(即,否则生成的补丁将是删除和插入与上下文行混合在一起的序列)。

当与 -M 一起使用时,完全重写的文件也被视为重命名的源文件(通常 -M 仅将消失的文件视为重命名的源文件),数字 <n> 控制 -B 选项的这一方面(默认为 50%)。-B20% 指定如果更改的添加和删除量与文件大小的 20% 或更多相比,则有资格被识别为重命名到另一个文件的可能源。

-M[<n>]
--find-renames[=<n>]

检测重命名。如果指定了 <n>,它是一个相似度索引的阈值(即,与文件大小相比的添加/删除量)。例如,-M90% 意味着如果文件超过 90% 未更改,Git 应将删除/添加对视为重命名。如果没有 % 符号,则该数字应视为分数,前面有一个小数点。即,-M5 变为 0.5,因此与 -M50% 相同。类似地,-M05-M5% 相同。要将检测限制为精确重命名,请使用 -M100%。默认相似度索引为 50%。

-C[<n>]
--find-copies[=<n>]

检测复制和重命名。另请参见 --find-copies-harder。如果指定了 <n>,其含义与 -M<n> 相同。

--find-copies-harder

出于性能原因,默认情况下,-C 选项仅当复制的原始文件在同一变更集中被修改时才查找副本。此标志使命令检查未修改的文件作为复制源的候选。对于大型项目来说,这是一项非常昂贵的操作,因此请谨慎使用。给定多个 -C 选项具有相同的效果。

-D
--irreversible-delete

删除时省略原始映像,即只打印头信息,而不打印原始映像与 /dev/null 之间的 diff。生成的补丁不适用于 patchgit apply;这仅适用于希望专注于审查更改后文本的人。此外,输出显然缺乏足够的信息来反向应用此类补丁,即使是手动操作,因此得名。

-B 一起使用时,也会省略删除/创建对的删除部分中的原始图像。

-l<num>

-M-C 选项涉及一些初步步骤,可以廉价地检测重命名/复制的子集,然后是一个详尽的回退部分,将所有剩余的未配对目标与所有相关源进行比较。(对于重命名,只有剩余的未配对源是相关的;对于复制,所有原始源是相关的。)对于 N 个源和目标,这种详尽检查的复杂度为 O(N^2)。如果涉及的源/目标文件数量超过指定数字,此选项将阻止重命名/复制检测的详尽部分运行。默认为 diff.renameLimit。请注意,值 0 被视为无限制。

--diff-filter=[(A|C|D|M|R|T|U|X|B)...[*]]

仅选择已添加(A)、已复制(C)、已删除(D)、已修改(M)、已重命名(R)、类型已更改(即常规文件、符号链接、子模块等)(T)、未合并(U)、未知(X)或配对已损坏(B)的文件。可以使用筛选字符的任意组合(包括不使用)。当 *(全选或不选)添加到组合中时,如果比较中有任何文件匹配其他条件,则选择所有路径;如果没有文件匹配其他条件,则不选择任何内容。

此外,这些大写字母可以小写以进行排除。例如,--diff-filter=ad 会排除已添加和已删除的路径。

请注意,并非所有 diff 都能包含所有类型。例如,如果禁用对这些类型的检测,则不会出现已复制和已重命名条目。

-S<string>

查找更改文件中指定 <string> 出现次数(即添加/删除)的差异。供脚本编写者使用。

当您正在寻找精确的代码块(如结构体),并希望了解该块自首次出现以来的历史记录时,它很有用:迭代使用此功能,将原始映像中有趣的块重新输入到 -S 中,然后继续操作,直到获得该块的第一个版本。

二进制文件也会被搜索。

-G<regex>

查找其补丁文本包含与 <regex> 匹配的添加/删除行的差异。

为了说明 -S<regex> --pickaxe-regex-G<regex> 之间的区别,考虑一个在同一文件中具有以下 diff 的提交:

+    return frotz(nitfol, two->ptr, 1, 0);
...
-    hit = frotz(nitfol, mf2.ptr, 1, 0);

尽管 git log -G"frotz\(nitfol" 会显示此提交,但 git log -S"frotz\(nitfol" --pickaxe-regex 不会(因为该字符串的出现次数没有改变)。

除非提供了 --text,否则没有 textconv 过滤器的二进制文件的补丁将被忽略。

有关更多信息,请参见 gitdiffcore[7] 中的 *pickaxe* 条目。

--find-object=<object-id>

查找更改指定对象出现次数的差异。类似于 -S,只是参数不同,它不搜索特定字符串,而是搜索特定对象 ID。

该对象可以是 blob 或子模块提交。它隐含了 git-log 中的 -t 选项,以也查找树。

--pickaxe-all

-S-G 找到更改时,显示该变更集中所有更改,而不仅仅是包含 <string> 更改的文件。

--pickaxe-regex

将提供给 -S<string> 视为扩展的 POSIX 正则表达式进行匹配。

-O<orderfile>

控制文件在输出中出现的顺序。这会覆盖 diff.orderFile 配置变量(参见 git-config[1])。要取消 diff.orderFile,请使用 -O/dev/null

输出顺序由 <orderfile> 中全局模式的顺序决定。所有路径名匹配第一个模式的文件首先输出,所有路径名匹配第二个模式(但不匹配第一个)的文件其次输出,依此类推。所有路径名不匹配任何模式的文件最后输出,就像文件末尾有一个隐式匹配所有模式一样。如果多个路径名具有相同的等级(它们匹配相同的模式但没有更早的模式),则它们相对于彼此的输出顺序是正常顺序。

<orderfile> 解析如下:

  • 空行被忽略,因此它们可以用作分隔符以提高可读性。

  • 以井号("#")开头的行被忽略,因此它们可以用作注释。如果模式以井号开头,请在模式开头添加反斜杠("\")。

  • 其他每行包含一个模式。

模式具有与用于 fnmatch(3) 的模式相同的语法和语义,但不带 FNM_PATHNAME 标志,只是如果删除最终路径名组件的任意数量后与模式匹配,则路径名也匹配该模式。例如,模式 "foo*bar" 匹配 "fooasdfbar" 和 "foo/bar/baz/asdf",但不匹配 "foobarx"。

--skip-to=<file>
--rotate-to=<file>

从输出中丢弃命名文件 <file> 之前的文件(即 *skip to*),或将它们移动到输出的末尾(即 *rotate to*)。这些选项主要是为 git difftool 命令的使用而发明的,否则可能不是很有用。

-R

交换两个输入;即,显示从索引或磁盘文件到树内容的差异。

--relative[=<path>]
--no-relative

当在项目子目录中运行时,可以使用此选项排除目录外部的更改,并显示相对于该子目录的路径名。当您不在子目录中(例如,在裸仓库中)时,可以通过提供 <path> 作为参数来指定输出相对于哪个子目录。--no-relative 可用于取消 diff.relative 配置选项和之前的 --relative

-a
--text

将所有文件视为文本。

--ignore-cr-at-eol

进行比较时忽略行尾的回车符。

--ignore-space-at-eol

忽略行尾空格的更改。

-b
--ignore-space-change

忽略空格数量的变化。这会忽略行尾的空格,并将所有其他一个或多个空格序列视为等效。

-w
--ignore-all-space

比较行时忽略空格。即使一行有空格而另一行没有,这也忽略了差异。

--ignore-blank-lines

忽略所有空行的更改。

-I<regex>
--ignore-matching-lines=<regex>

忽略所有行都匹配 <regex> 的更改。此选项可以多次指定。

--inter-hunk-context=<number>

在差异块之间显示上下文,最多达指定行数 <number>,从而合并彼此接近的块。默认为 diff.interHunkContext,如果未设置配置选项则为 0。

-W
--function-context

将整个函数显示为每个更改的上下文行。函数名称的确定方式与 git diff 生成补丁 hunk 头的方式相同(参见 gitattributes[5] 中“定义自定义 hunk-header”)。

--exit-code

使程序以类似于 diff(1) 的代码退出。也就是说,如果存在差异,则以 1 退出,0 表示无差异。

--quiet

禁用程序的所有输出。隐含 --exit-code。禁用外部 diff 助手的执行,其退出代码不受信任,即其各自的配置选项 diff.trustExitCodediff.<driver>.trustExitCode 或环境变量 GIT_EXTERNAL_DIFF_TRUST_EXIT_CODE 为 false。

--ext-diff

允许执行外部差异辅助程序。如果您使用 gitattributes[5] 设置了外部差异驱动程序,则需要与 git-log[1] 等命令一起使用此选项。

--no-ext-diff

禁止外部差异驱动程序。

--textconv
--no-textconv

允许(或不允许)在比较二进制文件时运行外部文本转换过滤器。有关详细信息,请参见 gitattributes[5]。由于 textconv 过滤器通常是单向转换,因此生成的 diff 适合人工阅读,但无法应用。因此,textconv 过滤器默认仅对 git-diff[1]git-log[1] 启用,而不对 git-format-patch[1] 或 diff 内部命令启用。

--ignore-submodules[=(none|untracked|dirty|all)]

在 diff 生成中忽略对子模块的更改。all 是默认值。使用 none 将在子模块包含未跟踪或已修改文件或其 HEAD 与超级项目中记录的提交不同时,将其视为已修改,并且可以用于覆盖 git-config[1]gitmodules[5]ignore 选项的任何设置。当使用 untracked 时,子模块在仅包含未跟踪内容时不会被视为脏的(但它们仍会扫描修改过的内容)。使用 dirty 会忽略子模块工作区的所有更改,仅显示超级项目中存储的提交更改(这是 1.7.0 之前的行为)。使用 all 会隐藏对子模块的所有更改。

--src-prefix=<prefix>

显示给定的源前缀 <prefix> 而不是 "a/"。

--dst-prefix=<prefix>

显示给定的目标前缀 <prefix> 而不是 "b/"。

--no-prefix

不显示任何源或目标前缀。

--default-prefix

使用默认的源和目标前缀("a/" 和 "b/")。这会覆盖配置变量,例如 diff.noprefixdiff.srcPrefixdiff.dstPrefixdiff.mnemonicPrefix(参见 git-config[1])。

--line-prefix=<prefix>

在每行输出前面添加一个额外的 <prefix>

--ita-invisible-in-index

默认情况下,由 git add -N 添加的条目在 git diff 中显示为现有空文件,在 git diff --cached 中显示为新文件。此选项使该条目在 git diff 中显示为新文件,在 git diff --cached 中显示为不存在。此选项可以使用 --ita-visible-in-index 恢复。这两个选项都是实验性的,未来可能会被移除。

有关这些通用选项的更详细说明,另请参见 gitdiffcore[7]

<tree-ish>

要比较的树对象的 ID。

--cached

根本不考虑磁盘上的文件。

--merge-base

不直接比较 <tree-ish>,而是使用 <tree-ish> 和 HEAD 之间的合并基础。<tree-ish> 必须是一个提交。

-m

默认情况下,索引中记录但未检出的文件会报告为已删除。此标志使 git diff-index 声明所有未检出的文件都是最新的。

原始输出格式

git-diff-indexgit-diff-treegit-diff-filesgit diff --raw 的原始输出格式非常相似。

这些命令都比较两组事物;比较的内容有所不同:

git-diff-index <tree-ish>

比较 <tree-ish> 和文件系统上的文件。

git-diff-index --cached <tree-ish>

比较 <tree-ish> 和索引。

git-diff-tree [-r] <tree-ish-1> <tree-ish-2> [<pattern>...]

比较由两个参数命名的树。

git-diff-files [<pattern>...]

比较索引和文件系统上的文件。

git-diff-tree 命令通过打印所比较内容的哈希值来开始其输出。之后,所有命令都为每个更改的文件打印一行输出。

输出行格式如下:

in-place edit  :100644 100644 bcd1234 0123456 M file0
copy-edit      :100644 100644 abcd123 1234567 C68 file1 file2
rename-edit    :100644 100644 abcd123 1234567 R86 file1 file3
create         :000000 100644 0000000 1234567 A file4
delete         :100644 000000 1234567 0000000 D file5
unmerged       :000000 000000 0000000 0000000 U file6

即从左到右:

  1. 一个冒号。

  2. "src" 的模式;如果为创建或未合并,则为 000000。

  3. 一个空格。

  4. "dst" 的模式;如果为删除或未合并,则为 000000。

  5. 一个空格。

  6. "src" 的 SHA1;如果为创建或未合并,则为 0{40}。

  7. 一个空格。

  8. "dst" 的 SHA1;如果为删除、未合并或“工作区与索引不同步”,则为 0{40}。

  9. 一个空格。

  10. 状态,后跟可选的“分数”数字。

  11. 当使用 -z 选项时,一个制表符或一个 NUL。

  12. "src" 的路径。

  13. 当使用 -z 选项时,一个制表符或一个 NUL;仅在 C 或 R 状态下存在。

  14. "dst" 的路径;仅在 C 或 R 状态下存在。

  15. 当使用 -z 选项时,一个 LF 或一个 NUL,用于终止记录。

可能的状态字母是:

  • A:添加文件

  • C:将文件复制为新文件

  • D:删除文件

  • M:文件内容或模式的修改

  • R:文件重命名

  • T:文件类型(常规文件、符号链接或子模块)的更改

  • U:文件未合并(您必须在提交之前完成合并)

  • X:“未知”更改类型(很可能是一个 bug,请报告)

状态字母 CR 总是后跟一个分数(表示移动或复制的源和目标之间的相似度百分比)。状态字母 M 可以后跟一个分数(表示文件重写的差异百分比)。

如果文件系统上的文件与索引不同步,则“dst”的 SHA1 显示为全 0。

示例

:100644 100644 5be4a4a 0000000 M file.c

如果没有 -z 选项,包含“不寻常”字符的路径名将按照配置变量 core.quotePath 的解释进行引用(参见 git-config[1])。使用 -z 时,文件名按原样输出,行以 NUL 字节终止。

合并的 diff 格式

git-diff-treegit-diff-filesgit-diff --raw 可以使用 -c--cc 选项为合并提交生成 diff 输出。输出与上述格式的不同之处在于:

  1. 每个父级都有一个冒号

  2. 有更多的“src”模式和“src”SHA1

  3. 状态是每个父级的状态字符的连接

  4. 没有可选的“分数”数字

  5. 以制表符分隔的文件路径名

对于 -c--cc,即使文件在历史的任何一边被重命名,也只显示目标或最终路径。使用 --combined-all-paths 时,将显示每个父级中的路径名,然后是合并提交中的路径名。

-c--cc 不带 --combined-all-paths 的示例:

::100644 100644 100644 fabadb8 cc95eb0 4866510 MM	desc.c
::100755 100755 100755 52b7a2d 6d1ac04 d2ac7d7 RM	bar.sh
::100644 100644 100644 e07d6c5 9042e82 ee91881 RR	phooey.c

--combined-all-paths 添加到 -c--cc 时的示例:

::100644 100644 100644 fabadb8 cc95eb0 4866510 MM	desc.c	desc.c	desc.c
::100755 100755 100755 52b7a2d 6d1ac04 d2ac7d7 RM	foo.sh	bar.sh	bar.sh
::100644 100644 100644 e07d6c5 9042e82 ee91881 RR	fooey.c	fuey.c	phooey.c

请注意,combined diff 仅列出从所有父级修改过的文件。

使用 -p 生成补丁文本

运行 git-diff[1]git-log[1]git-show[1]git-diff-index[1]git-diff-tree[1]git-diff-files[1] 并带上 -p 选项会生成补丁文本。您可以通过 GIT_EXTERNAL_DIFFGIT_DIFF_OPTS 环境变量(参见 git[1])以及 diff 属性(参见 gitattributes[5])自定义补丁文本的创建。

-p 选项生成的输出与传统的 diff 格式略有不同:

  1. 它前面是“git diff”头,看起来像这样:

    diff --git a/file1 b/file2

    除非涉及重命名/复制,否则 a/b/ 文件名是相同的。特别是,即使是创建或删除,也不会使用 /dev/null 来代替 a/b/ 文件名。

    当涉及重命名/复制时,file1file2 分别显示重命名/复制的源文件名称和重命名/复制生成的文件名称。

  2. 后面跟着一个或多个扩展头行:

    old mode <mode>
    new mode <mode>
    deleted file mode <mode>
    new file mode <mode>
    copy from <path>
    copy to <path>
    rename from <path>
    rename to <path>
    similarity index <number>
    dissimilarity index <number>
    index <hash>..<hash> <mode>

    文件模式 <mode> 以 6 位八进制数字打印,包括文件类型和文件权限位。

    扩展头中的路径名不包含 a/b/ 前缀。

    相似度索引是不变行的百分比,不相似度索引是更改行的百分比。它是一个四舍五入的整数,后面跟着一个百分号。因此,100% 的相似度索引值保留给两个完全相同的文件,而 100% 的不相似度意味着旧文件中没有一行进入新文件。

    索引行包括更改前后的 blob 对象名称。如果文件模式没有更改,则包含 <mode>;否则,单独的行指示旧模式和新模式。

  3. 包含“不寻常”字符的路径名将按照配置变量 core.quotePath 的解释进行引用(参见 git-config[1])。

  4. 输出中所有 file1 文件指代提交之前的文件,所有 file2 文件指代提交之后的文件。按顺序将每个更改应用到每个文件是错误的。例如,此补丁将交换 a 和 b:

    diff --git a/a b/b
    rename from a
    rename to b
    diff --git a/b b/a
    rename from b
    rename to a
  5. Hunk 头会提及 hunk 应用到的函数名称。有关如何根据特定语言进行调整的详细信息,请参见 gitattributes[5] 中的“定义自定义 hunk-header”。

组合 diff 格式

任何生成 diff 的命令都可以接受 -c--cc 选项,以便在显示合并时生成 组合 diff。这是使用 git-diff[1]git-show[1] 显示合并时的默认格式。另请注意,您可以向这些命令中的任何一个提供合适的 --diff-merges 选项,以强制生成特定格式的 diff。

“组合 diff”格式如下所示:

diff --combined describe.c
index fabadb8,cc95eb0..4866510
--- a/describe.c
+++ b/describe.c
@@@ -98,20 -98,12 +98,20 @@@
	return (a_date > b_date) ? -1 : (a_date == b_date) ? 0 : 1;
  }

- static void describe(char *arg)
 -static void describe(struct commit *cmit, int last_one)
++static void describe(char *arg, int last_one)
  {
 +	unsigned char sha1[20];
 +	struct commit *cmit;
	struct commit_list *list;
	static int initialized = 0;
	struct commit_name *n;

 +	if (get_sha1(arg, sha1) < 0)
 +		usage(describe_usage);
 +	cmit = lookup_commit_reference(sha1);
 +	if (!cmit)
 +		usage(describe_usage);
 +
	if (!initialized) {
		initialized = 1;
		for_each_ref(get_name);
  1. 它前面是“git diff”头,看起来像这样(使用 -c 选项时):

    diff --combined file

    或者像这样(使用 --cc 选项时):

    diff --cc file
  2. 后面跟着一个或多个扩展头行(此示例显示了一个包含两个父级的合并):

    index <hash>,<hash>..<hash>
    mode <mode>,<mode>..<mode>
    new file mode <mode>
    deleted file mode <mode>,<mode>

    mode <mode>,<mode>..<mode> 行仅在至少一个 <mode> 与其余模式不同时出现。包含检测到的内容移动(重命名和复制检测)信息的扩展头旨在与两个 <tree-ish> 的 diff 一起使用,并且不用于组合 diff 格式。

  3. 后面跟着一个两行的“源文件/目标文件”头:

    --- a/file
    +++ b/file

    类似于传统 unified diff 格式的两行头,/dev/null 用于指示已创建或已删除的文件。

    然而,如果提供了 --combined-all-paths 选项,您将得到一个 N+1 行的“源文件/目标文件”头,而不是两行的“源文件/目标文件”头,其中 N 是合并提交中父级的数量:

    --- a/file
    --- a/file
    --- a/file
    +++ b/file

    如果重命名或复制检测处于活动状态,这种扩展格式会很有用,可以让您查看不同父级中文件的原始名称。

  4. 块头格式已被修改,以防止人们意外将其提供给 patch -p1。组合 diff 格式是为了审查合并提交更改而创建的,并非旨在应用。此更改类似于扩展 索引 头中的更改:

    @@@ <from-file-range> <from-file-range> <to-file-range> @@@

    组合 diff 格式的块头中有(父级数量 + 1)个 @ 字符。

与传统的 unified diff 格式不同,传统格式显示两个文件 A 和 B,只有一列带有 -(减号——出现在 A 但在 B 中删除)、+(加号——在 A 中缺失但在 B 中添加)或 " "(空格——未更改)前缀,此格式比较两个或多个文件 file1、file2 等与一个文件 X,并显示 X 与每个 fileN 的不同之处。输出行的开头会为每个 fileN 预置一列,以指出 X 的行与它有何不同。

列 N 中的 - 字符表示该行出现在 fileN 中,但未出现在结果中。列 N 中的 + 字符表示该行出现在结果中,而 fileN 中没有该行(换句话说,从该父级的角度来看,该行是新增的)。

在上面的示例输出中,函数签名已从两个文件更改(因此 file1 和 file2 都被 - 删除了两行,再加上 ++ 表示新增的一行未出现在 file1 或 file2 中)。此外,其他八行与 file1 相同,但未出现在 file2 中(因此以 + 为前缀)。

当由 git diff-tree -c 显示时,它将合并提交的父级与合并结果进行比较(即 file1..fileN 是父级)。当由 git diff-files -c 显示时,它将两个未解决的合并父级与工作区文件进行比较(即 file1 是阶段 2,也称为“我们的版本”,file2 是阶段 3,也称为“他们的版本”)。

其他 diff 格式

--summary 选项描述了新添加、删除、重命名和复制的文件。--stat 选项将 diffstat(1) 图形添加到输出中。这些选项可以与其他选项(例如 -p)结合使用,旨在供人工阅读。

当显示涉及重命名或复制的更改时,--stat 输出通过组合路径名的共同前缀和后缀来紧凑地格式化路径名。例如,将 arch/i386/Makefile 移动到 arch/x86/Makefile 同时修改 4 行的更改将显示如下:

arch/{i386 => x86}/Makefile    |   4 +--

--numstat 选项提供 diffstat(1) 信息,但旨在便于机器使用。--numstat 输出中的条目如下所示:

1	2	README
3	1	arch/{i386 => x86}/Makefile

即从左到右:

  1. 添加的行数;

  2. 一个制表符;

  3. 删除的行数;

  4. 一个制表符;

  5. 路径名(可能包含重命名/复制信息);

  6. 一个换行符。

-z 输出选项生效时,输出格式如下:

1	2	README NUL
3	1	NUL arch/i386/Makefile NUL arch/x86/Makefile NUL

即:

  1. 添加的行数;

  2. 一个制表符;

  3. 删除的行数;

  4. 一个制表符;

  5. 一个 NUL(仅在重命名/复制时存在);

  6. 原始映像中的路径名;

  7. 一个 NUL(仅在重命名/复制时存在);

  8. 后映像中的路径名(仅在重命名/复制时存在);

  9. 一个 NUL。

在重命名情况下,原始映像路径前的额外 NUL 是为了让读取输出的脚本能够判断当前正在读取的记录是单路径记录还是重命名/复制记录,而无需预读。在读取添加和删除的行之后,读取到 NUL 将产生路径名,但如果该 NULNUL,则记录将显示两条路径。

操作模式

您可以选择完全信任索引文件(使用 --cached 标志)或要求 diff 逻辑将任何与 stat 状态不匹配的文件显示为“暂定更改”。这两种操作确实都非常有用。

缓存模式

如果指定了 --cached,它允许您查询:

show me the differences between HEAD and the current index
contents (the ones I'd write using 'git write-tree')

例如,假设您在工作目录中进行了操作,更新了索引中的一些文件,并准备提交。您想确切地看到您将要提交的内容,而无需写入新的树对象并以此方式进行比较。要做到这一点,您只需执行:

git diff-index --cached HEAD

示例:假设我将 commit.c 重命名为 git-commit.c,并且我已经执行了 update-index 以使其在索引文件中生效。git diff-files 将完全不显示任何内容,因为索引文件与我的工作目录匹配。但是执行 git diff-index 会显示:

torvalds@ppc970:~/git> git diff-index --cached HEAD
:100644 000000 4161aecc6700a2eb579e842af0b7f22b98443f74 0000000000000000000000000000000000000000 D	commit.c
:000000 100644 0000000000000000000000000000000000000000 4161aecc6700a2eb579e842af0b7f22b98443f74 A	git-commit.c

您可以轻松看出上面是一个重命名。

事实上,git diff-index --cached 应该始终与实际执行 git write-tree 并进行比较完全等效。除了当您只想检查当前状态时,它会更好用。

因此,执行 git diff-index --cached 基本上在您问自己“我已经标记了哪些要提交的内容,以及与之前的树有什么区别”时非常有用。

非缓存模式

“非缓存”模式采取了一种不同的方法,它可能在这两种模式中更有用,因为它所做的无法通过 git write-tree + git diff-tree 来模拟。因此,它是默认模式。非缓存版本提出的问题是:

show me the differences between HEAD and the currently checked out
tree - index contents _and_ files that aren't up to date

这显然也是一个非常有用的问题,因为它会告诉你你**可以**提交什么。同样,输出与 git diff-tree -r 的输出完全匹配,但又有所不同。

不同之处在于,如果某个文件与索引不匹配,我们没有它的支持存储对象,我们使用神奇的“全零”SHA1 来表示。所以,假设你已经编辑了 kernel/sched.c,但还没有对它执行 git update-index —— 新状态没有关联的“对象”,你将得到:

torvalds@ppc970:~/v2.6/linux> git diff-index --abbrev HEAD
:100644 100644 7476bb5ba 000000000 M	kernel/sched.c

即,它显示树已更改,并且 kernel/sched.c 未同步,可能包含新内容。全零 SHA1 意味着要获得真正的差异,你需要直接查看工作目录中的对象,而不是执行对象到对象的差异比较。

注意
与此类型的其他命令一样,git diff-index 根本不查看文件的内容。所以,也许 kernel/sched.c 实际上并没有更改,只是你“碰”了一下它。无论哪种情况,这都表示你需要执行 git update-index 以使索引同步。
注意
你可以看到文件混合显示为“已更新”和“工作目录中仍有未暂存更改”的状态。你总是可以判断哪个文件处于哪种状态,因为“已更新”的文件显示有效的 SHA1,而“与索引不同步”的文件将始终具有特殊的“全零”SHA1。

GIT

Git[1] 套件的一部分

scroll-to-top