名称

git-backfill - 下载部分克隆中缺失的对象

概要

git backfill [--min-batch-size=<n>] [--[no-]sparse]

描述

使用 git clone --filter=blob:none 创建无 blob 的部分克隆,然后配置本地仓库,使 Git 客户端除非需要 blob 对象进行本地操作,否则会避免下载它们。最初,这表示克隆和后续的 fetch 会下载可达的 commit 和 tree,但不会下载 blob。后来,改变 HEAD 指针的操作,例如 git checkoutgit merge,可能需要下载缺失的 blob 才能完成其操作。

在最坏的情况下,计算 blob 差异的命令(如 git blame)会变得非常慢,因为它们会以单 blob 请求的方式下载缺失的 blob,以满足 Git 命令在需要时对缺失对象的访问。这会导致多个下载请求,并且 Git 服务器无法对这些对象进行增量压缩。

git backfill 命令提供了一种方式,供用户请求 Git 下载缺失的 blob(带有可选过滤器),以便可以批量下载代表文件历史版本的缺失 blob。backfill 命令试图通过将出现在同一路径下的 blob 分组来优化请求,从而有望在服务器发送的 packfile 中实现良好的增量压缩。

通过这种方式,git backfill 提供了一种机制,可以将一个大的克隆分解成更小的块。从使用 git clone --filter=blob:none 的无 blob 部分克隆开始,然后在本地仓库中运行 git backfill,可以以比克隆时下载整个仓库更少的网络调用次数,下载所有可达的对象。

默认情况下,git backfill 会下载从 HEAD commit 可达的所有 blob。可以使用各种选项来限制或扩展此集合。

此命令是实验性的。其行为可能在未来发生更改。

选项

--min-batch-size=<n>

指定从服务器请求的缺失对象批次的最小大小。给定路径下的最后一组 blob 可能会超过此大小。默认的最小批次大小为 50,000。

--sparse
--no-sparse

仅当对象出现在与当前稀疏检出匹配的路径上时才下载它们。如果启用了稀疏检出功能,则假定为 --sparse,并可以使用 --no-sparse 禁用。

另请参阅

GIT

Git[1] 套件的一部分