Gitee 官方博客 Gitee 官方博客
  • 产品动态
  • 企业案例
  • 项目推荐
  • 关于开源
  • 发现更多
  • 回到 Gitee

功能更新 | 如何控制 Git 库的膨胀?码云 GC 一步搞定!

Gitee
7 年前

相信每个公司都有自己的官网。小明公司也不例外,不过小明却发现公司的“猿”哥哥将许多视频放在了代码仓库里,导致原本只有代码的仓库从早期的几十MB,飙升至 1G以上,变得无比臃肿(或者是慢慢臃肿)。这时老板大手一挥删了所有视频,理论上是该缩小的,但小明发现仓库大小没有变化。明明删了视频,怎么仓库竟没有变化?

到底发生了什么导致 Git 库的膨胀?

根据 Git 的数据存储机制,只要通过命令 git add 将文件存储至暂存区,都会对版本库中的每一个文件,不论是图片、视频、源文件还是二进制文件生成相对应的 Blob 对象(即一段二进制数据)。 

如果你的项目中不小心打包进来了比较大的 word 文档或视频资源,Git 本身又识别不了该类型文件,只能当作二进制文件全量存储。所以,在其他人拉取该 word 文档更新完后再推远程分支的时候,则会使得 .git 下面的 objects 的文件夹大小迅速膨胀。 

上面使用场景中表面上少了500M空间,实则增加了一次至少500M的历史提交记录,仓库容量没有变化。

如何精简你的 Git 仓库?

第一种方案:压缩 Git 仓库。 

例如,码云项目管理中会提供存储库 GC 功能,用于清理悬空文件,压缩存储库对象,减少存储库磁盘占用。 


功能更新 | 如何控制 Git 库的膨胀?码云 GC 一步搞定!-Gitee 官方博客


第二种方案(推荐):删除大文件提交记录。 

查看存储库中的大文件: 

git rev-list --objects --all | grep -E `git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -10 | awk '{print$1}' | sed ':a;N;$!ba;s/\n/|/g'`

改写历史,去除大文件

git filter-branch --tree-filter 'rm -f path/to/large/files' --tag-name-filter cat -- --all
git push origin --tags --force
git push origin --all --force

并告知所有组员,push 代码前需要 pull rebase,而不是 merge,否则会从该组员的本地仓库再次引入到远程库中。

更多码云企业版的特性请浏览: https://gitee.com/enterprises

往期精彩:

微信小程序如何使用 Git 实现版本管理和协作开发

初创企业限时特惠,999 即可购买码云标准版

码云企业版上线禁止 Git 强推功能,避免仓库内容被覆盖

想要快速上手 Spring Boot ?看这些教程就足够了!| 码云周刊第 81 期

功能更新 | 如何控制 Git 库的膨胀?码云 GC 一步搞定!-Gitee 官方博客

GC Git
功能更新 | Gitee 企业版支持提交代码时切换任务状态
上一篇
反思2.4 亿数据泄漏事件:企业代码安全如何保障?
下一篇

猜你喜欢

GLM-Image 上线模力方舟:首个国产芯片训练的多模态图像生成模型

GLM-Image 上线模力方舟:首个国产芯片训练的多模态图像生成模型

5 天前
Gitee 软件工厂:以密级管理为底座,构建符合国家保密资质的安全研发体系

Gitee 软件工厂:以密级管理为底座,构建符合国家保密资质的安全研发体系

5 天前
Claude Code 的代码安全困境:插件机制齐全,却绕不开模型幻觉

Claude Code 的代码安全困境:插件机制齐全,却绕不开模型幻觉

5 天前
Gitee 移动软件工厂:突破网络限制的开发新模式

Gitee 移动软件工厂:突破网络限制的开发新模式

5 天前

关于我们

Gitee(码云)是开源中国于2013年推出的基于Git的代码托管平台、企业级研发效能平台,提供中国本土化的代码托管服务。 截至2024年12月,Gitee已经有1400万名注册用户和3600万个代码仓库( [14]),是中国境内规模最大的代码托管平台。同时,旗下企业级 DevOps 研发效能管理平台 Gitee 企业版已服务超过 420,000+ 家企业。

品牌内容

开源软件 GVP计划 Gitee 封面人物 CopyCat 代码克隆检测

友情链接

开源中国 Gitee Gitee 高校版 Gitee 企业版
Copyright © 2013-2026 Gitee 官方博客. Designed by nicetheme. 京ICP备2025119063号 京公网安备11011502039387号
  • 产品动态
  • 企业案例
  • 项目推荐
  • 关于开源
  • 发现更多
  • 回到 Gitee

Gitee

安全、稳定、高效的云端软件开发协作平台。