git底層原理以及丟失文件找回和坑爹案例(一招干沒我2個月的項目)

為啥要寫這篇文章呢?因為2017-03-28日清的一次情趣使然的提交干掉了我2個月的項目。。。


為啥能干掉2個月的?因為是個人沒事做著玩的所以2個月一直沒提交過。

工作環境 是 win10+sourcetree+git+unreal工程

記得那是一個朦朦朧朧的清晨(霧霾),我興奮的從床上跳了起來(我的項目終于告一段落)。我打開電腦,打開sourcetree提交一下以免夜長夢多。


當時的心情

我整理了文件并且對比了變化。把整理過的文件add了一下,然后成功的commit(都TMD的是錯覺 sourcetree bug了根本沒add成功)之后我點擊了push。。然后sourcetree 提示了一堆異常,其中有一條叫我用終端執行 ?git reset --hard 理由是我的工作區有垃圾文件,叫我清空下!


我聽到sourcetree的話后的心情

我不由自主的考慮了一下,


內心活動

聽sourcetree的,你說執行就執行~


內心活動

然后我打開了終端執行了那條命令之后突然感覺哪里不對


感到不安

我打開工作目錄發現git清空了我2個月的項目,什么都沒有了,真TMD的干凈。


我在思考

然后我去網上搜索如何找回。發現了好多方法,比如git reflog 這樣就能看見自己的所有commit


然后在 git reset ?--hard 后面寫上你想要的commit id ?就能找到文件


內心活動

然后我執行完 git reflog后 發現根本沒有我最后的那次提交。突然間恍然大悟,剛剛sourcetree 可能bug了導致commit失敗了


突然抓狂

然后我發現了另一條命令 git fsck --lost-found ?執行后會出現一堆文件 在 .git/lost-found ?文件夾里 不過是這個樣子的



迷茫

網上老哥說了 用 git show 2e43cd56ee4fb08664cd843cd32836b54fbf594a 就能看見內容


終端輸出


更加迷茫

原來 2進制的文件看不見

然后我再次發現了新命令 find .git/objects -type f | xargs ls -lt | sed 110q ? ?q前面是你要打印的行

這個命令已經脫離git了,他是終端的一個 查找命令 就是查找.git/objects 文件夾下的普通文件 按照時間排序后 打印在終端里 sed 110q 是你要打印多少行。

要看懂這個命令就需要了解git底層的工作原理


突然好學

講一下git 原理

GIT對象模型

SHA

所有用來表示項目歷史信息的文件,是通過一個40個字符的(40-digit)“對象名”來索引的,對象名看起來像這樣:

6ff87c4664981e4397625791c8ea3bbb5f2279a3

你會在Git里到處看到這種“40個字符”字符串。每一個“對象名”都是對“對象”內容做SHA1哈希計算得來的,(SHA1是一種密碼學的哈希算法)。這樣就意味著兩個不同內容的對象不可能有相同的“對象名”。

這樣做會有幾個好處:

Git只要比較對象名,就可以很快的判斷兩個對象是否相同。

因為在每個倉庫(repository)的“對象名”的計算方法都完全一樣,如果同樣的內容存在兩個不同的倉庫中,就會存在相同的“對象名”下。

Git還可以通過檢查對象內容的SHA1的哈希值和“對象名”是否相同,來判斷對象內容是否正確。

對象

每個對象(object) 包括三個部分:類型大小內容。大小就是指內容的大小,內容取決于對象的類型,有四種類型的對象:"blob"、"tree"、 "commit" 和"tag"。

“blob”用來存儲文件數據,通常是一個文件。

“tree”有點像一個目錄,它管理一些“tree”或是“blob”(就像文件和子目錄)

一個“commit”只指向一個"tree",它用來標記項目某一個特定時間點的狀態。它包括一些關于時間點的元數據,如時間戳、最近一次提交的作者、指向上次提交(commits)的指針等等。

一個“tag”是來標記某一個提交(commit) 的方法。

幾乎所有的Git功能都是使用這四個簡單的對象類型來完成的。它就像是在你本機的文件系統之上構建一個小的文件系統。

與SVN的區別

Git與你熟悉的大部分版本控制系統的差別是很大的。也許你熟悉Subversion、CVS、Perforce、Mercurial 等等,他們使用“增量文件系統”(Delta Storage systems), 就是說它們存儲每次提交(commit)之間的差異。Git正好與之相反,它會把你的每次提交的文件的全部內容(snapshot)都會記錄下來。這會是在使用Git時的一個很重要的理念。

Blob對象

一個blob通常用來存儲文件的內容.

你可以使用git show命令來查看一個blob對象里的內容。假設我們現在有一個Blob對象的SHA1哈希值,我們可以通過下面的的命令來查看內容:

$ git show 6ff87c4664

Note that the only valid version of the GPL as far as this project

is concerned is _this_ particular version of the license (ie v2, not

v2.2 or v3.x or whatever), unless explicitly otherwise stated.

...

一個"blob對象"就是一塊二進制數據,它沒有指向任何東西或有任何其它屬性,甚至連文件名都沒有.

因為blob對象內容全部都是數據,如兩個文件在一個目錄樹(或是一個版本倉庫)中有同樣的數據內容,那么它們將會共享同一個blob對象。Blob對象和其所對應的文件所在路徑、文件名是否改被更改都完全沒有關系。

Tree 對象

一個tree對象有一串(bunch)指向blob對象或是其它tree對象的指針,它一般用來表示內容之間的目錄層次關系。

git show命令還可以用來查看tree對象,但是git ls-tree能讓你看到更多的細節。如果我們有一個tree對象的SHA1哈希值,我們可以像下面一樣來查看它:

$ git ls-tree fb3a8bdd0ce

100644 blob 63c918c667fa005ff12ad89437f2fdc80926e21c ? ?.gitignore

100644 blob 5529b198e8d14decbe4ad99db3f7fb632de0439d ? ?.mailmap

100644 blob 6ff87c4664981e4397625791c8ea3bbb5f2279a3 ? ?COPYING

040000 tree 2fb783e477100ce076f6bf57e4a6f026013dc745 ? ?Documentation

100755 blob 3c0032cec592a765692234f1cba47dfdcc3a9200 ? ?GIT-VERSION-GEN

100644 blob 289b046a443c0647624607d471289b2c7dcd470b ? ?INSTALL

100644 blob 4eb463797adc693dc168b926b6932ff53f17d0b1 ? ?Makefile

100644 blob 548142c327a6790ff8821d67c2ee1eff7a656b52 ? ?README

...

就如同你所見,一個tree對象包括一串(list)條目,每一個條目包括:mode、對象類型、SHA1值 和名字(這串條目是按名字排序的)。它用來表示一個目錄樹的內容。

一個tree對象可以指向(reference): 一個包含文件內容的blob對象, 也可以是其它包含某個子目錄內容的其它tree對象. Tree對象、blob對象和其它所有的對象一樣,都用其內容的SHA1哈希值來命名的;只有當兩個tree對象的內容完全相同(包括其所指向所有子對象)時,它的名字才會一樣,反之亦然。這樣就能讓Git僅僅通過比較兩個相關的tree對象的名字是否相同,來快速的判斷其內容是否不同。

(注意:在submodules里,trees對象也可以指向commits對象. 請參見Submodules章節)

注意:所有的文件的mode位都是644 或 755,這意味著Git只關心文件的可執行位.

Commit對象

"commit對象"指向一個"tree對象", 并且帶有相關的描述信息.

你可以用 --pretty=raw 參數來配合git showgit log去查看某個提交(commit):

$ git show -s --pretty=raw 2be7fcb476

commit 2be7fcb4764f2dbcee52635b91fedb1b3dcf7ab4

tree fb3a8bdd0ceddd019615af4d57a53f43d8cee2bf

parent 257a84d9d02e90447b149af58b271c19405edb6a

author Dave Watson ?1187576872 -0400

committer Junio C Hamano ?1187591163 -0700

Fix misspelling of 'suppress' in docs

Signed-off-by: Junio C Hamano

你可以看到, 一個提交(commit)由以下的部分組成:

一個tree對象: tree對象的SHA1簽名, 代表著目錄在某一時間點的內容.

父對象(parent(s)): 提交(commit)的SHA1簽名代表著當前提交前一步的項目歷史. 上面的那個例子就只有一個父對象; 合并的提交(merge commits)可能會有不只一個父對象. 如果一個提交沒有父對象, 那么我們就叫它“根提交"(root commit), 它就代表著項目最初的一個版本(revision). 每個項目必須有至少有一個“根提交"(root commit). 一個項目可能有多個"根提交“,雖然這并不常見(這不是好的作法).

作者: 做了此次修改的人的名字, 還有修改日期.

提交者(committer): 實際創建提交(commit)的人的名字, 同時也帶有提交日期. TA可能會和作者不是同一個人; 例如作者寫一個補丁(patch)并把它用郵件發給提交者, 由他來創建提交(commit).

注釋用來描述此次提交.

注意: 一個提交(commit)本身并沒有包括任何信息來說明其做了哪些修改; 所有的修改(changes)都是通過與父提交(parents)的內容比較而得出的. 值得一提的是, 盡管git可以檢測到文件內容不變而路徑改變的情況, 但是它不會去顯式(explicitly)的記錄文件的更名操作. (你可以看一下git diff的 -M 參數的用法)

一般用git commit來創建一個提交(commit), 這個提交(commit)的父對象一般是當前分支(current HEAD), 同時把存儲在當前索引(index)的內容全部提交.

對象模型

現在我們已經了解了3種主要對象類型(blob, tree 和 commit), 好現在就讓我們大概了解一下它們怎么組合到一起的.

如果我們一個小項目, 有如下的目錄結構:

$>tree

.

|-- README

`-- lib

|-- inc

| ? `-- tricks.rb

`-- mylib.rb

2 directories, 3 files

如果我們把它提交(commit)到一個Git倉庫中, 在Git中它們也許看起來就如下圖:

你可以看到: 每個目錄都創建了tree對象(包括根目錄), 每個文件都創建了一個對應的blob對象. 最后有一個commit對象來指向根tree對象(root of trees), 這樣我們就可以追蹤項目每一項提交內容.

標簽對象

一個標簽對象包括一個對象名(譯者注:就是SHA1簽名), 對象類型, 標簽名, 標簽創建人的名字("tagger"), 還有一條可能包含有簽名(signature)的消息. 你可以用git cat-file命令來查看這些信息:

$ git cat-file tag v1.5.0

object 437b1b20df4b356c9342dac8d38849f24ef44f27

type commit

tag v1.5.0

tagger Junio C Hamano ?1171411200 +0000

GIT 1.5.0

-----BEGIN PGP SIGNATURE-----

Version: GnuPG v1.4.6 (GNU/Linux)

iD8DBQBF0lGqwMbZpPMRm5oRAuRiAJ9ohBLd7s2kqjkKlq1qqC57SbnmzQCdG4ui

nLE/L9aUXdWeTFPron96DLA=

=2E+0

-----END PGP SIGNATURE-----

點擊git tag, 可以了解如何創建和驗證標簽對象. (注意:git tag同樣也可以用來創建 "輕量級的標簽"(lightweight tags), 但它們并不是標簽對象, 而只一些以 "refs/tags/" 開頭的引用罷了).


非常自信

然后我從這一堆文件里整理出了 tree文件 并且總結出了規律

運行 ?find .git/objects -tpe f | xargs ls -lt | sed 100q 后會得到最近改動的100個文件

-r--r--r-- 1 qipaworld 197608 ? ? 57103 3月 ?25 07:23 .git/objects/31/68e9047b751d98f7c280dab676cff4af3cb8f6 ?文件以這種形式顯示在終端里

git cat-file -t 3168e9047b751d98f7c280dab676cff4af3cb8f6 就能看見文件類型 ?把最后一個/去掉 復制從objects/ 后面的所有東西放在-t后面

然后找到tree類型的文件

每個紅框框選的區域里的類型應該是同一種,選一個cat 一下看看就行了

找到tree后 git cat-file -p 4452fd53aa36018b20a6556dc3649f50a4be4561^{tree}

就能看見tree里面的結構

然后就能知道 哪個blob對應哪個文件了。是不是很屌?

我搞了一晚上終于找到了某個tree并且跟到了文件目錄。然后發現并沒有我的項目文件,當時已經是半夜12點多了,我靜靜的看著屏幕


我的狀態

我連add都沒成功就提示我commit成功了


誰給你的勇氣這么提示的

以后誰叫你 reset --hard你就干他,別問我為什么

最終結果就是項目消失了,但是還好unreal 有自動保存功能,而自動保存的文件目錄被我加到了git忽略列表里。找回了一部分

最后加一些git常用命令

查看、添加、提交、刪除、找回,重置修改文件

git help ?# 顯示command的help

git show # 顯示某次提交的內容 git show $id

git co -- ?# 拋棄工作區修改

git co . # 拋棄工作區修改

git add ?# 將工作文件修改提交到本地暫存區

git add . # 將所有修改過的工作文件提交暫存區

git rm ?# 從版本庫中刪除文件

git rm ?--cached # 從版本庫中刪除文件,但不刪除文件

git reset ?# 從暫存區恢復到工作文件

git reset -- . # 從暫存區恢復到工作文件

git reset --hard # 恢復最近一次提交過的狀態,即放棄上次提交后的所有本次修改

git ci ?git ci . git ci -a # 將git add, git rm和git ci等操作都合并在一起做                                    git ci -am "some comments"

git ci --amend # 修改最后一次提交記錄

git revert <$id> # 恢復某次提交的狀態,恢復動作本身也創建次提交對象

git revert HEAD # 恢復最后一次提交的狀態

查看文件diff

git diff ?# 比較當前文件和暫存區文件差異 git diff

git diff ?# 比較兩次提交之間的差異

git diff .. # 在兩個分支之間比較

git diff --staged # 比較暫存區和版本庫差異

git diff --cached # 比較暫存區和版本庫差異

git diff --stat # 僅僅比較統計信息

查看提交記錄

git log git log ?# 查看該文件每次提交記錄

git log -p ?# 查看每次詳細修改內容的diff

git log -p -2 # 查看最近兩次詳細修改內容的diff

git log --stat #查看提交統計信息

tig

Mac上可以使用tig代替diff和log,brew install tig

Git 本地分支管理

查看、切換、創建和刪除分支

git br -r # 查看遠程分支

git br ?# 創建新的分支

git br -v # 查看各個分支最后提交信息

git br --merged # 查看已經被合并到當前分支的分支

git br --no-merged # 查看尚未被合并到當前分支的分支

git co ?# 切換到某個分支

git co -b ?# 創建新的分支,并且切換過去

git co -b ? # 基于branch創建新的new_branch

git co $id # 把某次歷史提交記錄checkout出來,但無分支信息,切換到其他分支會自動刪除

git co $id -b ?# 把某次歷史提交記錄checkout出來,創建成一個分支

git br -d ?# 刪除某個分支

git br -D ?# 強制刪除某個分支 (未被合并的分支被刪除的時候需要強制)

分支合并和rebase

git merge ?# 將branch分支合并到當前分支

git merge origin/master --no-ff # 不要Fast-Foward合并,這樣可以生成merge提交

git rebase master ?# 將master rebase到branch,相當于: git co ?&& git rebase master && git co master && git merge

Git補丁管理(方便在多臺機器上開發同步時用)

git diff > ../sync.patch # 生成補丁

git apply ../sync.patch # 打補丁

git apply --check ../sync.patch #測試補丁能否成功

Git暫存管理

git stash # 暫存

git stash list # 列所有stash

git stash apply # 恢復暫存的內容

git stash drop # 刪除暫存區

Git遠程分支管理

git pull # 抓取遠程倉庫所有分支更新并合并到本地

git pull --no-ff # 抓取遠程倉庫所有分支更新并合并到本地,不要快進合并

git fetch origin # 抓取遠程倉庫更新

git merge origin/master # 將遠程主分支合并到本地當前分支

git co --track origin/branch # 跟蹤某個遠程分支創建相應的本地分支

git co -b ?origin/ # 基于遠程分支創建本地分支,功能同上

git push # push所有分支

git push origin master # 將本地主分支推到遠程主分支

git push -u origin master # 將本地主分支推到遠程(如無遠程主分支則創建,用于初始化遠程倉庫)

git push origin ?# 創建遠程分支, origin是遠程倉庫名

git push origin : # 創建遠程分支

git push origin : #先刪除本地分支(git br -d ),然后再push刪除遠程分支

Git遠程倉庫管理

GitHub

git remote -v # 查看遠程服務器地址和倉庫名稱

git remote show origin # 查看遠程服務器倉庫狀態

git remote add origin git@ github:robbin/robbin_site.git # 添加遠程倉庫地址

git remote set-url origin git@ github.com:robbin/robbin_site.git # 設置遠程倉庫地址(用于修改遠程倉庫地址) git remote rm ?# 刪除遠程倉庫

創建遠程倉庫

git clone --bare robbin_site robbin_site.git # 用帶版本的項目創建純版本倉庫

scp -r my_project.git git@ git.csdn.net:~ # 將純倉庫上傳到服務器上

mkdir robbin_site.git && cd robbin_site.git && git --bare init # 在服務器創建純倉庫

git remote add origin git@ github.com:robbin/robbin_site.git # 設置遠程倉庫地址

git push -u origin master # 客戶端首次提交

git push -u origin develop # 首次將本地develop分支提交到遠程develop分支,并且track

git remote set-head origin master # 設置遠程倉庫的HEAD指向master分支

也可以命令設置跟蹤遠程庫和本地庫

git branch --set-upstream master origin/master

git branch --set-upstream develop origin/develop

點擊這里可以看到作者的其他文章

歡迎轉載,轉載請標明出處:http://www.lxweimin.com/p/918f950fbd58

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,702評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,143評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,553評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,620評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,416評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,940評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,024評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,170評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,709評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,597評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,784評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,291評論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,029評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,407評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,663評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,403評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,746評論 2 370

推薦閱讀更多精彩內容

  • 本片內容轉自CSDN http://blog.csdn.net/ithomer/article/details/7...
    五娃兒閱讀 4,949評論 2 88
  • Add & Commit git init 初始化一個 Git 倉庫(repository),即把當前所在目錄變成...
    冬絮閱讀 4,868評論 0 9
  • 文/夕子 這次回家寄了一箱書回來,39kg。結果,中間出了點問題,書此時還在縣城親戚家滯留。快遞不寄的原因竟然是包...
    金夕子閱讀 1,247評論 21 39
  • “一切有為法,如夢幻泡影。如露亦如電,應作如是觀。”——《金剛經》。 近聞小學同學跳樓自殺,時年35歲,經聞噩...
    老懶貓閱讀 402評論 0 0
  • 畢業之前和室友一起出門旅游過,對旅游幻想太多,期待太多,到麗江小城游蕩了一圈,騎馬游湖,發在朋友圈一票點贊羨慕,但...
    芒果彩虹橋閱讀 199評論 0 0