Linux 基礎-文本處理命令

概述

Linux 下使用 Shell 處理文本時最常用的工具有: find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk

find 文件查找

man 文檔給出的 find 命令的一般形式為:

find [-H] [-L] [-P] [-D debugopts] [-Olevel] [starting-point...] [expression]

這對于大部分人來說都太復雜了,[-H] [-L] [-P] [-D debugopts] [-Olevel] 這幾個選項并不常用,find 命令的常用形式可以簡化為:

$ find [PATH] [option] [action]

1,根據文件或者正則表達式進行匹配

$ find .  # 查找當前目錄及子目錄下所有文件及文件夾
$ find /data -name "*.txt"  # 在 /data 目錄及子目錄下查找以 .txt 結尾的文件名
$ find . \( -name "*.txt" -o -name "*.pdf" \)  # 當前目錄及子目錄下查找所有以 .txt 和 .pdf 結尾的文件
$ find . -maxdepth 1 -type d  # 查找當前目錄下所有的子目錄
$ find . -maxdepth 1 -regex ".*\.txt$"  # 基于正則表達式匹配當前目錄下的所有以 .txt 結尾的文件
./multi_classifynet_infer_ret.txt
./cali_left_img.txt
... 省略

2,根據文件類型進行搜索

find . -type 類型參數,f 普通文件,l 符號連接,d 目錄,c 字符設備,b 塊設備,s 套接字,p Fifo
$ find . -maxdepth 1 -type d  # 查找當前目錄下的所有子目錄

3,基于目錄深度搜索

$ find . maxdepth 3 -type f  # 目錄向下最大深度限制 3

4,根據文件時間戳進行搜索
find . -type -f 時間戳參數。與時間有關的選項:共有 -atime, -ctime-mtime,以 -mtime 說明

  • -mtime n : n 為數字,意義為在 n 天之前的『一天之內』被更改過內容的文件;
  • -mtime +n :列出在 n 天之前(不含 n 天本身)被更改過內容的文件名;
  • -mtime -n :列出在 n 天之內(含 n 天本身)被更改過內容的文件名。
  • -newer file : file 為一個存在的文件,列出比 file 還要新的文件名
$ find /etc -newer /etc/passwd  # 尋找 /etc 底下的文件,如果文件日期比 /etc/passwd 新就列出

5,與文件權限及名稱有關的參數

  • -name filename:搜尋文件名為 filename 的文件。
  • -size [+-]SIZE:搜尋比 SIZE 還要大(+)或小(-)的文件。 這個 SIZE 的規格有:c: 代表 byte, k: 代表 1024 bytes。所以,要找比 50KB還要大的文件,就是 -size +50k
  • -type TYPE:搜尋文件的類型為 TYPE 的, 類型主要有:一般正規文件 (f), 裝置文件 (b, c), 目錄 (d), 連結檔 (l), socket (s), 及 FIFO (p) 等屬性。
  • -perm mode:搜尋文件權限『剛好等于』 mode 的文件, 這個 mode 為類似 chmod 的屬性值, 舉例來說, -rwxr-xr-x 的屬性為 755
  • -perm -mode:搜尋文件權限『必須要全部囊括 mode 的權限』的文件, 舉例來說,我們要搜尋 -rwxr--r--,亦即 744 的文件,使用 -perm -744,但是當一個文件的權限為 -rwxr-xr-x ,亦即 755 時,也會被列出來,因為 -rwxr-xr-x 的屬性已經包括了-rwxr--r-- 的屬性了。
  • -perm /mode:搜尋文件權限『包含任一 mode 的權限』的文件, 舉例來說,我們搜尋 -rwxr-xr-x ,亦即 -perm /755 時,但一個文件屬性為 -rw-------也會被列出來,因為他有 -rw.... 的屬性存在。
范例:
```shell
root@17c30d837aba:/data# find . -maxdepth 1 -perm 777  # 查找當前目錄下文件權限剛好等于777 的文件
.
./honggaozhang
./demo.sh

grep 文本搜索

grep 支持使用正則表達式搜索文本,并把匹配的行打印出來。grep 命令常見用法,在文件中搜索一個單詞,命令會返回一個包含 “match_pattern” 的文本行:

grep match_pattern file_name
grep "match_pattern" file_name

常用參數

  • -o:只輸出匹配的文本行,-v 只輸出沒有匹配的文本行
  • -c:統計文件中包含文本的次數: `grep -c “text” filename
  • -n:打印匹配的行號
  • -i:搜索時忽略大小寫
  • -l:只打印文件名
$ grep "class" . -R -n  # 在多級目錄中對文本遞歸搜索(程序員搜代碼的最愛)
$ grep -e "class" -e "vitural" file  #  匹配多個模式

參考資料

本文由博客一文多發平臺 OpenWrite 發布!

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內容