1 查找文件夾占用大小
df 是disk free的縮寫,是用來查看文件系統(tǒng)空間使用情況的
df -h

image.png
du 是disk usage的縮寫,可以用來查看每個(gè)文件的占用空間以及遞歸的計(jì)算文件夾占用空間
du -ah --max-depth=1 / | sort -nr

image
du常用的選項(xiàng)
-h:以人類可讀的方式顯示
-a:顯示目錄占用的磁盤空間大小,還要顯示其下目錄和文件占用磁盤空間的大小
-s:顯示目錄占用的磁盤空間大小,不要顯示其下子目錄和文件占用的磁盤空間大小
-c:顯示幾個(gè)目錄或文件占用的磁盤空間大小,還要統(tǒng)計(jì)它們的總和
--apparent-size:顯示目錄或文件自身的大小
-l :統(tǒng)計(jì)硬鏈接占用磁盤空間的大小
-L:統(tǒng)計(jì)符號(hào)鏈接所指向的文件占用的磁盤空間大小
2 wc 命令
用來統(tǒng)計(jì)文件的字符數(shù) 字節(jié)數(shù) 行數(shù)
使用模式 wc [option] {filename} 或者結(jié)合管道使用
-c 統(tǒng)計(jì)字節(jié)數(shù)。
-l 統(tǒng)計(jì)行數(shù)。
-m 統(tǒng)計(jì)字符數(shù)。這個(gè)標(biāo)志不能與 -c 標(biāo)志一起使用。
-w 統(tǒng)計(jì)字?jǐn)?shù)。一個(gè)字被定義為由空白、跳格或換行字符分隔的字符串。
-L 打印最長行的長度。
-help 顯示幫助信息
--version 顯示版本信息

image.png
3 grep 命令
grep 是用來進(jìn)行檢索的操作
usage : grep [OPTION]... PATTERN [FILE]...
-n 顯示行號(hào)
-r 遞歸的搜索文件夾
-d --directories=ACTION 如何處理遇到的文件夾 三個(gè)選擇,read recurse skip
-d=skip
-d=read
-d=recurse
簡單的查詢某個(gè)字符串

image.png
檢索目錄下所有文件

image.png
4 awk
awk是行處理器 依次對(duì)每行進(jìn)行處理
usage: awk '{[pattern] action}' {filenames}
awk
-F F是field縮寫 表示使用哪個(gè)分隔符 默認(rèn)是空格
awk里使用的正則不支持非貪婪匹配
$0表示當(dāng)前行
$1 表示被分隔符分隔后的數(shù)組中的第一個(gè)
簡單的打印

image.png
使用正則處理
awk '{match($0,/"name":("[^"]*")/,a); if(a[1] != "") print a[1]}' python
match(s,r,a)用r正則去匹配s串,將結(jié)果放到a數(shù)組里
如果a[1]不是空 那么打印即可

image.png
5 sort
以行為單位對(duì)文本內(nèi)容進(jìn)行排序
-u 去除重復(fù)行
-b 忽略每行前面開始出的空格字符。
-c 檢查文件是否已經(jīng)按照順序排序。
-d 排序時(shí),處理英文字母、數(shù)字及空格字符外,忽略其他的字符。
-f 排序時(shí),將小寫字母視為大寫字母。
-i 排序時(shí),除了040至176之間的ASCII字符外,忽略其他的字符。
-m 將幾個(gè)排序好的文件進(jìn)行合并。
-M 將前面3個(gè)字母依照月份的縮寫進(jìn)行排序。
-n 依照數(shù)值的大小排序。
-o<輸出文件> 將排序后的結(jié)果存入指定的文件。
-r 以相反的順序來排序。
-t<分隔字符> 指定排序時(shí)所用的欄位分隔字符。
+<起始欄位>-<結(jié)束欄位> 以指定的欄位來排序,范圍由起始欄位到結(jié)束欄位的前一欄位。
--help 顯示幫助。
--version 顯示版本信息