awk的基本用法

awk是處理文本文件的一個應用程序,幾乎所有 Linux 系統(tǒng)都自帶這個程序。

它依次處理文件的每一行,并讀取里面的每一個字段。對于日志、CSV 那樣的每行格式相同的文本文件,awk可能是最方便的工具。

awk其實不僅僅是工具軟件,還是一種編程語言。不過,本文只介紹它的命令行用法,對于大多數場合,應該足夠用了。

一、基本用法

awk的基本用法就是下面的形式。

# 格式

$ awk 動作 文件名


# 示例

$ awk '{print $0}' demo.txt

上面示例中,demo.txt是awk所要處理的文本文件。前面單引號內部有一個大括號,里面就是每一行的處理動作print $0。其中,print是打印命令,$0代表當前行,因此上面命令的執(zhí)行結果,就是把每一行原樣打印出來。

awk也可以處理標準輸入(stdin)。

$ echo 'this is a test' | awk '{print $0}'

this is a test

上面代碼中,print $0就是把標準輸入this is a test,重新打印了一遍。

awk會根據空格和制表符,將每一行分成若干字段,依次用$1、$2、$3代表第一個字段、第二個字段、第三個字段等等。

$ echo 'this is a test' | awk '{print $3}'

a

上面代碼中,$3代表this is a test的第三個字段a。

下面,為了便于舉例,我們把/etc/passwd文件保存成demo.txt。

這個文件的字段分隔符是冒號(:),所以要用-F參數指定分隔符為冒號。然后,才能提取到它的第一個字段。

$ awk -F ':' '{ print $1 }' demo.txt

root

daemon

bin

sys

sync

二、變量

除了$ + 數字表示某個字段,awk還提供其他一些變量。

變量NF表示當前行有多少個字段,因此$NF就代表最后一個字段。

$ echo 'this is a test' | awk '{print $NF}'

test

$(NF-1)代表倒數第二個字段。

$ awk -F ':' '{print $1, $(NF-1)}' demo.txt

root /root

daemon /usr/sbin

bin /bin

sys /dev

sync /bin

上面代碼中,print命令里面的逗號,表示輸出的時候,兩個部分之間使用空格分隔。

變量NR表示當前處理的是第幾行。

$ awk -F ':' '{print NR ") " $1}' demo.txt

1) root

2) daemon

3) bin

4) sys

5) sync

上面代碼中,print命令里面,如果原樣輸出字符,要放在雙引號里面。

awk的其他內置變量如下。

FILENAME:當前文件名

FS:字段分隔符,默認是空格和制表符。

RS:行分隔符,用于分割每一行,默認是換行符。

OFS:輸出字段的分隔符,用于打印時分隔字段,默認為空格。

ORS:輸出記錄的分隔符,用于打印時分隔記錄,默認為換行符。

OFMT:數字輸出的格式,默認為%.6g。

三、函數

awk還提供了一些內置函數,方便對原始數據的處理。

函數toupper()用于將字符轉為大寫。

$ awk -F ':' '{ print toupper($1) }' demo.txt

ROOT

DAEMON

BIN

SYS

SYNC

上面代碼中,第一個字段輸出時都變成了大寫。

其他常用函數如下。

tolower():字符轉為小寫。

length():返回字符串長度。

substr():返回子字符串。

sin():正弦。

cos():余弦。

sqrt():平方根。

rand():隨機數。

awk內置函數的完整列表,可以查看手冊。

四、條件

awk允許指定輸出條件,只輸出符合條件的行。

輸出條件要寫在動作的前面。

$ awk '條件 動作' 文件名


$ awk -F ':' '/usr/ {print $1}' demo.txt

root

daemon

bin

sys

上面代碼中,print命令前面是一個正則表達式,只輸出包含usr的行。

下面的例子只輸出奇數行,以及輸出第三行以后的行。

# 輸出奇數行

$ awk -F ':' 'NR % 2 == 1 {print $1}' demo.txt

root

bin

sync


# 輸出第三行以后的行

$ awk -F ':' 'NR >3 {print $1}' demo.txt

sys

sync

下面的例子輸出第一個字段等于指定值的行。

$ awk -F ':' '$1 == "root" {print $1}' demo.txt

root


$ awk -F ':' '$1 == "root" || $1 == "bin" {print $1}' demo.txt

root

bin

五、if 語句

awk提供了if結構,用于編寫復雜的條件。

$ awk -F ':' '{if ($1 > "m") print $1}' demo.txt

root

sys

sync

上面代碼輸出第一個字段的第一個字符大于m的行。

if結構還可以指定else部分。

$ awk -F ':' '{if ($1 > "m") print $1; else print "---"}' demo.txt

root

---

---

sys

sync

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 本文主要解決四個問題: 第一問:awk的定義與來源是什么? 第二問:awk 的作用是什么? 第三:akw的命令格式...
    RealLuo閱讀 3,386評論 0 0
  • awk是處理文本文件的一個應用程序,幾乎所有Linux系統(tǒng)都自帶這個程序。 它依次處理文件的每一行,并讀取里面的每...
    hangba843閱讀 783評論 0 0
  • 一、Python簡介和環(huán)境搭建以及pip的安裝 4課時實驗課主要內容 【Python簡介】: Python 是一個...
    _小老虎_閱讀 6,313評論 0 10
  • 轉載 原文的排版和內容都更加友好,并且詳細,我只是在這里貼出了一部分留作自己以后參考和學習,如希望更詳細了解AWK...
    XKirk閱讀 3,362評論 2 25
  • sed工具簡介 用法:sed [-nefri] 動作參數:-n:使用安靜模式(Silent)模式,一般在sed的...
    Bloo_m閱讀 1,071評論 0 1

友情鏈接更多精彩內容