(十二)簡單的文本處理

一、實驗介紹

1.1 實驗內(nèi)容

這一節(jié)我們將介紹這幾個命令tr(注意不是tar),col,join,paste。實際這一節(jié)是上一節(jié)關(guān)于能實現(xiàn)管道操作的命令的延續(xù),所以我們依然將結(jié)合管道來熟悉這些命令的使用。

2.1 tr 命令

tr 命令可以用來刪除一段文本信息中的某些文字?;蛘邔⑵溥M(jìn)行轉(zhuǎn)換。
使用方式:tr [option]...SET1 [SET2]
常用的選項有:

選項 說明
-d 刪除和set1匹配的字符,注意不是全詞匹配也不是按字符順序匹配
-s 去除set1指定的在輸入文本中連續(xù)并重復(fù)的字符

操作舉例:

# 刪除 "hello shiyanlou" 中所有的'o','l','h'
$ echo 'hello shiyanlou' | tr -d 'olh'
# 將"hello" 中的ll,去重為一個l
$ echo 'hello' | tr -s 'l'
# 將輸入文本,全部轉(zhuǎn)換為大寫或小寫輸出
$ echo 'input some text here' | tr '[:lower:]' '[:upper:]'
# 上面的'[:lower:]' '[:upper:]'你也可以簡單的寫作'[a-z]' '[A-Z]',當(dāng)然反過來將大寫變小寫也是可以的

2.2 col 命令

col 命令可以將Tab換成對等數(shù)量的空格鍵,或反轉(zhuǎn)這個操作。
使用方式:col [option]
常用的選項有:

選項 說明
-x 將Tab轉(zhuǎn)換為空格
-h 將空格轉(zhuǎn)換為Tab(默認(rèn)選項)

操作舉例:

# 查看 /etc/protocols 中的不可見字符,可以看到很多 ^I ,這其實就是 Tab 轉(zhuǎn)義成可見字符的符號
$ cat -A /etc/protocols
# 使用 col -x 將 /etc/protocols 中的 Tab 轉(zhuǎn)換為空格,然后再使用 cat 查看,你發(fā)現(xiàn) ^I 不見了
$ cat /etc/protocols | col -x | cat -A

2.3 join命令

學(xué)過數(shù)據(jù)庫的用戶對這個應(yīng)該不會陌生,這個命令就是用于將兩個文件中包含相同內(nèi)容的那一行合并在一起。
使用方式:join [option]... file1 file2

常用的選項有:

選項 說明
-t 指定分隔符,默認(rèn)為空格
-i 忽略大小寫的差異
-1 指明第一個文件要用哪個字段來對比,默認(rèn)對比第一個字段
-2 指明第二個文件要用哪個字段來對比,默認(rèn)對比第一個字段

操作舉例:

# 創(chuàng)建兩個文件
$ echo '1 hello' > file1
$ echo '1 shiyanlou' > file2
$ join file1 file2
# 將/etc/passwd與/etc/shadow兩個文件合并,指定以':'作為分隔符
$ sudo join -t':' /etc/passwd /etc/shadow
# 將/etc/passwd與/etc/group兩個文件合并,指定以':'作為分隔符, 分別比對第4和第3個字段
$ sudo join -t':' -1 4 /etc/passwd -2 3 /etc/group

2.4 paste命令

paste這個命令與join 命令類似,它是在不對比數(shù)據(jù)的情況下,簡單地將多個文件合并一起,以Tab隔開。
使用方式:
paste [option] file...

常用的選項有:

選項 說明
-d 指定合并的分隔符,默認(rèn)為Tab
-s 不合并到一行,每個文件為一行

操作舉例:
echo hello > file1 echo shiyanlou > file2
echo www.shiyanlou.com > file3 paste -d ':' file1 file2 file3
$ paste -s file1 file2 file3

三、實驗總結(jié)

上面這些命令不是所有你都會經(jīng)常用到,不過它們確是很實用的,熟練掌握之后,可以減輕很多工作量,比如不停的用鼠標(biāo)操作在 gedit 里面復(fù)制粘貼賦值粘貼,將兩個文件的內(nèi)容合并為一個文件,這原本只需要一個命令就能完成。

四、輕松一下

還記得小時候在小霸王上面玩的小蜜蜂游戲么?它的正統(tǒng)名字應(yīng)該是Space Invaders:太空侵略者

使用下面這個命令可以安裝,之所以叫 ninvaders 是因為這款游戲是基于 ncurses 命令行圖形庫做的:
sudo apt-get install ninvaders

五、作業(yè)

1、在《文件打包與解壓縮》一節(jié)實驗中提到 Windows/dos 與 Linux/UNIX 文本文件一些特殊字符不一致如斷行符 Windows 為 CR+LF(\r\n),Linux/UNIX 為 LF(\n)。使用cat -A 文本 可以看到文本中包含的不可見特殊字符。Linux 的\n表現(xiàn)出來就是一個,而 Windows/dos的表現(xiàn)為^M,可以直接使用dos2unix和unix2dos工具在兩種格式之間進(jìn)行轉(zhuǎn)換,使用file命令可以查看文件的具體類型。不過現(xiàn)在希望你在不使用上述兩個轉(zhuǎn)換工具的情況下,使用前面學(xué)過的命令手動完成 dos 文本格式到 UNIX 文本格式的轉(zhuǎn)換。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本文筆記源自這里——[實驗樓]歡迎大家在下面交流其中有問題的地方喜歡請點收藏,每日更新(全部已親自實踐). 一. ...
    東皇Amrzs閱讀 4,333評論 7 54
  • 一、tr命令 tr命令可以用來刪除一段文本中的某些文字,或者將其進(jìn)行轉(zhuǎn)換。 tr使用方法: tr常用選項: 選項說...
    EldonZhao閱讀 284評論 0 0
  • 文件操作: ls ####查看目錄中的文件#### ls -F ####查看目錄中的文件#### ls -l ##...
    劍風(fēng)閱讀 626評論 0 1
  • centos7 常用命令管理centos服務(wù)器的時候常會對文件進(jìn)行一些常規(guī)操作,除了ftp之外了解在ssh下必要的...
    小線亮亮閱讀 1,281評論 0 2
  • 官網(wǎng) 中文版本 好的網(wǎng)站 Content-type: text/htmlBASH Section: User ...
    不排版閱讀 4,727評論 0 5

友情鏈接更多精彩內(nèi)容