被用來“切割”的文本

所有類linux的操作系統(tǒng)都非常依賴于被用于幾種數(shù)據(jù)類型存儲的文本文件。很多人會使用純文本格式來編寫文檔,雖然很容易看到一個小的文本文件對于保存簡單的筆記會很有幫助,但是也有可能用文本格式來編寫大的文檔,一種比較流行的方式就是先用文本格式來編寫一個大的文檔,然后用一種標(biāo)記語言的方式來描述已完成文檔的格式。而linux的文本處理系統(tǒng)位于該項技術(shù)的前列。

目前,最流行的電子文檔類型可能就是網(wǎng)頁了,網(wǎng)頁是文本文檔,它們使用HTML(超文本標(biāo)記語言)或者是XML(可擴展的標(biāo)記語言)作為標(biāo)記語言來描述文檔的可視格式。另外,email是一個基于文本的媒介,為了傳輸,甚至非文本的附件也會被轉(zhuǎn)換成文本表示形式。通過下載一個email信息,然后用less瀏覽它,我們可以看到這條信息始于一個標(biāo)題,其描述了信息的來源以及在傳輸過程中它接受到的處理,然后是信息的正文內(nèi)容。輸出時,會以純文本的格式發(fā)送到打印機。或者頁面包含圖形,其會被轉(zhuǎn)換成一種文本格式的頁面描述語言,以PostScript著稱,然后再發(fā)送給一款能生成圖形點陣的程序,最后被打印出來。

有好多命令的選項可以用來幫助更好的可視化文本內(nèi)容。sort程序?qū)?biāo)準(zhǔn)輸入的內(nèi)容,或命令行中指定的一個或多個文件進行排序,然后把排序結(jié)果發(fā)送到標(biāo)準(zhǔn)輸出。uniq程序執(zhí)行一個看似瑣碎的行為,當(dāng)給定一個排序好的文件(包括標(biāo)準(zhǔn)輸出),uniq會刪除任意重復(fù)行,并且把結(jié)果發(fā)送到標(biāo)準(zhǔn)輸出。uniq常常和sort程序一塊使用,來清理重復(fù)的輸出。cut程序被用來從文本文件中抽取文本,并將其輸出到標(biāo)準(zhǔn)輸出,它能夠接受多個文件參數(shù)或者標(biāo)準(zhǔn)輸入。paste的功能與cut恰恰相反,它會添加一個或多個文本列到文件中,而不是從文件中抽取文本列。

通常比較文本文件的版本是很有幫助的,對于系統(tǒng)管理員和軟件卡法這來說,這個尤為重要。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,533評論 19 139
  • linux資料總章2.1 1.0寫的不好抱歉 但是2.0已經(jīng)改了很多 但是錯誤還是無法避免 以后資料會慢慢更新 大...
    數(shù)據(jù)革命閱讀 13,199評論 2 33
  • Ubuntu的發(fā)音 Ubuntu,源于非洲祖魯人和科薩人的語言,發(fā)作 oo-boon-too 的音。了解發(fā)音是有意...
    螢火蟲de夢閱讀 100,603評論 9 468
  • 命令行的藝術(shù) 前言 基礎(chǔ) 日常使用 文件及數(shù)據(jù)處理 系統(tǒng)調(diào)試 單行腳本 冷門但有用 僅限 OS X 系統(tǒng) 僅限 W...
    進擊的諾基亞閱讀 3,919評論 0 19
  • 在寫iOS程序的時候,想初始化一個空值的時候,經(jīng)常會迷茫到底是用nil,null還是NSNull, 想定義一個布爾...
    夢在旅途閱讀 942評論 0 0

友情鏈接更多精彩內(nèi)容