在linux中文件中^M符號(hào)的問(wèn)題以及中文識(shí)別問(wèn)題

^M符號(hào)的問(wèn)題

在Windows系統(tǒng)下編輯的文件,換行符回車(chē)的格式為'\r\n',在linux系統(tǒng)下,回車(chē)的格式為'\n',在Windows下編輯的文本文件在上傳至linux服務(wù)器時(shí),回車(chē)'\r\n'就顯示成^M+'\n'。

在Windows環(huán)境下

用ultraedit或者notepad plus都有相應(yīng)的選項(xiàng)可以將Windows下的文本格式文件轉(zhuǎn)換成unix格式文件。比如:notepad plus中“編輯”—>“檔案格式轉(zhuǎn)換”—>“轉(zhuǎn)換為UNIX格式”。

在linux環(huán)境下

第一種方法:
cat -A filename 就可以看到Windows下的斷元字符 ^M,要去除他,最簡(jiǎn)單用下面的命令:

dos2unix filename

第二種方法:^M 輸入方法: ctrl+V ,enter

sed -i -e 's/^M//' file.vcf

第三種方法: ^M 輸入方法: ctrl+V ,enter
使用vi 進(jìn)行編輯

:%s/^M//g

第四種方法:^M 可用 \r 代替

cat filename |tr -d '\r' > newfile

中文識(shí)別的問(wèn)題

簡(jiǎn)單點(diǎn)的方法是,在notepad++中打開(kāi),

編輯——文檔格式轉(zhuǎn)換——轉(zhuǎn)換為UNIX格式
編碼——轉(zhuǎn)換為UTF-8編碼

在保存就好了。

linux中的中文在windows下讀取

有時(shí)在linux的文件中輸入了中文,并且是以中文為行結(jié)尾的,這時(shí)再在windows的R中入去時(shí)可能報(bào)錯(cuò)


linux下的文件

Excel下顯示的該文件

也就是說(shuō)在windows下它是變成了一行,修改辦法是使用notepad++打開(kāi)

編輯——文檔格式轉(zhuǎn)換——轉(zhuǎn)換為windows格式
編碼——轉(zhuǎn)換為ANSI編碼

如果需要在R中直接讀取文件的話,需要在read.table中添加 fileEncoding="UTF-8"這個(gè)參數(shù)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容