R語言常用字符串處理

不管你成不承認(rèn),R的文字處理不如Python好,盡管也能用。
R可以創(chuàng)建字符向量,

> character(length = )

對(duì)于字符串,我們常需要合并、取出部分、統(tǒng)計(jì)長(zhǎng)度,R中都需要函數(shù)。

# 合并
paste(x, y, sep = '')
# 統(tǒng)計(jì)長(zhǎng)度
nchar(x)
# 取子串
substr(x, start = , stop = )

正則表達(dá)式的使用套路:

m <- regexpr('/art/[0-9]*/[0-9]*/[0-9]*/art_[0-9]*_[0-9]*.html', c[j])
c[j] <- substr(c[j], m, attr(m, "match.length") - 1 + m)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 在挖掘分析的過程當(dāng)中對(duì)字符串的處理是極為重要的,且出現(xiàn)也較為頻繁,R語言作為當(dāng)前最為流行的開源數(shù)據(jù)分析和可視化平臺(tái)...
    果果哥哥BBQ閱讀 6,161評(píng)論 0 8
  • 今天學(xué)習(xí)了戴維·艾倫的書,書名有趣,《搞定》,如此吸引人,真迫不及待想打開啃點(diǎn)精神食糧,嗯,學(xué)習(xí)使我快樂。 說白了...
    楊拾一閱讀 238評(píng)論 4 2
  • 時(shí)間挺快挺快的,轉(zhuǎn)眼10月又將過了,以前任由時(shí)間的匆匆而過,我信淡然?,F(xiàn)在竟有一絲絲恐慌,有驚喜的期待,也有對(duì)未知...
    清湯寡水bh閱讀 144評(píng)論 0 0

友情鏈接更多精彩內(nèi)容