iOS 中英文字符串的字?jǐn)?shù)

???????開發(fā)類似輸入框輸入或者顯示固定文本的 label 時候,可能遇到需要限制顯示的字符串字?jǐn)?shù)

NSString *contentString = @"新年快樂";
NSUInteger contentLength = contentString.length;
NSLog(@"%lu", (unsigned long)contentLength);
//輸出: 4

NSString *contentString2 = @"HappyNewYear";
NSUInteger contentLength2 = contentString2.length;
NSLog(@"%lu", (unsigned long)contentLength2);
// 輸出:12

???????然后當(dāng)需要對限制輸入的字?jǐn)?shù),如前四個

NSString *contentString22 = [contentString2 substringToIndex:4];

???????會發(fā)現(xiàn) contentString2 輸出 “Happ”,到這里其實問題不大,可是產(chǎn)品會提出,英文應(yīng)該是兩個數(shù)一個,因此截出來的應(yīng)該得是“HappyNew”。
問題就在于使用 @property (readonly) NSUInteger length; 獲取到的是不論是中文字符還是英文字符,或者其他,都是一個個算。而在 Unicode 編碼中:一個中文字符=2個Unicode,一個英文字符=1個Unicode。所以可以采用 Unicode 的個數(shù)來計算字符串長度,如下兩種方法:

// 方法一、
NSUInteger contentLength = 0;
char* p = (char*)[contentString cStringUsingEncoding:NSUnicodeStringEncoding];
for (int i = 0; i < [contentString lengthOfBytesUsingEncoding:NSUnicodeStringEncoding]; i++) {
    if (*p) {
        p++;
        contentLength++;
    }
    else {
        p++;
    }
}
NSLog(@"%ld", contentLength);
// 方法二、
NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
NSData *data = [contentString dataUsingEncoding:enc];
NSUInteger contentLength2 = [data length];
NSLog(@"%ld", contentLength2);

???????通過上面計算出來會多兩倍的 length,然后通過向上取整

NSUInteger contentLength3 = ceilf(contentLength/2.0f);

???????到這里還有個問題,當(dāng)字符串里面有“一”時,使用方法一計算出來的 Unicode 個數(shù)是1,而“二、三、四”這些分別是2,也就是類似這種“一”需要特殊處理,如此。方法二測試正常。

NSUInteger count = [contentString countWithString:@"一"];
contentLength += count;

注意:這里只針對中英文字符串,即不包括這種 Emoji 這種是4個 Unicode,建議刪除,或者擴展計算

???????最后對于中英文的截斷,按 Unicode 計算,即兩個英文按一個字?jǐn)?shù)計算,補足的向后不一個字?jǐn)?shù),也就是可能出現(xiàn)一個英文(或者說奇數(shù)個英文),即不足一個字?jǐn)?shù),下面的算法是不算在字?jǐn)?shù)里面。

NSString *contentString = @"新年aaa快樂aaa";
NSString *finalContentString = contentString;
NSUInteger unicodeCount = 0;
NSUInteger unicodeLength = [contentString lengthOfBytesUsingEncoding:NSUnicodeStringEncoding];
NSUInteger maxLenght = 4 * 2;
if (unicodeLength > maxLenght) {
    NSUInteger subLength = 0;
    char* p = (char*)[contentString cStringUsingEncoding:NSUnicodeStringEncoding];
    p++;
    for (int i = 0; i < unicodeLength; i+=2) {
        if (*p) {
            subLength+=2;
            p+=2;
        }
        else {
            subLength++;
            p+=2;
        }
        unicodeCount++;
        if (subLength >= maxLenght) {
            break;
        }
    }
    finalContentString = [contentString substringToIndex:unicodeCount];
}
NSLog(@"%@", finalContentString);
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容