java全角半角標(biāo)點(diǎn)符號(hào)轉(zhuǎn)換

早上發(fā)現(xiàn)某個(gè)群居然爆出一個(gè)bug,上游系統(tǒng)存儲(chǔ)的客戶簡(jiǎn)稱是商務(wù)人員自己填的,這個(gè)字段支持用戶錄入各種字符。但是下游對(duì)接的其他系統(tǒng),在將這個(gè)字段應(yīng)用到系統(tǒng)中的時(shí)候,不能支持全角的標(biāo)點(diǎn)符號(hào),如果這個(gè)字段有全角標(biāo)點(diǎn)符號(hào),則系統(tǒng)會(huì)出錯(cuò)。

看到這個(gè)問題,我首先覺得下游對(duì)接的系統(tǒng)也是奇葩,居然還不支持全角的字符串。但是一想到我們沒辦法強(qiáng)迫下游系統(tǒng)來改變他們的接口,而站在本系統(tǒng)的角度來考慮,未來下游系統(tǒng)還很多,畢竟客戶的基本信息數(shù)據(jù)會(huì)應(yīng)用到越來越多的系統(tǒng)中去。最好的方式就是我們將采集到的客戶信息中的全角字符,都自動(dòng)轉(zhuǎn)為半角字符。將客戶信息的接口加以約束,這樣能一勞永逸。

說到全角和半角的標(biāo)點(diǎn)符號(hào)問題,這里就需要介紹一下什么是全角,什么是半角。

全角:指一個(gè)字符占用兩個(gè)標(biāo)準(zhǔn)字符位置。
漢字字符和規(guī)定了全角的英文字符及國(guó)標(biāo)GB2312-80中的圖形符號(hào)和特殊字符都是全角字符。一般的系統(tǒng)命令是非全角字符的,只有在文本處理時(shí)才會(huì)使用全角字符。

半角:指一字符占用一個(gè)標(biāo)準(zhǔn)的字符位置。
通常的英文字母、數(shù)字鍵、符號(hào)鍵都是半角的,半角的顯示內(nèi)碼都是一個(gè)字節(jié)。在系統(tǒng)內(nèi)部,以上三種字符是作為基本代碼處理的,所以用戶輸入命令和參數(shù)時(shí)一般都使用半角。

全角與半角的使用場(chǎng)景
通常情況下,我們認(rèn)為全角是占兩個(gè)字節(jié),而半角只占一個(gè)字節(jié),但是需要注意的是,這都是相對(duì)標(biāo)點(diǎn)符號(hào)而言。因?yàn)闈h字不管全角還是半角,都是兩個(gè)字節(jié)。而我們的所有程序代碼中,都只支持半角字符,全角字符默認(rèn)會(huì)當(dāng)作文本。

全角字符和半角字符的范圍:
經(jīng)過觀察,我們可以得到如下結(jié)論:

  • 1.半角字符是從33開始到126結(jié)束
  • 2.與半角字符對(duì)應(yīng)的全角字符是從65281開始到65374結(jié)束
  • 3.其中半角的空格是32.對(duì)應(yīng)的全角空格是12288
  • 4.半角和全角的關(guān)系很明顯,除空格外的字符偏移量是65248(65281-33 = 65248)

這樣我們可以做一個(gè)工具類來進(jìn)行全角和半角字符的轉(zhuǎn)換,針對(duì)本文開篇的問題,就可以很方便的解決:

package com.dhb.springbootdata;

public class AsciiUtil {

    public static final char SBC_SPACE = 12288; // 全角空格 12288

    public static final char DBC_SPACE = 32; //半角空格 32

    // ASCII character 33-126 <-> unicode 65281-65374
    public static final char ASCII_START = 33;

    public static final char ASCII_END = 126;

    public static final char UNICODE_START = 65281;

    public static final char UNICODE_END = 65374;

    public static final char DBC_SBC_STEP = 65248; // 全角半角轉(zhuǎn)換間隔

    public static char sbc2dbc(char src) {
        if (src == SBC_SPACE) {
            return DBC_SPACE;
        }

        if (src >= UNICODE_START && src <= UNICODE_END) {
            return (char) (src - DBC_SBC_STEP);
        }

        return src;
    }

    /**
     * Convert from SBC case to DBC case
     *
     * @param src
     * @return DBC case
     */
    public static String sbc2dbcCase(String src) {
        if (src == null) {
            return null;
        }
        char[] c = src.toCharArray();
        for (int i = 0; i < c.length; i++) {
            c[i] = sbc2dbc(c[i]);
        }
        return new String(c);
    }

    public static char dbc2sbc(char src) {
        if (src == DBC_SPACE) {
            return SBC_SPACE;
        }
        if (src <= ASCII_END) {
            return (char) (src + DBC_SBC_STEP);
        }
        return src;
    }

    /**
     * Convert from DBC case to SBC case.
     *
     * @param src
     * @return SBC case string
     */
    public static String dbc2sbcCase(String src) {
        if (src == null) {
            return null;
        }

        char[] c = src.toCharArray();
        for (int i = 0; i < c.length; i++) {
            c[i] = dbc2sbc(c[i]);
        }

        return new String(c);
    }

    public static void main(String[] args) {
        System.out.println(AsciiUtil.sbc2dbcCase("你好(張三)111?!"));
        System.out.println(AsciiUtil.dbc2sbcCase("你好(張三)111?!"));
        
        Character.MIN_VALUE
    }
}
    

上述代碼執(zhí)行結(jié)果:

你好(張三)111?!
你好(張三)111?!
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容