C++ Builder 參考手冊 ? System::Sysutils ? CharLength
字符串里面從某個編碼單元開始的字符的字節(jié)數(shù)
頭文件:#include <System.SysUtils.hpp>
命名空間:System::Sysutils
函數(shù)原型:
int __fastcall CharLength(const System::UnicodeString S, int Index);
參數(shù):
- S:字符串;
- Index:編碼單元序號,從 1 到 n,n 為字符串長度;由于 UnicodeString 是 UTF-16 編碼的,編碼單元為 char16_t (或 wchar_t),由于一個字符可能由 1 個或 2 個 char16_t 組成的,一個字符是 2 或 4 個字節(jié);
返回值:
- 2: 在 Index 位置的字符是單個編碼的字符 (2 個字節(jié)的字符),或者半個字符位置 (這是單個編碼單元的字符,或者與前面的編碼單元組成一個字符);
- 4: 在 Index 位置的字符是兩個編碼單元的字符 (4 個字節(jié)的字符);
- 字符串 L"Hello玄坴" 長度為 7,即包含 7 個編碼單元,14 個字節(jié),包含的字符個數(shù)是 7 個字符;
- 字符串 L"土??圭垚???" 長度為 8,即包含 8 個編碼單元,16 個字節(jié),包含的字符個數(shù)是 6 個字符,其中 "土"、"圭"、"垚" 和 "?" 都是單個編碼單元的字符 (2個字節(jié)),"??" 和 "??" 是兩個編碼單元的字符 (4個字節(jié))。
例子:輸出字符串 L"土??圭垚???" 里面每個 char16_t 位置開始的字符是幾個字節(jié);
void __fastcall TForm1::Button1Click(TObject *Sender)
{
UnicodeString s = L"土??圭垚???";
int n = s.Length();
for(int i=1; i<=n; i++)
{
Memo1->Lines->Add(String().sprintf(L"%d:%d",i,Sysutils::CharLength(s,i)));
}
}
運行結(jié)果:
通過運行結(jié)果可以看到:
- "土"、"圭"、"垚" 和 "?" 都是單個編碼單元的字符 (2個字節(jié)),"??" 和 "??" 是兩個編碼單元的字符 (4個字節(jié));
- 序號 Index 在半個字符位置返回結(jié)果為 2,否則返回 2 (單個編碼單元的字符) 或 4 (兩個編碼單元的字符)。

運行結(jié)果
相關(guān):
- System::Sysutils::ByteToCharIndex
- System::Sysutils::BytesOf
- System::Sysutils::WideBytesOf
- System::Sysutils::PlatformBytesOf
- System::Sysutils::StringOf
- System::Sysutils::WideStringOf
- System::Sysutils::PlatformStringOf
- System::Sysutils::ByteLength
- System::Sysutils::CharLength
- System::Sysutils::StrCharLength
- System::Sysutils::AnsiLastChar
- System::Sysutils::AnsiStrLastChar
- System::Sysutils::AnsiPos
- System::Sysutils::AnsiStrPos
- System::Sysutils::AnsiStrScan
- System::Sysutils::AnsiStrRScan
- System::Sysutils::CharToElementIndex
- System::Sysutils::CharToElementLen
- System::Sysutils::ElementToCharIndex
- System::Sysutils::ElementToCharLen
- System::Sysutils
- std::mblen
- std::_mbstrlen
- <cstdlib>
- std::strlen, std::_fstrlen, std::_tcslen, std::wcslen
- <cstring>
C++ Builder 參考手冊 ? System::Sysutils ? CharLength