iOS 輕量級 HTML 解析方案

一個輕量級的 Objective-C-HMTL-Parser 解析庫,這里主要是希望 HTML 解析出想要的標簽字段。

題外:如果是要將 HTML 解析成富文本展示,推薦 DTCoreText。

添加到 framework 或 app 在 Build Setting 的 Header Search Paths 添加 $(SDKROOT)/usr/include/libxml2。

如果是添加到 podspec 則添加,則:

s.library = 'xml2'
s.xcconfig = { 'HEADER_SEARCH_PATHS' => '$(SDKROOT)/usr/include/libxml2', 'OTHER_LDFLAGS' => '-lxml2' }

解決 libxml2 中文亂碼

/**
 解決 xml2 中文亂碼
 參考:https://blog.fedepot.com/ios-9-htmlparserzhong-wen-luan-ma-wen-ti/
 */
-(id)initWithString:(NSString*)string error:(NSError**)error
{
    if (self = [super init])
    {
        _doc = NULL;
        
        if ([string length] > 0)
        {
            CFStringEncoding cfenc = CFStringConvertNSStringEncodingToEncoding(NSUTF8StringEncoding);
            CFStringRef cfencstr = CFStringConvertEncodingToIANACharSetName(cfenc);
            const char *enc = CFStringGetCStringPtr(cfencstr, 0);
            //Fix iOS9 Chinese wrong characters - begin
            char buffer[255];
            if (enc == NULL) {
                if (CFStringGetCString(cfencstr, buffer, 255, kCFStringEncodingUTF8)) enc = buffer;
            }
            //Fix iOS9 Chinese wrong characters - end
            // _doc = htmlParseDoc((xmlChar*)[string UTF8String], enc);
            int optionsHtml = HTML_PARSE_RECOVER;
            optionsHtml = optionsHtml | HTML_PARSE_NOERROR; //Uncomment this to see HTML errors
            optionsHtml = optionsHtml | HTML_PARSE_NOWARNING;
            _doc = htmlReadDoc ((xmlChar*)[string UTF8String], NULL, enc, optionsHtml);
        }
        else
        {
            if (error) {
                *error = [NSError errorWithDomain:@"HTMLParserdomain" code:1 userInfo:nil];
            }
        }
    }
    
    return self;
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容