解析數(shù)據(jù)存儲(chǔ)MySQL

為了適應(yīng)不同項(xiàng)目對(duì)不同感興趣屬性的解析存儲(chǔ),數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)采用縱向的屬性列表方式,即一個(gè)url頁(yè)面多個(gè)屬性存儲(chǔ)多條記錄方式,并且按照text,html,data,num幾大典型類(lèi)型分別對(duì)應(yīng)存儲(chǔ)。

創(chuàng)建UTF-8字符集的nutch數(shù)據(jù)庫(kù),并執(zhí)行表初始化腳本,參考DDL:

CREATE TABLE `crawl_data` (

`url` varchar(255) NOT NULL,

`code` varchar(255) NOT NULL,

`name` varchar(255) DEFAULT NULL,

`category` varchar(255) DEFAULT NULL,

`order_index` int(255) DEFAULT NULL,

`fetch_time` datetime NOT NULL,

`text_value` text, `html_value` text,

`date_value` datetime DEFAULT NULL,

`num_value` decimal(18,2) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

為了一般在業(yè)務(wù)系統(tǒng)獲取同一個(gè)url的多個(gè)屬性或友好查詢顯示,參考如下MySQL腳本實(shí)現(xiàn)把縱向的屬性列表屬性轉(zhuǎn)換為橫向的多列顯示模式。網(wǎng)上有 相關(guān)參考腳本大多是基于數(shù)字字段sum匯總等模式的縱轉(zhuǎn)橫SQL腳本,本項(xiàng)目需求是單一的基于字符串信息轉(zhuǎn)換,經(jīng)過(guò)一段摸索最后找到基于 GROUP_CONCAT可以實(shí)現(xiàn):

SELECT url ,fetch_time,

GROUP_CONCAT(CASE WHEN code = 'domain' THEN text_value ELSE null END) AS `domain`,

GROUP_CONCAT(CASE WHEN code = 'name' THEN text_value ELSE null END) AS `name`,

GROUP_CONCAT(CASE WHEN code = 'brand' THEN text_value ELSE null END) AS `brand`,

GROUP_CONCAT(CASE WHEN code = 'category' THEN text_value ELSE null END) AS `category`,

GROUP_CONCAT(CASE WHEN code = 'purpose' THEN text_value ELSE null END) AS `purpose`,

GROUP_CONCAT(CASE WHEN code = 'price' THEN num_value ELSE null END) AS `price`,

GROUP_CONCAT(CASE WHEN code = 'refPrice' THEN num_value ELSE null END) AS `refPrice`,

GROUP_CONCAT(CASE WHEN code = 'primaryImage' THEN text_value ELSE null END) AS `primaryImage` FROM crawl_data GROUP BY url,fetch_time

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • PLEASE READ THE FOLLOWING APPLE DEVELOPER PROGRAM LICENSE...
    念念不忘的閱讀 13,655評(píng)論 5 6
  • **2014真題Directions:Read the following text. Choose the be...
    又是夜半驚坐起閱讀 11,088評(píng)論 0 23
  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,554評(píng)論 19 139
  • (這是一篇有味道的文章) 媽媽雖然是一名負(fù)責(zé)任的養(yǎng)狗人,可是我們?cè)谀承﹩?wèn)題上始終達(dá)不成共識(shí)。她總說(shuō)養(yǎng)個(gè)畜生有什么用...
    西風(fēng)東來(lái)閱讀 522評(píng)論 0 3
  • 今天看到基友在朋友圈發(fā)了一條消息 你憑什么叫你的男人給你買(mǎi)買(mǎi)買(mǎi) 此話言外之意就是你一姑娘年紀(jì)輕輕,有手有腳,自己不...
    三歲半CHIC閱讀 809評(píng)論 0 1

友情鏈接更多精彩內(nèi)容