本教程描述拉如何在 Kubernetes 上運(yùn)行 Apache Cassandra[https://cassandra.apache.org/]。 數(shù)據(jù)庫(kù) Cassandra...
本教程描述拉如何在 Kubernetes 上運(yùn)行 Apache Cassandra[https://cassandra.apache.org/]。 數(shù)據(jù)庫(kù) Cassandra...
獨(dú)熱編碼 獨(dú)熱編碼即 One-Hot 編碼,又稱一位有效編碼,其方法是使用N位狀態(tài)寄存器來(lái)對(duì)N個(gè)狀態(tài)進(jìn)行編碼,每個(gè)狀態(tài)都有它獨(dú)立的寄存器位,并且在任意時(shí)候,其中只有一位有效。...
一、數(shù)據(jù)同步方案 二、技術(shù)選型 2.1 開(kāi)源框架與阿里云架構(gòu)對(duì)比 分類阿里云架構(gòu)開(kāi)源架構(gòu)數(shù)據(jù)采集DTS、DataHubcanal、flume數(shù)據(jù)傳輸DTS、DataHubka...
1、FM背景 在計(jì)算廣告和推薦系統(tǒng)中,CTR預(yù)估(click-through rate)是非常重要的一個(gè)環(huán)節(jié),判斷一個(gè)商品的是否進(jìn)行推薦需要根據(jù)CTR預(yù)估的點(diǎn)擊率來(lái)進(jìn)行。在進(jìn)...
基礎(chǔ)命令 基本DDL 內(nèi)部表與外部表的區(qū)別 Hive 創(chuàng)建內(nèi)部表時(shí),會(huì)將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指向的路徑; Hive 創(chuàng)建外部表,僅記錄數(shù)據(jù)所在的路徑, 不對(duì)數(shù)據(jù)的位置做任何改變...
阿里提出了“大中臺(tái),小前臺(tái)”,其中臺(tái)事業(yè)部包括搜索事業(yè)部、共享業(yè)務(wù)平臺(tái)、數(shù)據(jù)技術(shù)及產(chǎn)品部,數(shù)據(jù)技術(shù)及產(chǎn)品部應(yīng)是數(shù)據(jù)中臺(tái)建設(shè)的核心部門。 那么,數(shù)據(jù)中臺(tái)到底是什么?具體包含哪些...
Hive作為大數(shù)據(jù)領(lǐng)域常用的數(shù)據(jù)倉(cāng)庫(kù)組件,在平時(shí)設(shè)計(jì)和查詢時(shí)要特別注意效率。影響Hive效率的幾乎從不是數(shù)據(jù)量過(guò)大,而是數(shù)據(jù)傾斜、數(shù)據(jù)冗余、job或I/O過(guò)多、MapRedu...