有意向的學(xué)弟學(xué)妹們歡迎向 gaohangwang@gmail.com 投遞簡(jiǎn)歷
前言 近兩年,KUDU 在大數(shù)據(jù)平臺(tái)的應(yīng)用越來越廣泛。在阿里、小米、網(wǎng)易等公司的大數(shù)據(jù)架構(gòu)中,KUDU 都有著不可替代的地位。本文通過分析 KU...
前言 為了提升我們的軟件性能,我們有多種方法,如合理的數(shù)據(jù)結(jié)構(gòu)、優(yōu)秀的算法,還有非常重要的一點(diǎn)就是:依據(jù)軟件所依附的硬件自身特性,設(shè)計(jì)能最大限度...
前言 TensorFlow 是谷歌開源的深度學(xué)習(xí)工具包,它將深度學(xué)習(xí)復(fù)雜的計(jì)算過程抽象成了數(shù)據(jù)流圖(Data Flow Graph),并提供簡(jiǎn)介...
前言 在上文中我們介紹了 Kafka 的網(wǎng)絡(luò)通信,本文打算詳細(xì)分析 Kafka 的核心 — 隊(duì)列的設(shè)計(jì)和實(shí)現(xiàn),來對(duì) Kafka 進(jìn)行更深一步的了...
前言 Kafka 是 LinkedIn 開發(fā)的一個(gè)分布式的消息中間件。由于其高吞吐量、可水平擴(kuò)展等特性,目前被廣泛使用,已經(jīng)是目前大數(shù)據(jù)生態(tài)系統(tǒng)...
前言 互聯(lián)網(wǎng)發(fā)展至今,搜索引擎仍然是獲取信息最重要的途徑之一,而搜索結(jié)果的排序是搜索引擎的核心技術(shù)之一,常見的排序算法有 PageRank、向量...
前言 決策樹是一種簡(jiǎn)單高效并且具有強(qiáng)解釋性的模型,廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域。其本質(zhì)是一顆由多個(gè)判斷節(jié)點(diǎn)組成的樹,如: 在使用模型進(jìn)行預(yù)測(cè)時(shí),根據(jù)輸...
前言 目前主流的搜索引擎實(shí)時(shí)性一般都不是很高。對(duì)于一般的網(wǎng)站內(nèi)容,延遲一段時(shí)間問題不大,但對(duì)于 twitter 這種網(wǎng)站,熱點(diǎn)信息會(huì)被迅速地發(fā)布...