研究生三年,作為一名非計算機專業(yè)的學生,能夠從一名純小白(Python不會,機器學習沒聽說過)到最后校招拿到幾個不錯的offer,個人感覺可以給自己打個及格分吧。寫本文的目的...
這篇文章以flink官方local cluster教程為主線,引導大家體驗一下flink的初次開發(fā)。文章中所提到的代碼我已經放到github上,歡迎指正。 下載和啟動Flin...
1、生成器Generator 設想我們有一個包含100萬個元素的列表,列表占用了很大的存儲空間,如果我們僅僅需要訪問前面的幾個元素,這樣就會造成極大的資源浪費。 所以,如果有...
今天查找分布式計算的有關資料,發(fā)現Google的三大核心技術MapReduce、GFS和BigTable的論文都已經被翻譯成高質量的中文,更巧的是,這三篇中譯版的原發(fā)地都是C...
前言 Spark 2.0 將流式計算也統(tǒng)一到DataFrame里去了,提出了Structured Streaming的概念,將數據源映射為一張無線長度的表,同時將流式計算的結...
一面:遇到了一個搞圖像算法的面試官,跟我的方向不太符合,所以沒有問太多問題??傮w來說比較輕松1、CNN的原理簡單說一下。2、SVM的原理。3、鏈表實現加法,由于給出的鏈表已經...
最近在How一直想建立起非常專業(yè)的data pipeline系統(tǒng),然后沒有很多時間,這幾個禮拜正好app上線,有時間開始建立自己的 data pipeline,能夠很好的做每...
本文結構: 什么是 ROC? 怎么解讀 ROC 曲線? 如何畫 ROC 曲線? 代碼? 什么是 AUC? 代碼? ROC 曲線和 AUC 常被用來評價一個二值分類器的優(yōu)劣。 ...
1. Apache Kylin 是什么? Apache Kylin?是一個開源的分布式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數...
Kafka是什么 Kafka是最初由Linkedin公司開發(fā),是一個分布式、分區(qū)的、多副本的、多訂閱者,基于zookeeper協調的分布式日志系統(tǒng)(也可以當做MQ系統(tǒng)),常見...
1、線程和進程 計算機的核心是CPU,它承擔了所有的計算任務。它就像一座工廠,時刻在運行。 假定工廠的電力有限,一次只能供給一個車間使用。也就是說,一個車間開工的時候,其他車...