2.1機器學習三要素 模型+策略+算法 模型:總結數據的規(guī)律,用數學語言描述參數系統(tǒng) 策略:選取最優(yōu)的評價準則 算法:選取最優(yōu)模型的具體方法 2.2 機器學習方法分類 2.2...
2.1機器學習三要素 模型+策略+算法 模型:總結數據的規(guī)律,用數學語言描述參數系統(tǒng) 策略:選取最優(yōu)的評價準則 算法:選取最優(yōu)模型的具體方法 2.2 機器學習方法分類 2.2...
1.下載安裝miniconda 并且將 D:\app\miniconda\condabin 加入環(huán)境變量(path) 2.vscode 選擇cmd終端,不選powershel...
說明 postgresql從9.5版本開始新加入了group by的分組集合功能,提供了GROUPING SETS,CUBE,ROLLUP參數,使用方式與oracle[htt...
一.pom.xml 二、測試代碼 三、常見的坑 3.1 pom文件的scala版本和idea手動導入版本不一致 pom.xml 的scala版本是 2.11修改辦法是: 沖突...
背景 Flink LookupTableSource 通過使用流數據的一列或者多列的值,加載外部存儲數據(維表數據),進而完成對流數據的字段擴展。在維表數據不頻繁變更的情況下...
一、數據傳輸形式 Stream在算子之間傳輸數據的形式可以是one-to-one(forwarding)的模式也可以是redistributing的模式,具體是哪一種形式,取...
一、介紹 所有的Flink程序都是由三部分組成的: Source 、Transformation 和 Sink。 Source 負責讀取數據源,Transformation...
1.導出女裝類目2020年整體銷額,訂單數,銷量 2.導出2018年4月總銷額大于2000元的商品,整年的訂單數,銷量,購買用戶數,總金額 3.導出2019年訂單單價在如下價...
一、問題引入 問題引入:比較上面兩張圖,圖1中,相同算子操作放在不同的slot中,圖2中一個算子操作占用一個slot。如果flink window操作比較復雜,那么圖2中就會...
思考問題:1.怎么樣實現并行計算?答:設置并行度。多線程,不同任務放到不同線程上。 2.并行的任務,需要占用多少slot? 3.一個流處理程序,到底包含多少個任務? 一、Ta...
一、flink運行時架構圖https://ci.apache.org/projects/flink/flink-docs-release-1.11/fig/processes...