stack 棧 先進(jìn)后出 隊(duì)列 queue 單端隊(duì)列 push 相當(dāng)于push_backpop 相當(dāng)于pop_front deque 雙端隊(duì)列 ...
決策樹 特征分裂點(diǎn)選取方法:遍歷所有value,以該value作為切分點(diǎn),計(jì)算左右集合的MSE,選取最佳切分點(diǎn),同時(shí)切分樣本到下層節(jié)點(diǎn)除了MSE...
Q-Learning 行是state,列是action off-policy算法 ε-greedy貪心算法 Q更新公式如下:圖片.png SAR...
強(qiáng)化學(xué)習(xí)的過程,分為模型訓(xùn)練和應(yīng)用兩部分。在應(yīng)用階段,模型的按照action的效果最大化進(jìn)行輸出結(jié)果。因此最優(yōu)的action有最高的概率。訓(xùn)練階...
1. Sigmoid函數(shù) 優(yōu)點(diǎn):取值在0-1之間缺點(diǎn):容易出現(xiàn)梯度彌散現(xiàn)象 2. ReLU函數(shù) 優(yōu)點(diǎn):相比Sigmoid不容易出現(xiàn)梯度彌散現(xiàn)象缺...
代碼與筆記如下
https://zhuanlan.zhihu.com/p/84431551[https://zhuanlan.zhihu.com/p/84431...