IP屬地:山西
Q-learning 決策: 根據(jù)Q表,選擇reward較大的action. Q-learning 更新: 代碼如下
強(qiáng)化學(xué)習(xí)方法匯總 (Reinforcement Learning): (1)Model-free 和 Model-based: model-free是指agent對環(huán)境不了解...
一. 大致流程如下 股票歷史數(shù)據(jù) 股票技術(shù)指標(biāo) 股吧文本數(shù)據(jù) 1.特征選擇 2.股吧文本情感分析 2.1文本數(shù)據(jù)預(yù)處理 2.2 基于LSTM的情感分析模型 2.3 處理結(jié)果 ...