我們想要的是通過之前的平均值,求新的平均值:只要知道了的算法,就可以實現(xiàn)只要已有平均值 和 新添加值,就可以算出新的平均值 用 和 帶入公式...
數(shù)據(jù)和枚舉的對應(yīng)關(guān)系:{A:1, B:2, C:3, ...} 網(wǎng)絡(luò)層輸入按照枚舉方式,比如是A的話,那么輸入層就是A: [1, 0, 0, 0...
是無知的可怕。 有一類數(shù),可以用兩個數(shù)的比值來表示,比如 在古希臘(及希臘系的英語),這類數(shù)叫 ratio(估算,計算,原因,兩數(shù)的關(guān)系,和re...
probability:發(fā)生的概率 發(fā)生的次數(shù)/總次數(shù)0:不發(fā)生 1:必發(fā)生 odds:發(fā)生比 發(fā)生的概率 / 不發(fā)生的概率0:不發(fā)生,:必發(fā)生...
從一個樣本空間中,抽樣。比如:我要抽 [0, 1, 2] 三個物體,共100次,那我希望: 0能抽到20次左右 1能抽到70次左右 2能抽到30次左右
policy gradient 其實就是 的平均數(shù): corssentropy是加法,總和。這里需要每一項,所以就取一個平均值。 好算,就是遞...
國內(nèi)游戲公司普遍分不清 項目經(jīng)理 和 制作人,產(chǎn)品經(jīng)理的區(qū)別。我試著區(qū)分一下: 國外 制作人 這個職位,不負(fù)責(zé) 游戲的設(shè)計 和 發(fā)布(對這兩樣的...
Q-learning 是RL的核心 Q 代表 Quality 品質(zhì) 系統(tǒng)維護一個Q值表: 13.31.622.67.832.49.541.35....
數(shù)組維度和方向(連接) gather() 函數(shù)是按照索引選取數(shù)字: 一個二維數(shù)組,如果沿第0維選取元素,則按照將頭方向依次選取數(shù)字。0,2,1就...