1
2
1759
3
與 《Knowing When to Look: Adaptive Attention via A Visual Sentinel for Im...
Motivation plain的RNN存在梯度消失與爆炸問題,而LSTM/GRU雖然一定程度解決了問題,但是由于采用tanh或者sigmoid...