我們先來對比一下AlexNet和VGGNet。AlexNet整個網(wǎng)絡(luò)結(jié)構(gòu)包括五層卷積層和三層全連接層。而VGGNet的結(jié)構(gòu)上來看,有更多的輸出c...
最近倒騰了許多CNN的實驗,有人問這些實驗大把大把啊,做完就算了,為什么要寫總結(jié)。其實在我看來,我們做實驗也只是不斷復(fù)現(xiàn)大牛的網(wǎng)絡(luò),我們會花更長...
今天小編打算補充一下上一篇上市公司歷史新聞數(shù)據(jù)分析(一)的部分內(nèi)容,以及進一步闡述如何利用SVM和RandomForest做文本分類及效果對比。...
上一篇講到如何爬取新浪財經(jīng)和每經(jīng)網(wǎng)新聞數(shù)據(jù),今天分享一下小編如何分析數(shù)據(jù)。在分詞上,小編用了jieba分詞類庫,但只是利用jieba的詞庫來分,...
最近一周在鉆研如何利用新聞數(shù)據(jù)進行量化投資,在正式進行文本挖掘以及開發(fā)策略前,首當其沖的當然要準備好數(shù)據(jù)?!熬W(wǎng)絡(luò)爬蟲”、“數(shù)據(jù)抓取”這樣字...
Gensim是一個Python的自然語言處理庫,所用到的算法,如TF-IDF(Term Frequency–Inverse Document F...
Hello everyone, it's been a while not updating my papers, cause I have c...
BPTT(Back PropagationThough Time)公式推導 由于RNN被廣泛應(yīng)用于序列標注問題(SequenceLabelin...
我們談及數(shù)據(jù)挖掘,無非是“分類”,“關(guān)聯(lián)”,“聚類”,“異常值檢驗”等。今天我想聊聊對聚類的認識,以及基于密度聚類下生成的初始化簇心與K-Mea...