一.時間序列的平穩(wěn)性 并不是所有的時間序列都是可預(yù)測的,想象一下,假如一個時間序列的變化特性是不穩(wěn)定的,那么它每個時期的波動對于之后一個時期的變化的影響都是無法預(yù)測的,因?yàn)樗?..
一.時間序列的平穩(wěn)性 并不是所有的時間序列都是可預(yù)測的,想象一下,假如一個時間序列的變化特性是不穩(wěn)定的,那么它每個時期的波動對于之后一個時期的變化的影響都是無法預(yù)測的,因?yàn)樗?..
一.時間序列基本概念 1.什么是時間序列 時間序列,顧名思義就是按照時間順利排列的一組數(shù)據(jù),是同一現(xiàn)象在不同時間上的相繼觀察值排列而成的序列。根據(jù)觀察時間的不同,時間序列中的...
一、日志相關(guān)概念 日志是一種可以追蹤軟件運(yùn)行時所發(fā)生事件的方法。軟件開發(fā)人員可以向他們的代碼中調(diào)用日志記錄相關(guān)的方法來表明發(fā)生了某些事情。一個事件可以用一個可包含可選變量數(shù)據(jù)...
一. 概述 在數(shù)據(jù)處理工作中,經(jīng)常會遇到一種情況:給出一個日期序列,序列中缺少某幾天,我們需要找出缺失的日期,并將其填補(bǔ)出來。具體看下面這個數(shù)據(jù): 觀察數(shù)據(jù)可以發(fā)現(xiàn)日期序列中...
1.引子 XGBoost在機(jī)器學(xué)習(xí)領(lǐng)域可謂風(fēng)光無限,作為從學(xué)術(shù)界來的模范生,幫助工業(yè)界解決了許多實(shí)際問題,真可謂: 模型鋒從學(xué)界出,算法香自公式來。 限于篇幅,本文就...
一. 概述 日常使用中,這三貨都是用來 指定一個開始數(shù)據(jù),指定一個結(jié)尾數(shù)據(jù),指定一個步長,然后返回該范圍內(nèi)可迭代數(shù)據(jù)的,但是他們之間還是有細(xì)微差別的。 二. 具體看看 1. ...
pandas的數(shù)據(jù)合并與重塑有很多種方法,包括直接復(fù)制列,concat,append,merge和join,本文將重點(diǎn)討論前面三種最簡單而又最常用的方法。merge和join...
一.目的 時間序列是數(shù)據(jù)的一種常見表示形式,對于處理時間序列來說,一個普遍的任務(wù)就是比較兩個序列的相似性。但是在實(shí)際問題中,大部分時間序列都是不等長的,有的序列可能波形類似,...
函數(shù)名:train_test_split所在包:sklearn.model_selection功能:劃分?jǐn)?shù)據(jù)的訓(xùn)練集與測試集參數(shù)解讀:train_test_split (*a...
一. 前言 1. LLE 局部線性嵌入(Locally Linear Embedding,以下簡稱LLE)是非常重要的降維方法。和傳統(tǒng)的PCA,LDA等關(guān)注樣本方差的降維方法...
一. 前言 在前文講述PCA降維算法時提到,PCA只能處理線性數(shù)據(jù)的降維,本質(zhì)上都是線性變換,并且它僅是篩選方差最大的特征,去除特征之間的線性相關(guān)性。對于線性不可分的數(shù)據(jù)常常...
一.前言 主成分分析(Principal components analysis,以下簡稱PCA)是最重要的降維方法之一。在數(shù)據(jù)壓縮消除冗余和數(shù)據(jù)噪音消除等領(lǐng)域都有廣泛的應(yīng)用...
一. 如何判斷過擬合與欠擬合 1. 根據(jù)訓(xùn)練集與驗(yàn)證集(測試集)的代價 d表示多項(xiàng)式的指數(shù),d越大,模型越復(fù)雜。 欠擬合:模型復(fù)雜度不高時,若發(fā)生欠擬合,此時訓(xùn)練集與驗(yàn)證集的...
一. 什么是激活函數(shù) 神經(jīng)網(wǎng)絡(luò)中,輸入神經(jīng)元線性組合后,傳入的非線性函數(shù)就是激活函數(shù)(大多是非線性的)。 二. 激活函數(shù)的主要功能 給神經(jīng)網(wǎng)絡(luò)引入非線性元素,使神經(jīng)網(wǎng)絡(luò)可以完...