首先,我們要知道這兩個(gè)方法都是用于數(shù)據(jù)降維。在多變量,大樣本的情況尤為適用。 那么,接下來我將以我理解的最簡單的話來介紹它們,在此說明,若想要嚴(yán)謹(jǐn),數(shù)學(xué)證明得大家自己去推。 ...
IP屬地:內(nèi)蒙古
首先,我們要知道這兩個(gè)方法都是用于數(shù)據(jù)降維。在多變量,大樣本的情況尤為適用。 那么,接下來我將以我理解的最簡單的話來介紹它們,在此說明,若想要嚴(yán)謹(jǐn),數(shù)學(xué)證明得大家自己去推。 ...
火山日常啰嗦學(xué)習(xí)了一些大數(shù)據(jù)的相關(guān)框架后,發(fā)現(xiàn)應(yīng)用層的東西確實(shí)不難,真正難的都是底層原理,所以我查看了很多資料,借鑒了前人的方法再加上自己的理解,寫下了這篇文章。 數(shù)據(jù)傾斜的...
在之前的文章中,提到如何爬取雪球網(wǎng)用戶的股票數(shù)據(jù),但是由于爬取過程中,會(huì)存在一些問題,比如由于網(wǎng)站設(shè)有反爬蟲機(jī)制,所以會(huì)導(dǎo)致在爬取過程中收到403的response,因此在爬...
updateStateByKey updateStateByKey操作,可以讓我們?yōu)槊總€(gè)key維護(hù)一份state,并持續(xù)不斷的更新該state。 首先,要定義一個(gè)state,...
前言 記錄一下在測試過程中,遇到的一個(gè)有關(guān)ThreadLocal的問題,順便學(xué)習(xí)一下ThreadLocal相關(guān)的知識(shí)。 ThreadLocal介紹 ThreadLocal是一...
最近組件化項(xiàng)目中使用SNAPSHOT倉庫作為開發(fā)的庫,各個(gè)工程師在上面發(fā)布組件的Aar,不同工程師之間可以通過maven依賴來添加組件,但在開發(fā)過程中遇到工程師用Sync P...