目標(biāo)是預(yù)測(cè)未來(lái)三期傳統(tǒng)汽車的銷量。數(shù)據(jù)背景:03年到19年第一季度分季度的數(shù)據(jù),13年之前只有傳統(tǒng)汽車的銷量,13年之后是傳統(tǒng)汽車+新能源汽車的銷量,需要預(yù)測(cè)未來(lái)三期傳統(tǒng)汽車...
一、時(shí)間序列 時(shí)間序列(time series)是同一現(xiàn)象在不同時(shí)間上的相繼觀察值排列而成的序列。根據(jù)觀察時(shí)間的不同,時(shí)間序列中的時(shí)間可以是可以是年份、季度、月份或其他任何時(shí)...
題目數(shù)據(jù)背景:有A、B、C、D四個(gè)地區(qū),不同地區(qū)的銷售量不一樣,現(xiàn)抽取了不同時(shí)間段內(nèi)每個(gè)地區(qū)的銷售量,試解決: 1、每個(gè)地區(qū)間的銷售量是否相同? 2、不同月份的銷售量是否相同...
方差分析用于研究一個(gè)或多個(gè)分類型自變量與一個(gè)數(shù)值型因變量的關(guān)系。方差分析通過(guò)檢驗(yàn)多個(gè)總體的均值是否相等來(lái)判斷一個(gè)或多個(gè)分類型自變量對(duì)數(shù)值型因變量是否由顯著影響。一、基本概念1...
研究汽車銷量與生產(chǎn)總值、汽油價(jià)格相關(guān)性及預(yù)測(cè)模型建立 加載數(shù)據(jù)集并拆分訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集 數(shù)據(jù)集進(jìn)行處理并擬合 預(yù)測(cè)數(shù)據(jù)并評(píng)判
回歸分析是一種預(yù)測(cè)性的建模技術(shù),它研究的是因變量(目標(biāo))和自變量(預(yù)測(cè)器)之間的關(guān)系。這種技術(shù)通常用于預(yù)測(cè)分析,時(shí)間序列模型以及發(fā)現(xiàn)變量之間的因果關(guān)系。 相關(guān)分析主要研究變量...
數(shù)據(jù)選自Journal of the American Medical Association(http://jse.amstat.org/v4n2/datasets.sho...
本文主要描述概率分布的python實(shí)現(xiàn)方法,包括二項(xiàng)分布、伯努利分布、泊松分布、幾何分布、正態(tài)分布等。 一、二項(xiàng)分布步驟:1.定義隨機(jī)變量X2.計(jì)算概率3.繪制概率分布圖 二...
合理使用圖表描述統(tǒng)計(jì)結(jié)果是應(yīng)用統(tǒng)計(jì)的基本技能之一。本文利用思維導(dǎo)圖來(lái)介紹數(shù)據(jù)的預(yù)處理方法、品質(zhì)數(shù)據(jù)和數(shù)值型數(shù)據(jù)的整理與展示方式。 正確使用統(tǒng)計(jì)表和統(tǒng)計(jì)圖是做好統(tǒng)計(jì)分析的最基本...
①矩估計(jì)法。用樣本矩估計(jì)總體矩,從而得到總體分布中參數(shù)的一種估計(jì)。它的思想實(shí)質(zhì)是用樣本的經(jīng)驗(yàn)分布和樣本矩去替換總體的分布和總體矩。矩估計(jì)法的優(yōu)點(diǎn)是簡(jiǎn)單易行, 并不需要事先知道...
假設(shè)檢驗(yàn)是一種規(guī)則,它根據(jù)數(shù)據(jù)樣本所提供的證據(jù),指定是肯定還是否定有關(guān)總體的聲明。一、基本概念原假設(shè)、備擇假設(shè)、兩類錯(cuò)誤、顯著性水平、p值、單側(cè)檢驗(yàn)、雙側(cè)檢驗(yàn)假設(shè)檢驗(yàn)檢查有關(guān)...
本次選取泰坦尼克號(hào)的數(shù)據(jù),利用python進(jìn)行抽樣分布描述及實(shí)踐。備注:數(shù)據(jù)集的原始數(shù)據(jù)是泰坦尼克號(hào)的數(shù)據(jù),本次截取了其中的一部分?jǐn)?shù)據(jù)進(jìn)行學(xué)習(xí)。Age:年齡,指登船者的年齡。...
基本概念 樣本是進(jìn)行統(tǒng)計(jì)推斷的依據(jù)。但在實(shí)際應(yīng)用時(shí),一般不是直接使用樣本本身,而是對(duì)樣本進(jìn)行整理和加工,即針對(duì)具體問(wèn)題構(gòu)造適當(dāng)?shù)暮瘮?shù)--統(tǒng)計(jì)量,利用這些函數(shù)來(lái)進(jìn)行統(tǒng)計(jì)推斷,揭...
利用python來(lái)對(duì)數(shù)據(jù)分布進(jìn)行描述分析和假設(shè)檢驗(yàn) 數(shù)據(jù)選自Journal of the American Medical Association(http://jse.am...
一、基本概念 1. 隨機(jī)變量 隨機(jī)變量是試驗(yàn)結(jié)果的實(shí)值函數(shù)。舉例來(lái)說(shuō),擲一枚質(zhì)地均勻的骰子,可能出現(xiàn)的結(jié)果有1,2,3,4,5,6。那么可以定義隨機(jī)變量X=出現(xiàn)的點(diǎn)數(shù)?;蛘撸?..
pandas 是基于Numpy的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫(kù)和一些標(biāo)準(zhǔn)的模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。本文主要介紹...
利用BeautifulSoup爬取靜態(tài)html網(wǎng)站 例子:爬取quner網(wǎng)站信息 查看網(wǎng)頁(yè)源碼發(fā)現(xiàn),景點(diǎn)名稱西湖title位于第一個(gè)li的span class="cn_tit...
數(shù)據(jù)分析的對(duì)象主要是結(jié)構(gòu)化數(shù)據(jù),雖然數(shù)據(jù)的類型有很多,但是所有的結(jié)構(gòu)化數(shù)據(jù)都可以從三個(gè)維度進(jìn)行描述,這三個(gè)維度就是數(shù)據(jù)的集中趨勢(shì)描述,數(shù)據(jù)的離散程度描述和數(shù)據(jù)的分布形態(tài)描述。...