工欲善其事,必先利其器。說(shuō)起來(lái)道理大家都懂,只是到了要學(xué)習(xí)的時(shí)候就開(kāi)始各種退縮。殊不知一款好的數(shù)據(jù)分析工具可以讓你事半功倍,瞬間提高學(xué)習(xí)工作效率。
雖然數(shù)據(jù)分析的工具千萬(wàn)種,綜合起來(lái)萬(wàn)變不離其宗。無(wú)非是數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、數(shù)據(jù)計(jì)算、數(shù)據(jù)分析、數(shù)據(jù)展示等幾個(gè)方面。而SAS、R、SPSS、python、excel是被提到頻率最高的數(shù)據(jù)分析工具。那么,這些工具本身到底有什么特點(diǎn)呢?
Excel
Excel 是微軟辦公套裝軟件的一個(gè)重要的組成部分,它可以進(jìn)行各種數(shù)據(jù)的處理、統(tǒng)計(jì)分析和輔助決策操作,廣泛地應(yīng)用于管理、統(tǒng)計(jì)財(cái)經(jīng)、金融等眾多領(lǐng)域。
1、數(shù)據(jù)透視功能
一個(gè)數(shù)據(jù)透視表演變出10幾種報(bào)表,只需吹灰之力。一個(gè)新手,只要認(rèn)真使用向?qū)?-2小時(shí)就可以馬馬虎虎上路。
2、統(tǒng)計(jì)分析
其實(shí)包含在數(shù)據(jù)透視功能之中,但是非常獨(dú)特,常用的檢驗(yàn)方式一鍵搞定。
3、圖表功能
這幾乎是Excel的獨(dú)門(mén)武工,其他程序望其項(xiàng)背而自殺。
4、高級(jí)篩選
這是Excel提供的高級(jí)查詢(xún)功能,而操作之簡(jiǎn)單。非常超值享受。
5、自動(dòng)匯總功能
這個(gè)功能其他程序都有,但是Excel簡(jiǎn)便靈活。
6、高級(jí)數(shù)學(xué)計(jì)算
只要一兩個(gè)函數(shù)輕松搞定
SAS軟件
SAS是全球最大的軟件公司之一,是由美國(guó)NORTH CAROLINA州立大學(xué)1966年開(kāi)發(fā)的統(tǒng)計(jì)分析軟件。SAS把數(shù)據(jù)存取、管理、分析和展現(xiàn)有機(jī)地融為一體。
主要優(yōu)點(diǎn)如下:
1、功能強(qiáng)大,統(tǒng)計(jì)方法齊,全,新
SAS提供了從基本統(tǒng)計(jì)數(shù)的計(jì)算到各種試驗(yàn)設(shè)計(jì)的方差分析,相關(guān)回歸分析以及多變數(shù)分析的多種統(tǒng)計(jì)分析過(guò)程,幾乎囊括了所有最新分析方法,其分析技術(shù)先進(jìn),可靠。分析方法的實(shí)現(xiàn)通過(guò)過(guò)程調(diào)用完成。許多過(guò)程同時(shí)提供了多種算法和選項(xiàng)。
2、使用簡(jiǎn)便,操作靈活
SAS以一個(gè)通用的數(shù)據(jù)(DATA)步產(chǎn)生數(shù)據(jù)集,爾后以不同的過(guò)程調(diào)用完成各種數(shù)據(jù)分析。
其編程語(yǔ)句簡(jiǎn)潔,短小,通常只需很小的幾句語(yǔ)句即可完成一些復(fù)雜的運(yùn)算,得到滿(mǎn)意的結(jié)果。
結(jié)果輸出以簡(jiǎn)明的英文給出提示,統(tǒng)計(jì)術(shù)語(yǔ)規(guī)范易懂,具有初步英語(yǔ)和統(tǒng)計(jì)基礎(chǔ)即可。
使用者只要告訴SAS“做什么”,而不必告訴其“怎么做”。
同時(shí)SAS的設(shè)計(jì),使得任何SAS能夠“猜”出的東西用戶(hù)都不必告訴它(即無(wú)需設(shè)定),并且能自動(dòng)修正一些小的錯(cuò)誤(例如將DATA語(yǔ)句的DATA拼寫(xiě)成DATE,SAS將假設(shè)為DATA繼續(xù)運(yùn)行,僅在LOG中給出注釋說(shuō)明)。對(duì)運(yùn)行時(shí)的錯(cuò)誤它盡可能地給出錯(cuò)誤原因及改正方法。因而SAS將統(tǒng)計(jì)的科學(xué),嚴(yán)謹(jǐn)和準(zhǔn)確與便于使用者有機(jī)地結(jié)合起來(lái),極大地方便了使用者。
3、提供聯(lián)機(jī)幫助功能
使用過(guò)程中按下功能鍵F1,可隨時(shí)獲得幫助信息,得到簡(jiǎn)明的操作指導(dǎo)。
R軟件
R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。
主要優(yōu)點(diǎn)如下:
數(shù)據(jù)存儲(chǔ)和處理系統(tǒng)
數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大)
完整連貫的統(tǒng)計(jì)分析工具
優(yōu)秀的統(tǒng)計(jì)制圖功能
簡(jiǎn)便而強(qiáng)大的編程語(yǔ)言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶(hù)可自定義功能
與其說(shuō)R是一種統(tǒng)計(jì)軟件,還不如說(shuō)R是一種數(shù)學(xué)計(jì)算的環(huán)境,因?yàn)镽并不是僅僅提供若干統(tǒng)計(jì)程序、使用者只需指定數(shù)據(jù)庫(kù)和若干參數(shù)便可進(jìn)行一個(gè)統(tǒng)計(jì)分析。
R的思想是:它可以提供一些集成的統(tǒng)計(jì)工具,但更大量的是它提供各種數(shù)學(xué)計(jì)算、統(tǒng)計(jì)計(jì)算的函數(shù),從而使使用者能靈活機(jī)動(dòng)的進(jìn)行數(shù)據(jù)分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計(jì)計(jì)算方法。
該語(yǔ)言的語(yǔ)法表面上類(lèi)似 C,但在語(yǔ)義上是函數(shù)設(shè)計(jì)語(yǔ)言的(functional programming language)的變種并且和Lisp 以及APL有很強(qiáng)的兼容性。特別的是,它允許在“語(yǔ)言上計(jì)算”(computing on the language)。這使得它可以把表達(dá)式作為函數(shù)的輸入?yún)?shù),而這種做法對(duì)統(tǒng)計(jì)模擬和繪圖非常有用。
R是一個(gè)免費(fèi)的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費(fèi)下載和使用的。在R主頁(yè)那兒可以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個(gè)基礎(chǔ)模塊,其他外在模塊可以通過(guò)CRAN獲得。
SPSS
SPSS是世界上最早的統(tǒng)計(jì)分析軟件。
主要優(yōu)點(diǎn)如下:
操作簡(jiǎn)便:界面非常友好,除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤(pán)鍵入外,大多數(shù)操作可通過(guò)鼠標(biāo)拖曳、點(diǎn)擊“菜單”、“按鈕”和“對(duì)話(huà)框”來(lái)完成。
編程方便:具有第四代語(yǔ)言的特點(diǎn),告訴系統(tǒng)要做什么,無(wú)需告訴怎樣做。只要了解統(tǒng)計(jì)分析的原理,無(wú)需通曉統(tǒng)計(jì)方法的各種算法,即可得到需要的統(tǒng)計(jì)分析結(jié)果。對(duì)于常見(jiàn)的統(tǒng)計(jì)方法,SPSS的命令語(yǔ)句、子命令及選擇項(xiàng)的選擇絕大部分由“對(duì)話(huà)框”的操作完成。因此,用戶(hù)無(wú)需花大量時(shí)間記憶大量的命令、過(guò)程、選擇項(xiàng)。
功能強(qiáng)大:具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、報(bào)表、圖形制作等功能。自帶11種類(lèi)型136個(gè)函數(shù)。SPSS提供了從簡(jiǎn)單的統(tǒng)計(jì)描述到復(fù)雜的多因素統(tǒng)計(jì)分析方法,比如數(shù)據(jù)的探索性分析、統(tǒng)計(jì)描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗(yàn)、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類(lèi)分析、非線(xiàn)性回歸、Logistic回歸等。
數(shù)據(jù)接口:能夠讀取及輸出多種格式的文件。比如由dBASE、FoxBASE、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。能夠把SPSS的圖形轉(zhuǎn)換為7種圖形文件。結(jié)果可保存為*.txt及html格式的文件。
模塊組合:SPSS for Windows軟件分為若干功能模塊。用戶(hù)可以根據(jù)自己的分析需要和計(jì)算機(jī)的實(shí)際配置情況靈活選擇。
針對(duì)性強(qiáng):SPSS針對(duì)初學(xué)者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡(jiǎn)單的操作分析,大多青睞于SPSS。
Python
Python是一種面向?qū)ο?、解釋型?jì)算機(jī)程序設(shè)計(jì)語(yǔ)言。Python語(yǔ)法簡(jiǎn)潔而清晰,具有豐富和強(qiáng)大的類(lèi)庫(kù)。它常被昵稱(chēng)為膠水語(yǔ)言,能夠把用其他語(yǔ)言制作的各種模塊(尤其是C/C++)很輕松地聯(lián)結(jié)在一起。
常見(jiàn)的一種應(yīng)用情形是,使用Python快速生成程序的原型(有時(shí)甚至是程序的最終界面),然后對(duì)其中有特別要求的部分,用更合適的語(yǔ)言改寫(xiě),比如3D游戲中的圖形渲染模塊,性能要求特別高,就可以用C/C++重寫(xiě),而后封裝為Python可以調(diào)用的擴(kuò)展類(lèi)庫(kù)。需要注意的是在您使用擴(kuò)展類(lèi)庫(kù)時(shí)可能需要考慮平臺(tái)問(wèn)題,某些可能不提供跨平臺(tái)的實(shí)現(xiàn)。
主要優(yōu)點(diǎn)如下:
簡(jiǎn)單:Python是一種代表簡(jiǎn)單主義思想的語(yǔ)言。閱讀一個(gè)良好的Python程序就感覺(jué)像是在讀英語(yǔ)一樣。它使你能夠?qū)W⒂诮鉀Q問(wèn)題而不是去搞明白語(yǔ)言本身。
易學(xué):Python極其容易上手,因?yàn)镻ython有極其簡(jiǎn)單的說(shuō)明文檔 。
速度快:Python 的底層是用 C 語(yǔ)言寫(xiě)的,很多標(biāo)準(zhǔn)庫(kù)和第三方庫(kù)也都是用 C 寫(xiě)的,運(yùn)行速度非??臁?/p>
免費(fèi)、開(kāi)源:Python是FLOSS(自由/開(kāi)放源碼軟件)之一。使用者可以自由地發(fā)布這個(gè)軟件的拷貝、閱讀它的源代碼、對(duì)它做改動(dòng)、把它的一部分用于新的自由軟件中。FLOSS是基于一個(gè)團(tuán)體分享知識(shí)的概念。
高層語(yǔ)言:用Python語(yǔ)言編寫(xiě)程序的時(shí)候無(wú)需考慮諸如如何管理你的程序使用的內(nèi)存一類(lèi)的底層細(xì)節(jié)。
可移植性:由于它的開(kāi)源本質(zhì),Python已經(jīng)被移植在許多平臺(tái)上(經(jīng)過(guò)改動(dòng)使它能夠工作在不同平臺(tái)上)。
解釋性:一個(gè)用編譯性語(yǔ)言比如C或C++寫(xiě)的程序可以從源文件(即C或C++語(yǔ)言)轉(zhuǎn)換到一個(gè)你的計(jì)算機(jī)使用的語(yǔ)言(二進(jìn)制代碼,即0和1)。這個(gè)過(guò)程通過(guò)編譯器和不同的標(biāo)記、選項(xiàng)完成。運(yùn)行程序的時(shí)候,連接/轉(zhuǎn)載器軟件把你的程序從硬盤(pán)復(fù)制到內(nèi)存中并且運(yùn)行。而Python語(yǔ)言寫(xiě)的程序不需要編譯成二進(jìn)制代碼。你可以直接從源代碼運(yùn)行程序。
在計(jì)算機(jī)內(nèi)部,Python解釋器把源代碼轉(zhuǎn)換成稱(chēng)為字節(jié)碼的中間形式,然后再把它翻譯成計(jì)算機(jī)使用的機(jī)器語(yǔ)言并運(yùn)行。這使得使用Python更加簡(jiǎn)單。也使得Python程序更加易于移植。
面向?qū)ο螅?/b>Python既支持面向過(guò)程的編程也支持面向?qū)ο蟮木幊?。在“面向過(guò)程”的語(yǔ)言中,程序是由過(guò)程或僅僅是可重用代碼的函數(shù)構(gòu)建起來(lái)的。在“面向?qū)ο蟆钡恼Z(yǔ)言中,程序是由數(shù)據(jù)和功能組合而成的對(duì)象構(gòu)建起來(lái)的。
可擴(kuò)展性:如果需要一段關(guān)鍵代碼運(yùn)行得更快或者希望某些算法不公開(kāi),可以部分程序用C或C++編寫(xiě),然后在Python程序中使用它們。
可嵌入性:可以把Python嵌入C/C++程序,從而向程序用戶(hù)提供腳本功能。
豐富的庫(kù):Python標(biāo)準(zhǔn)庫(kù)確實(shí)很龐大。它可以幫助處理各種工作,包括正則表達(dá)式、文檔生成、單元測(cè)試、線(xiàn)程、數(shù)據(jù)庫(kù)、網(wǎng)頁(yè)瀏覽器、CGI、FTP、電子郵件、XML、XML-RPC、HTML、WAV文件、密碼系統(tǒng)、GUI(圖形用戶(hù)界面)、Tk和其他與系統(tǒng)有關(guān)的操作。這被稱(chēng)作Python的“功能齊全”理念。除了標(biāo)準(zhǔn)庫(kù)以外,還有許多其他高質(zhì)量的庫(kù),如wxPython、Twisted和Python圖像庫(kù)等等。
規(guī)范的代碼:Python采用強(qiáng)制縮進(jìn)的方式使得代碼具有較好可讀性。而Python語(yǔ)言寫(xiě)的程序不需要編譯成二進(jìn)制代碼。
工具不是萬(wàn)能的,業(yè)務(wù)和數(shù)據(jù)建模方法才是萬(wàn)法之源。不要被工具迷花了眼哦!
本文素材來(lái)源于:大數(shù)據(jù)分析和人工智能,如有侵權(quán)請(qǐng)聯(lián)系刪除