數(shù)據(jù)分析必須要有數(shù)據(jù),從明確分析目的和思路、到數(shù)據(jù)收集、再到數(shù)據(jù)處理、之后的數(shù)據(jù)分析都離不開數(shù)據(jù)。
在我們做數(shù)據(jù)收集時(shí):
首先要理解數(shù)據(jù);
其次要清楚數(shù)據(jù)的來源。
一、數(shù)據(jù)理解
對數(shù)據(jù)的理解,能夠幫助我們清晰地認(rèn)識到數(shù)據(jù)分析對數(shù)據(jù)有什么要求。
1.1、字段與記錄
數(shù)據(jù)由字段與記錄共同組合而成。從數(shù)據(jù)分析的角度來理解字段和記錄的概念:
?字段是事物或現(xiàn)象的某種特征。例如學(xué)生成績表中的姓名,學(xué)號,語文,數(shù)學(xué),英語等都是字段。在統(tǒng)計(jì)學(xué)中稱為變量。
?記錄是事物或現(xiàn)象某種特征的具體表現(xiàn)。例如學(xué)生成績表中的。比如學(xué)生成績表中姓名可以是張三或李四。記錄也稱為數(shù)據(jù)或變量值。
1.2、數(shù)據(jù)類型
數(shù)據(jù)類型分為:字符型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。常見的數(shù)據(jù)類型有:數(shù)值、文本、日期、貨幣、會(huì)計(jì)專用、時(shí)間、百分比、分?jǐn)?shù)、科學(xué)計(jì)數(shù)、特殊等
?字符型數(shù)據(jù)不具有計(jì)算能力的文字?jǐn)?shù)據(jù)類型。它包括中文字符,英文字符,數(shù)字字符(非數(shù)值型)等字符。
?數(shù)值型數(shù)據(jù)是直接使用自然數(shù)或度量單位進(jìn)行計(jì)量的數(shù)值數(shù)據(jù)。對于數(shù)值型數(shù)據(jù),可以直接用算術(shù)方法進(jìn)行匯總和分析。
1.3、數(shù)據(jù)表
數(shù)據(jù)表由字段、記錄和數(shù)據(jù)類型構(gòu)成。
數(shù)據(jù)表的設(shè)計(jì)是否合理,關(guān)系著后期數(shù)據(jù)分析的效率及深度。
數(shù)據(jù)表設(shè)計(jì)有如下6條要求:
1)、數(shù)據(jù)表由標(biāo)題行和數(shù)據(jù)部分組成
2)、第一行是表的列標(biāo)題(字段名),列標(biāo)題不能重復(fù)
3)、第二行起是數(shù)據(jù)部分,數(shù)據(jù)部分的每一行數(shù)據(jù)稱為一個(gè)記錄,并且數(shù)據(jù)部分不允許出現(xiàn)空白行和空白列
4)、數(shù)據(jù)表中不能有合并單元格存在
5)、數(shù)據(jù)表與其他數(shù)據(jù)之間應(yīng)該留出至少一個(gè)空白行和一個(gè)空白列
6)、數(shù)據(jù)表需要以一維的形式存儲(chǔ),但是在實(shí)際操作中接觸的數(shù)據(jù)往往是以二維表格的形式存在等,此時(shí)應(yīng)將二維表轉(zhuǎn)化為一維表的形式存儲(chǔ)數(shù)據(jù)。
什么是一維表,什么是二維表?
一維表的第一行列標(biāo)題都是字符型字段。
二維表的第一行列標(biāo)題包含是數(shù)值型字段。
如何將二維表轉(zhuǎn)化為一維表?
在使用Excel轉(zhuǎn)換過程中,我們要用到數(shù)據(jù)透視表中的“數(shù)據(jù)透視表和數(shù)據(jù)透視圖向?qū)А惫δ堋2僮鞑襟E如下

二、數(shù)據(jù)來源
獲取數(shù)據(jù)的方式可以分為兩種:導(dǎo)入外部數(shù)據(jù)和自己錄入數(shù)據(jù)。
2.1導(dǎo)入數(shù)據(jù)
導(dǎo)入的外部數(shù)據(jù)最常見的來源有兩種:文本和網(wǎng)站數(shù)據(jù)來源。
1)、文本數(shù)據(jù)是比較常見的數(shù)據(jù)來源,那么如何將文本文件導(dǎo)入Excel呢?
導(dǎo)入文本數(shù)據(jù)的具體操作:
數(shù)據(jù)→導(dǎo)入數(shù)據(jù)→選擇數(shù)據(jù)文件(下一步)→設(shè)置數(shù)據(jù)分隔(下一步)→下一步→完成
2)、自動(dòng)導(dǎo)入網(wǎng)站數(shù)據(jù),方法如上。
2.2問卷調(diào)查錄入
數(shù)值題:錄入相應(yīng)數(shù)值
單選題:錄入時(shí)采用1234分別代表ABCD四個(gè)選項(xiàng),錄入對應(yīng)數(shù)字即可。
多選題:方法如上類似
排序題:先用123456定義選項(xiàng)ABCDEF,然后按照順序錄入。
開放性文字題:首先歸類編碼換成多選題,如不能就對這類問題直接做定性分析。