第三講 原始數(shù)據(jù)收集(描述統(tǒng)計(jì)分析)

一,調(diào)查方式


A,隨機(jī)抽樣調(diào)查

概念:一種非全面調(diào)查。在全部被調(diào)查的總體中隨機(jī)地抽選(樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個(gè)總體單位都有均等的被抽中的機(jī)會(huì))一部分單位進(jìn)行觀察,并根據(jù)樣本數(shù)據(jù)來推斷總體的數(shù)量特征。

注意:如果抽樣調(diào)查不遵守隨機(jī)原則選樣,從樣本推斷總體特征的調(diào)查目的就不可能達(dá)到。因此,如何保證抽樣的隨機(jī)性是進(jìn)行抽樣調(diào)查的第一要?jiǎng)?wù)。

條件:以概率理論為基礎(chǔ)的抽樣推斷,不僅可以估計(jì)出抽樣推斷誤差的大小,而且可以通過一定方法控制這些誤差。

隨機(jī)抽樣調(diào)查的適用范圍:

1,無法進(jìn)行全面調(diào)查的現(xiàn)象。例如:一些具有破壞性的產(chǎn)品質(zhì)量檢查。

2,由于工作量和工作難度太大,難于進(jìn)行全面調(diào)查,而又必須取得總體數(shù)據(jù)的現(xiàn)象。例如:對(duì)我國(guó)每一戶居民家庭收支情況的了解。

3,對(duì)普查資料做修正和補(bǔ)充。

優(yōu)點(diǎn):省時(shí)省力,降低成本,可靠有效(可以用科學(xué)方法控制誤差)。

a,簡(jiǎn)單抽樣(時(shí)點(diǎn))

前提:事先就知道總體數(shù)量。

概念:最基本的抽樣方式。按照總體原有的狀況依次編號(hào)后,不加任何限制地抽取樣本。如抽簽、摸球、搖色子、excel的隨機(jī)函數(shù)=int(rand()*x+1),x表示總體個(gè)數(shù)。

抽樣誤差:樣本單位差異越小,抽出的樣本代表性就越高,抽樣誤差也就越低。

缺點(diǎn):當(dāng)總體很大或無限大時(shí),編號(hào)工作量很大,甚至是不可能的。

b,等距抽樣(時(shí)點(diǎn)、時(shí)段)

辦法1前提:事先能把握總體數(shù)量。

辦法2前提:事先就知道總體狀況。

首先將總體單位進(jìn)行排序。

辦法1:按照與抽樣調(diào)查內(nèi)容無關(guān)的標(biāo)志排序,如調(diào)查人口的收入時(shí),按姓氏筆畫排序。

辦法2:按照與抽樣調(diào)查內(nèi)容有關(guān)的標(biāo)志排序。如調(diào)查人口的收入時(shí),按收入多少排序。

抽樣誤差:排序標(biāo)志與調(diào)查內(nèi)容的關(guān)系越密切,順序越一致,抽樣誤差就越小。

忌用:當(dāng)總體的排序呈現(xiàn)出某種周期性時(shí),特別是周期性節(jié)奏與抽樣間隔一致時(shí),會(huì)引起系統(tǒng)性誤差,從而影響樣本的代表性。

依次編號(hào)后,抽取第一個(gè)樣本單位。

辦法1:在規(guī)定的間隔之內(nèi),用簡(jiǎn)單抽樣的辦法抽取第一個(gè)樣本單位。(間隔內(nèi)的樣本單位差異越小,抽出的樣本代表性就越高,抽樣誤差也就越低)

辦法2:在規(guī)定的間隔之內(nèi),抽取處于正中間位置上的樣本單位(代表第一段的中間水平,最具代表性,從而可以得到較有代表性的樣本)。

再從第一個(gè)樣本單位開始按規(guī)定的間隔抽取其他樣本單位。

優(yōu)點(diǎn):比簡(jiǎn)單隨機(jī)抽樣更簡(jiǎn)便,更節(jié)省費(fèi)用,選取的樣本代表性也越高。

c,類型抽樣(時(shí)點(diǎn)、時(shí)段)

辦法1前提:事前能把握總體數(shù)量。

辦法2前提:事先就知道各群組占總體的比例,以及各群組內(nèi)的狀況。

選擇分組標(biāo)志:

每一個(gè)分組標(biāo)志都代表著調(diào)查目的在某一方面的反應(yīng)情況,只有選擇最恰當(dāng)?shù)姆纸M標(biāo)志才能使分組的結(jié)果正確反應(yīng)現(xiàn)象的本質(zhì)。

復(fù)合分組:按兩個(gè)或兩個(gè)以上的標(biāo)志層疊分組。優(yōu)點(diǎn)是有利于分析得全面深入具體,缺點(diǎn)是組數(shù)太多不僅增大工作量而且容易沖淡主要的調(diào)查目的,因此要先按主要標(biāo)志分組,再輔以次要標(biāo)志。

確定分組組別:

把總體在同一個(gè)標(biāo)志下按特征的不同分為各個(gè)組(前提:知道特征的范圍,有的可以參考國(guó)家的統(tǒng)計(jì)分組體系),組之間要具有互斥性(任何一個(gè)總體單位都只能適合一個(gè)群組)、完備性(任何一個(gè)總體單位都在某一個(gè)組中)、相似性(組之間具有可比性)。如:農(nóng)產(chǎn)品調(diào)查時(shí),按地形分為山地、丘陵、平原,人口調(diào)查時(shí),按年齡分為1~18(少年)、19~30(青年)、31~50(中年)、51~100(老年)。

抽樣誤差:抽樣選擇的分組標(biāo)志與調(diào)查目的關(guān)系越密切,定性定量越細(xì),每組內(nèi)的差別就越小,從中選取樣本單位就越具有代表性,抽樣誤差就越小。

確定各組中應(yīng)抽取的樣本數(shù)目:

方法1:根據(jù)各種組內(nèi)部變異程度大小,變異程度越大,抽取樣本單位數(shù)目越多,變異程度越小,抽取樣本單位數(shù)目越少。(時(shí)段)

方法2:按該組單位數(shù)目占總體單位數(shù)目的比例大小抽取同樣比例的樣本單位數(shù)目,即類型比例抽樣;(時(shí)點(diǎn))

將組單位進(jìn)行排序。

辦法1:按照與抽樣調(diào)查目的無關(guān)的標(biāo)志排序,如調(diào)查人口的收入時(shí),按姓氏筆畫排序。

辦法2:按照與抽樣調(diào)查目的有關(guān)的標(biāo)志排序。如調(diào)查人口的收入時(shí),按收入多少排序。

抽樣誤差:排序標(biāo)志與調(diào)查目的的關(guān)系越密切,順序越一致,抽樣誤差就越小。

各組內(nèi)依次編號(hào)后,抽取第一個(gè)樣本單位。

辦法1:在規(guī)定的間隔之內(nèi),用簡(jiǎn)單抽樣的辦法抽取第一個(gè)樣本單位。(間隔內(nèi)的樣本單位差異越小,抽出的樣本代表性就越高,抽樣誤差也就越低)

辦法2:在規(guī)定的間隔之內(nèi),抽取處于正中間位置上的樣本單位(代表第一段的中間水平,最具代表性,從而可以得到較有代表性的樣本)。

再從第一個(gè)樣本單位開始按規(guī)定的間隔抽取其他樣本單位。

優(yōu)點(diǎn):由于從每一類中都要抽選樣本單位,就又保證樣本中各個(gè)類型都包括到了,因此類型抽樣會(huì)使樣本的代表性大大提高。

d,整群抽樣(時(shí)點(diǎn))

前提:事先就知道總體數(shù)量。

概念:先將總體分為許多屬性特征相同的群組,依次編號(hào)后,從中隨機(jī)的抽取若干群組作為樣本。

抽樣誤差:群組之間屬性的相似度越高,總體單位分布越均勻,樣本的代表性就越高,抽樣誤差就越小。

優(yōu)點(diǎn):當(dāng)總體數(shù)目很多,各單位在時(shí)空上分布又很分散時(shí),用此方法可以節(jié)省人力物力,降低成本。

缺點(diǎn):抽出的樣本往往不夠均勻,代表性比較低。慎用。


B,非隨機(jī)抽樣調(diào)查

概念:一種非全面調(diào)查。不按照概率均等的原則,而是根據(jù)人的主觀判斷或其他條件來抽取樣本。

隨機(jī)抽樣調(diào)查的適用范圍:

1,有些情況下,嚴(yán)格的隨機(jī)抽樣幾乎無法進(jìn)行,如調(diào)查對(duì)象的總體邊界不清楚而無法制作抽樣框。

2,有些研究為了符合研究的目的,不得不按照需要從總體中抽取少數(shù)有代表性的個(gè)體作為樣本。

3,隨機(jī)抽樣的操作過程要求嚴(yán)格,實(shí)施起來比較麻煩,費(fèi)時(shí)費(fèi)力,因此如果調(diào)查的目的僅是對(duì)問題的初步探索,獲得研究的線索和提出假設(shè),而不是由樣本推論總體,就不一定需要采用隨機(jī)抽樣。

優(yōu)點(diǎn):非隨機(jī)抽樣操作時(shí)省時(shí)省力,如果研究者對(duì)調(diào)查總體和調(diào)查對(duì)象有較好的了解,也可獲得較準(zhǔn)確的結(jié)果。

缺點(diǎn):因?yàn)槭侵饔^決策,所以不能保證樣本是否重現(xiàn)了總體的分布結(jié)構(gòu),樣本代表性較小,誤差很大且無法估計(jì),用這樣的樣本推論總體極不可靠。

ba,典型調(diào)查

在被調(diào)查的總體中,有意挑選出個(gè)別或少數(shù)具有代表性的單位進(jìn)行調(diào)查。

挑選典型的方法:分類選點(diǎn)。

bb,重點(diǎn)調(diào)查

在被調(diào)查的總體中,選出一部分重點(diǎn)單位進(jìn)行調(diào)查,重點(diǎn)單位雖然只是總體中的一小部分,但它們在所調(diào)查的數(shù)量標(biāo)志方面占有很大比重。

優(yōu)點(diǎn):省時(shí)省力,降低成本,而且樣本代表性高,從而推斷總體比較可靠。

bc,就近抽樣

以自己方便的形式在總體中抽取偶然遇到的單位作為樣本。

bd,目標(biāo)式和判斷式抽樣

根據(jù)主觀判斷選取代表性高的單位作為樣本。

抽樣誤差:研究者對(duì)總體越了解,抽樣誤差越小。

be,滾雪球抽樣

當(dāng)我們無法了解總體情況時(shí),可以先從總體中的少數(shù)單位開始收集樣本,通過轉(zhuǎn)介紹或其他方式找到越來越多的樣本單位。

優(yōu)點(diǎn):研究少數(shù)群體時(shí)適用。

bf,配額抽樣

前提:事先就知道總體數(shù)量,及各群組占總體的比例。

確定樣本的數(shù)量,根據(jù)總體中各類別數(shù)量所占的比例確定樣本中各類別數(shù)量所占的比例(用樣本模擬出一個(gè)總體),最后按比例進(jìn)行取樣。


C,定期統(tǒng)計(jì)報(bào)表

概念:自上而下地布置統(tǒng)一的報(bào)表,然后自下而上的逐級(jí)上報(bào)匯總報(bào)表資料的調(diào)查方式。

優(yōu)點(diǎn):1資料的全面性和連續(xù)性;2資料的統(tǒng)一性和及時(shí)性;3資料的來源和準(zhǔn)確性比較可靠。

缺點(diǎn):1資料受利益影響會(huì)參雜虛假數(shù)據(jù);2報(bào)表過多會(huì)增加基層的負(fù)擔(dān),甚至?xí)鸹靵y。

報(bào)告周期越短,內(nèi)容越簡(jiǎn)明,報(bào)送時(shí)間越緊;

報(bào)告周期越長(zhǎng),內(nèi)容越詳盡,報(bào)送時(shí)間越寬松。


D,普查

概念:專門組織的一次性全面調(diào)查。

調(diào)查的內(nèi)容可以是一定時(shí)點(diǎn)下的現(xiàn)象(如人口狀況、固定資產(chǎn)的存量等),也可以是一定時(shí)期的過程性現(xiàn)象(如一年的生產(chǎn)量、銷售量)。

調(diào)查的目的主要是收集一些不能夠或不適合定期統(tǒng)計(jì)報(bào)表的數(shù)據(jù)資料,以搞清重要的公司總體情況和某些重要的經(jīng)濟(jì)現(xiàn)象的全面情況。

優(yōu)點(diǎn):資料最全面、最系統(tǒng)、最詳盡。

缺點(diǎn):花費(fèi)較多人力、物力、財(cái)力和時(shí)間(調(diào)查登記的時(shí)間雖不長(zhǎng),但復(fù)雜細(xì)微的準(zhǔn)備工作和數(shù)量巨大的數(shù)據(jù)處理工作卻需要很長(zhǎng)時(shí)間),容易產(chǎn)生登記誤差。



二,調(diào)查方案


調(diào)查目的:

搞清楚調(diào)查要解決什么問題,有了目的才知道應(yīng)該收集什么樣的資料。

調(diào)查對(duì)象:

被調(diào)查的或被推斷的總體??傮w中的個(gè)體叫調(diào)查單位(全部或部分)。

報(bào)告單位:

負(fù)責(zé)提交調(diào)查資料的單位。

調(diào)查內(nèi)容:

1內(nèi)容應(yīng)當(dāng)是滿足調(diào)查目的所必需的,可有可無或者備而不用的內(nèi)容不必列入。

2內(nèi)容應(yīng)當(dāng)只包括能得到確切答案的標(biāo)志。

3內(nèi)容的提法要確切具體,不可模棱兩可,使填報(bào)人能有一致的理解。

問卷調(diào)查法:(略)

調(diào)查表:

1,表頭:包括調(diào)查表名稱(中間),報(bào)告單位的名稱、地址、隸屬關(guān)系(左上角),表號(hào)、制表單位、批準(zhǔn)備案文號(hào)(右上角)。

2,表體:調(diào)查表的主體,表現(xiàn)為表格形式,調(diào)查內(nèi)容列于表格內(nèi)。

3,表腳:包括調(diào)查人員或填報(bào)人員的姓名、簽章,及單位負(fù)責(zé)人的姓名、簽章。

調(diào)查表的形式包括一覽表、單一表和特殊表。

1,在研究樣本的時(shí)候用一覽表。

2,在調(diào)查樣本單位的時(shí)候用單一表。

3,對(duì)于不同的調(diào)查標(biāo)志,就需要用到特殊表。

調(diào)查時(shí)間:

調(diào)查資料所屬的時(shí)間,分為時(shí)段和時(shí)點(diǎn)。

調(diào)查方式

調(diào)查期限:

提交調(diào)查報(bào)告的時(shí)間,目的是為了及時(shí)取得資料。

調(diào)查地點(diǎn):

如果樣本單位處于流動(dòng)狀態(tài)或分布在不同位置,就應(yīng)該明確地作出規(guī)定和注明。

調(diào)查的組織實(shí)施計(jì)劃:

包括確定調(diào)查活動(dòng)的組織機(jī)構(gòu)、人員培訓(xùn)安排、文件準(zhǔn)備、經(jīng)費(fèi)預(yù)算、調(diào)查方式方法、資料報(bào)送方法、是否要進(jìn)行試差等問題。

調(diào)查數(shù)據(jù)的錄入:

任何捏造、改動(dòng)數(shù)據(jù)的做法都是有悖于統(tǒng)計(jì)學(xué)精神和思想的嚴(yán)重錯(cuò)誤行為,對(duì)于錯(cuò)誤的信息在錄入時(shí)要堅(jiān)決舍棄。



三,原始數(shù)據(jù)(一手?jǐn)?shù)據(jù)):


概念:通過直接來源得到的數(shù)據(jù)。如,觀察、試驗(yàn)、問卷調(diào)查等。



四,次級(jí)數(shù)據(jù)(二手?jǐn)?shù)據(jù))的收集:


概念:通過間接來源得到的數(shù)據(jù)。

如:各類出版物,已發(fā)表的匯編資料,網(wǎng)上資料等。

引用時(shí)需要注明來源出處,一是尊重別人的勞動(dòng)成果,二是證實(shí)其可靠性。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容