數(shù)據(jù)會說話

作為無時無刻不在和數(shù)據(jù)打交道的稅務(wù)人員,數(shù)據(jù)可以帶給我們很多信息。我們可以通過分析申報表尋找納稅人可能存在的涉稅問題,可以通過數(shù)據(jù)對納稅人的稅負(fù)進行分析。隨著信息爆炸時代的到來,如何在稅收現(xiàn)代化中運用好大數(shù)據(jù),成為我們新的挑戰(zhàn)。

一、稅收大數(shù)據(jù)特征

1、數(shù)據(jù)量的變化。

近年來,稅務(wù)信息化系統(tǒng)數(shù)據(jù)呈爆炸性增長,僅廣東地稅的信息化數(shù)據(jù)總量已達(dá)到53個太字節(jié),相當(dāng)于5萬多G的數(shù)據(jù)量。

2、數(shù)據(jù)類型的變化。

數(shù)據(jù)呈現(xiàn)異構(gòu)特點和多樣性,既有結(jié)構(gòu)化數(shù)據(jù)(如發(fā)票明細(xì)數(shù)據(jù)等),又有半結(jié)構(gòu)化數(shù)據(jù)(如網(wǎng)上申報數(shù)據(jù)等)和非結(jié)構(gòu)化數(shù)據(jù)(如文本、影像等)。

并且隨著信息技術(shù)的發(fā)展,越來越多的申報數(shù)據(jù)、圖像信息涌現(xiàn),“半結(jié)構(gòu)化數(shù)據(jù)”、“非結(jié)構(gòu)數(shù)據(jù)”呈幾何速度增長,2010年“結(jié)構(gòu)化數(shù)據(jù)”占比75%,而到了2016年,這一數(shù)字就倒過來了,“半結(jié)構(gòu)化數(shù)據(jù)”、“非結(jié)構(gòu)數(shù)據(jù)”達(dá)到了75%。

? ? 數(shù)據(jù)量如此之多,而且都是不易處理的非結(jié)構(gòu)數(shù)據(jù),要想分析利用這些數(shù)據(jù),在之前幾乎是無解之題。云計算的出現(xiàn),卻使之成為可能。以云計算為基礎(chǔ)的信息存儲、分享和挖掘手段,可以將這些大量、高速、多變化的終端數(shù)據(jù)存儲下來,并隨時進行分析與計算。通過云計算對大數(shù)據(jù)進行分析、預(yù)測,可以挖掘出數(shù)據(jù)的隱藏價值。

但僅有大數(shù)據(jù)和云計算還不夠,這些工具終究需要我們稅務(wù)人員去運用,那么如何轉(zhuǎn)變化思維就變得尤為重要。

二、轉(zhuǎn)變思維,擁抱大數(shù)據(jù)

1、更多——不是隨機樣本,而是全體數(shù)據(jù)

很長一段時間以來,因為記錄、存儲和分析數(shù)據(jù)的工具都不夠好,為了讓分析變得簡單,我們嘗試縮減數(shù)據(jù)量,采用樣本分析,以小見大,得到想要問題的答案。雖然樣本分析可以在技術(shù)落后的情況下比較快速、比較準(zhǔn)確的解決問題,但由于樣本分析存在隨機性很難實現(xiàn)、無法細(xì)分類、不能回答事先未設(shè)定的問題等缺陷,讓我們放棄這種看似高效的分析方法,轉(zhuǎn)而投向運用全體數(shù)據(jù)的方法。在這里,大數(shù)據(jù)中的“大”,并不是絕對意義上的大,而是要采用所有數(shù)據(jù)。與樣本分析相比,使用全體數(shù)據(jù)可以讓我們看到樣本無法提示的細(xì)節(jié)信息。

比如在為納稅人提供個性化服務(wù)時,運用全體數(shù)據(jù)可以讓我們做到以納稅人需求為導(dǎo)向,通過強大的稅務(wù)云,實現(xiàn)線上線下的互動,為納稅人提供更多的量身訂制的服務(wù),以達(dá)到"個性化需求個性化滿足”。

2、更雜——不是精確性,而是混雜性

大數(shù)據(jù)的允許不精確包含三個方面:一是由于數(shù)據(jù)量非常大,有個別錯誤可以忽略不計,對于結(jié)果沒有影響。

二是大數(shù)據(jù)的測量結(jié)果一定有不準(zhǔn)確的地方,但運用大數(shù)據(jù)分析可以看到其他技術(shù)手段無法看到的問題,這點不準(zhǔn)確可以容忍。

三是如果不接受不精確,95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用。比如在調(diào)查納稅人虛開發(fā)票時,現(xiàn)在多為團伙做案,做案趨向?qū)I(yè)化,敏感度很高,一有風(fēng)吹草動,便會立刻逃走。這就需要我們對得到的信息迅速處理,這時再追求精確性已經(jīng)不可能,雖然樣本分析可以做到準(zhǔn)確,但這時候的滯后是不能容忍的。

3、更好——不是因果關(guān)系,而是相關(guān)關(guān)系

建立在相關(guān)關(guān)系分析基礎(chǔ)上的預(yù)測是大數(shù)據(jù)的核心。

2011年,美國聯(lián)邦稅務(wù)局局長道格拉斯?舒爾曼先生在美國全國媒體俱樂部做演講時講到一個愿景:如果聯(lián)邦稅務(wù)局能夠不懈努力,改變主要依靠事后評查的運作模式,那么納稅人、稅務(wù)部門的第三方和其他政府部門能夠得到更優(yōu)質(zhì)的服務(wù)。他提到的改變就是將風(fēng)險管理從事后變?yōu)槭虑?。對稅?wù)局來說就是把對過去的分析變?yōu)閷ξ磥淼念A(yù)測。

大數(shù)據(jù)可以賦予我們洞察未來的能力。例如:阿里巴巴通過數(shù)據(jù)分析預(yù)測到2008年的經(jīng)濟危機??梢韵胂?,這樣的方法用于稅務(wù)風(fēng)險管理的情景:大量的包括各類傳感器、互聯(lián)網(wǎng)、企業(yè)賬戶變動等等源自第三方的信息匯集到稅務(wù)局;稅務(wù)局對這些大量數(shù)據(jù)進行風(fēng)險預(yù)測、提前預(yù)警,應(yīng)對和解決可能的稅收遵從問題,將大部分涉稅問題解決在事前,提高納稅人的稅收遵從水平,改善稅務(wù)局對納稅人的服務(wù)水平。這對于納稅人和政府來說,必將是一個雙贏的局面。

三、如何運用大數(shù)據(jù)

1、要盡可能擴大數(shù)據(jù)量

微軟曾經(jīng)做過對算法的實驗,當(dāng)數(shù)據(jù)量少的時候復(fù)雜算法優(yōu)于簡單算法,而當(dāng)數(shù)據(jù)量大到一定程度時,所有算法的準(zhǔn)確率都大幅提高,尤其是最簡單的算法準(zhǔn)確率從75%提高到了95%,成為準(zhǔn)確率最高的算法。這就是數(shù)據(jù)分析界古老的“拇指法則”,數(shù)據(jù)分析工作至少有70%~80% 的工作量花在搜集和準(zhǔn)備數(shù)據(jù)上,僅有20%~30%的工作量花在分析本身上。因此要花大力氣加強基礎(chǔ)信息資源庫建設(shè),全面搜集并整合納稅人基礎(chǔ)信息、財務(wù)核算數(shù)據(jù)、生產(chǎn)經(jīng)營數(shù)據(jù)、納稅申報數(shù)據(jù)等,使得可供分析的數(shù)據(jù)足夠多,這樣我們才能得到想要的結(jié)果。

2、要實現(xiàn)信息共享

過去,不同政府部門擁有自己的信息系統(tǒng),但很多數(shù)據(jù)相互隔離,形成了一個個信息孤島,大數(shù)據(jù)的一大應(yīng)用就是要實現(xiàn)數(shù)據(jù)信息共享,最大限度地發(fā)揮數(shù)據(jù)的功效,為經(jīng)濟社會發(fā)展服務(wù)。

廣東地稅借助大數(shù)據(jù)平臺,積極推進第三方涉稅信息共享,明確28個部門交換共享涉稅信息的內(nèi)容和方式,涉稅信息的跨部門共享,突破了以往的單兵經(jīng)驗管理模式。目前,工商稅務(wù)信息每天都進行實時交換,推動了地稅機關(guān)在辦證服務(wù)上的大創(chuàng)新,從原來的限時辦證發(fā)展到現(xiàn)在的即時辦證,從原來填寫多達(dá)100多項登記信息,升級到填寫8項必要信息內(nèi)容,甚至可以享受免填服務(wù)。

3、要培養(yǎng)高素質(zhì)人才

大數(shù)據(jù)時代對人才特別是高端人才的需求十分迫切。大數(shù)據(jù)時代的稅收管理人才,應(yīng)具備在數(shù)據(jù)的海洋中探索發(fā)現(xiàn)的能力。他們需要把大量散亂的涉稅數(shù)據(jù)變成結(jié)構(gòu)化、可供分析的數(shù)據(jù),整合各種數(shù)據(jù)源并清理成結(jié)果數(shù)據(jù)集,揭示蘊含在數(shù)據(jù)中的稅收經(jīng)濟規(guī)律和涉稅疑點問題。

大數(shù)據(jù)可以幫助稅務(wù)人員發(fā)現(xiàn)很多問題,但并非一個放之四海皆準(zhǔn)的萬能工具。大數(shù)據(jù)在給我們的工作帶來很多便利的同時,也會帶來很多問題,比如信息共享帶來的信息安全問題等。人類學(xué)家克利福德—吉爾茲在《文化的解釋》中說過:“努力在可以應(yīng)用、可以拓展的地方,應(yīng)用它、拓展它;在不能應(yīng)用、不能拓展的地方,就停下來?!边@是我們對待所有新事物應(yīng)有的態(tài)度。

在大數(shù)據(jù)運用的路上我們只是邁出了第一步,以后還有很多任務(wù)需要我們?nèi)ヌ剿?,我們還需要不斷的實踐與思考,才能真正將大數(shù)據(jù)運用到稅收現(xiàn)代化上。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容