英國衛(wèi)生部因儲(chǔ)存上限漏記1.6萬例新冠病人?Excel數(shù)據(jù)丟失的大坑如何避免!

據(jù)英國《衛(wèi)報(bào)》報(bào)道,英國公共衛(wèi)生部10月5日承認(rèn),由于“技術(shù)故障”,他們?cè)诮y(tǒng)計(jì)中遺漏了9月25日以來的接近1.6萬例新冠肺炎確診病例。

而導(dǎo)致這一事故的原因卻讓人大跌眼鏡,居然是由于衛(wèi)生部門在使用Excel表格統(tǒng)計(jì)病例數(shù)據(jù)時(shí),數(shù)據(jù)量超出了Excel的行數(shù)上限所導(dǎo)致的(1,048,576行)。這意味著隨著檢測(cè)數(shù)量超過100萬,衛(wèi)生部門的數(shù)據(jù)遲早會(huì)出問題。


Excel作為一款數(shù)據(jù)處理工具,有著直觀的操作界面、出色的計(jì)算功能以及便捷的圖表工具,是我們?cè)谌粘9ぷ髋c生活中使用頻率最高的軟件之一。

但就像英國衛(wèi)生部的這次槽點(diǎn)滿滿的失誤一樣,Excel在使用過程中也存在著很多容易造成數(shù)據(jù)丟失的大坑,如果一不小心掉進(jìn)去,輕則重做,重則...參加英國衛(wèi)生部...

因此,在今天借著這個(gè)事件,我想跟大家聊一聊Excel常見的坑都有哪些,以及如何避免。

1. 儲(chǔ)存數(shù)據(jù)量的限制

這次的統(tǒng)計(jì)遺漏事件為廣大吃瓜群眾普及了Excel數(shù)據(jù)儲(chǔ)存的最大行數(shù)限制。但需要注意的是不同版本的Excel儲(chǔ)存數(shù)據(jù)限制也是不同的。

97-2003版本的Excel行數(shù)上限僅為65,536(2的16次方),列數(shù)上限為256(2的8次方)

2007以上版本的Excel行數(shù)上限升級(jí)為1,048,576(2的20次方),列數(shù)上限為16,384(2的14次方)

幸虧英國用的Excel版本還不算太老,否則到今天他們的確診人數(shù)最多只會(huì)到6萬人了...

因此大家在用Excel進(jìn)行數(shù)據(jù)處理時(shí),一定要注意儲(chǔ)存數(shù)據(jù)量不要超過儲(chǔ)存的上限。一旦數(shù)據(jù)超限就直接說再見了,而且沒有找回的可能。

如果必須處理百萬級(jí)的數(shù)據(jù),還請(qǐng)大家轉(zhuǎn)投SQL、Access這些數(shù)據(jù)庫軟件的懷抱。(PS:十萬量級(jí)以上的數(shù)據(jù)就可以考慮數(shù)據(jù)庫了,Excel在除了10萬以上的數(shù)據(jù)時(shí)就會(huì)瘋狂吃內(nèi)存,運(yùn)行一個(gè)函數(shù)可能需要幾分鐘。因此不建議在有較大數(shù)據(jù)量級(jí)需要處理的情況下使用Excel)

同時(shí)必須提醒大家的是,在日常工作中Excel數(shù)據(jù)超限丟失的原因可不只是超過104萬行,更多時(shí)候7、8萬行的數(shù)據(jù)也會(huì)因超限丟失。

這是因?yàn)楹芏嗳嗽诒4姹砀駮r(shí)并不會(huì)注意Excel的儲(chǔ)存形式,有可能在對(duì)方發(fā)來的【.xls】(03及以前版本的格式)文件基礎(chǔ)上編輯后,直接進(jìn)行了保存,導(dǎo)致數(shù)據(jù)儲(chǔ)存上限直接縮水為65536行。

因此,如果你的需要處理的數(shù)據(jù)量大于6萬條,請(qǐng)務(wù)必注意保存的Excel文件格式是是【.xlsx】(07及以上版本的格式)。

2. 萬惡的csv格式

接著剛剛數(shù)據(jù)丟失的問題,讓我們?cè)賮砜匆幌铝硪粋€(gè)可能導(dǎo)致數(shù)據(jù)丟失的常見原因:萬惡的csv格式。

作為被【csv】格式坑過多次的人,我必須要在這篇文章中為大家敲響一個(gè)警鐘!

相對(duì)于xlsx格式,CSV(逗號(hào)分隔值,Comma-Separated Values)文件以純文本形式存儲(chǔ)表格數(shù)據(jù),更適合適應(yīng)計(jì)算機(jī)批量處理的要求。因此,很多從網(wǎng)上以及公司內(nèi)部數(shù)據(jù)平臺(tái)下載的文件都會(huì)默認(rèn)為是csv格式,下載后的文件也可以被Excel直接打開和處理,在處理過程中和一般的【.xlsx】文件沒有什么不同。

但是,由于csv是以純文本形式儲(chǔ)存的,因此在csv格式的文件中所進(jìn)行的所有格式調(diào)整、函數(shù)設(shè)置甚至新建的工作表都無法在csv格式文件中進(jìn)行保存,自動(dòng)保存也無法挽救?。?!

血淚史?。。?!某年某月某日,我辛苦做了半天的表格,由于是csv格式且在保存時(shí)未更改格式,直接付之東流,且沒有一絲絲找回的的可能...

因此強(qiáng)烈建議大家,下載后的數(shù)據(jù)文件如果是csv格式,請(qǐng)務(wù)必另存為xlsx(Excel 工作簿)再進(jìn)行編輯。

3. 數(shù)據(jù)未及時(shí)保存

這個(gè)坑相信就不用我過多解釋了吧,死機(jī)、斷電、意外關(guān)閉...多少人心中的痛!

我們就直接來聊一下面對(duì)這個(gè)問題的解決方案吧:自動(dòng)保存設(shè)置

不說廢話了,直接上圖!

在自動(dòng)保存的設(shè)置中,大家需要注意兩點(diǎn)內(nèi)容:

保存自動(dòng)恢復(fù)信息時(shí)間間隔,可以設(shè)置為最短1分鐘

勾選【如果我沒保存就關(guān)閉,請(qǐng)保留上次自動(dòng)恢復(fù)的版本】

勾選【編輯逗號(hào)分隔(*.csv)時(shí)顯示數(shù)據(jù)丟失警告】

這樣就能避免大多數(shù)情況下,數(shù)據(jù)未保存的問題了,同時(shí)也能在一定程度上規(guī)避【問題2】的發(fā)生。

今天的分享就到這里,后期預(yù)計(jì)會(huì)單獨(dú)開辟一個(gè)【Excel技巧】的話題,希望大家多多關(guān)注!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容