最近剛剛從公司離職,假期過(guò)后就去新公司入職了。
就在前兩天,我寫的代碼出現(xiàn)了兩個(gè)問(wèn)題。都算是數(shù)據(jù)問(wèn)題。
更新省市區(qū)的數(shù)據(jù),我沒(méi)有直接在最新的國(guó)家行政區(qū)域代碼頁(yè)面爬蟲,而是找的第三方的數(shù)據(jù),沒(méi)有更新到最新,導(dǎo)致客戶反映有城市不在下拉選單中。
另一個(gè)問(wèn)題是,MySQL 數(shù)據(jù)庫(kù)存儲(chǔ)的以逗號(hào)間隔的字符串,這就給查找?guī)?lái)了麻煩,我用的 REGEXP 來(lái)正則匹配,其實(shí)是相當(dāng)于 LIKE 的用法模糊匹配了,這樣就匹配到一個(gè)不精確的數(shù)據(jù)導(dǎo)致判斷失誤。
反思起來(lái),看似失誤,也可以說(shuō)是考慮不周經(jīng)驗(yàn)不足吧。
所有的失誤都是沒(méi)有掌握牢固導(dǎo)致的。以后要精益求精,邏輯更周密才好。
第一個(gè)問(wèn)題,應(yīng)該找到最新的官方數(shù)據(jù)爬蟲整理,而不是依賴第三方數(shù)據(jù)。
第二個(gè)問(wèn)題,首先可能考慮一下是否可以改正存儲(chǔ)方式,加第三張中間表,如果不改的情況下,應(yīng)該改變匹配方式,使得匹配更精確。