有效地存儲(json, jl, relational database數(shù)據(jù)庫應該怎樣安排)
有效地判重(visiting the same page multiple times)
有效地信息抽取 (regex, css slector)
及時更新(預測這個網(wǎng)頁多久會更新一次)
有效地存儲(json, jl, relational database數(shù)據(jù)庫應該怎樣安排)
有效地判重(visiting the same page multiple times)
有效地信息抽取 (regex, css slector)
及時更新(預測這個網(wǎng)頁多久會更新一次)