思路1:從后往前寫
最后一句: 如果怎么樣就調(diào)用主函數(shù)
user-agent的拷貝方法(以下為隨意拷貝)
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.188
不要直接打開 可能太多直接卡死 轉(zhuǎn)成一個文本文件 把返回的資源的對應(yīng)文本寫進(jìn)去
2找到、下載目標(biāo)文件
把url資源直接下載下來沒有用 并沒有評論
一個網(wǎng)頁并非有一個源文件構(gòu)成 而是由許多小文件構(gòu)成
讓瀏覽器以很慢的速度加載網(wǎng)頁,在出現(xiàn)評論的時候停止加載同時暫停錄制,以此篩選出文件
disable cache禁止緩存
調(diào)網(wǎng)頁的載入速度
清楚已加載的 然后開啟錄制
看文件類型縮小范圍 doc xhr都可以傳遞文本
空白界面是因為post
從服務(wù)器上獲取數(shù)據(jù)有很多種方法?
get 直接獲取內(nèi)容 參數(shù)都在查詢字符串里邊
post則需要提交一個指定的data 服務(wù)器才會給你數(shù)據(jù)
requests模塊允許將兩個參數(shù)以字典的形式傳進(jìn)去 鍵值同名即可
以等號為第零個元素的標(biāo)志進(jìn)行分割 第一個元素就是這首歌的id
3提取關(guān)鍵數(shù)據(jù)
hot comments是一個列表 所以用迭代的形式獲取每一個元素 將指定的東西打印出來