Robots協(xié)議也稱作爬蟲協(xié)議、機(jī)器人協(xié)議、它的全名叫作網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn),用來告訴爬蟲和搜索引擎哪些頁面可以抓取,哪些不可以抓取。它通常是一個叫作robots.txt的文本文件,一般放在網(wǎng)站的根目錄下。
分析Robots協(xié)議
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 個人學(xué)習(xí)筆記,方便自己查閱,僅供參考,歡迎交流 分析Robots協(xié)議 利用robotparser模塊,可以實(shí)現(xiàn)網(wǎng)站...
- 1.異常處理 URLError類來自urllib庫的error模塊,它繼承自O(shè)SError類,是error異常模塊...
- 網(wǎng)絡(luò)爬蟲的君子協(xié)議 網(wǎng)絡(luò)爬蟲的尺寸 網(wǎng)絡(luò)爬蟲引發(fā)的問題 性能騷擾 法律風(fēng)險 隱私泄露 網(wǎng)絡(luò)爬蟲的"性能騷擾"web...
- 引言 推薦教材 關(guān)注搜索引擎的原因 互聯(lián)網(wǎng)上最重要的應(yīng)用系統(tǒng) 人類歷史上最大規(guī)模的信息集散平臺 學(xué)術(shù)界重要的研發(fā)平...
- 一直都是網(wǎng)購達(dá)人的我,總是閑逛在各種各樣的商品中間,這兒看看,那兒逛逛??茨軖唿c(diǎn)什么貨回來。 可是自從我學(xué)習(xí)文案以...