1、美國(guó)專利局專利批量下載
美國(guó)專利及商標(biāo)局這個(gè)網(wǎng)站 https://www.uspto.gov/
搜索頁(yè)面:http://patft.uspto.gov/netahtml/PTO/index.html

這里的關(guān)鍵是如何通過(guò)一次次的跳轉(zhuǎn)獲得pdf的下載鏈接,整個(gè)流程是這樣的:
1、先根據(jù)關(guān)鍵字搜索獲得相關(guān)專利名稱,根據(jù)專利名稱可以獲得檢索號(hào)
2、從檢索號(hào)可以找到對(duì)應(yīng)的單頁(yè)預(yù)覽pdf鏈接
3、從單頁(yè)pdf網(wǎng)頁(yè)可以獲得完整pdf的鏈接
美國(guó)專利局里1.pdf為單頁(yè)的預(yù)覽,0.pdf為完整版本的pdf文件
過(guò)程的實(shí)現(xiàn)可以參閱參考資料【1】
原作者代碼的問(wèn)題在于沒(méi)有進(jìn)行headers的設(shè)置,導(dǎo)致無(wú)法獲取跳轉(zhuǎn)數(shù)據(jù)
一個(gè)可以跑通的代碼可見(jiàn)git地址:
美國(guó)專利局下載
附:
國(guó)內(nèi)外論文、專利下載網(wǎng)站資源收集(不斷更新中):
http://www.itdecent.cn/p/cec9576a72b2
參考資料
【1】https://blog.csdn.net/u010256153/article/details/53082008 批量下載指定公司專利信息
【2】http://www.itdecent.cn/p/0136fd926b41 爬蟲(chóng)學(xué)習(xí)之瀏覽器偽裝技術(shù)