python pdf等頁(yè)分割

有1個(gè)pdf文件,共1435頁(yè)
image.png

,想要讀取其中的文字信息,但是頁(yè)數(shù)太多信息量較大導(dǎo)致報(bào)錯(cuò)“Merroy error”--內(nèi)存不足,所以沒(méi)辦法一次性讀完。這個(gè)內(nèi)存不足的原因是由于python本身的內(nèi)存機(jī)制導(dǎo)致的,所以為了避免這個(gè)問(wèn)題選擇對(duì)頁(yè)數(shù)較多的pdf進(jìn)行等量切分為多個(gè)pdf,之后再逐個(gè)讀取。
下面直接上切分代碼:

from PyPDF2 import PdfFileWriter, PdfFileReader

# 開始頁(yè)
start_page = 0 
# 截止頁(yè)
end_page = 200
#用數(shù)字作為切分后pdf的名字
page_no_split = 1
# h_pathfile_pdf_y----需切分文件路徑
fp_read_file  = open(h_pathfile_pdf_y, "rb")
pdf_file = PdfFileReader(fp_read_file )
pdf_pages_len = pdf_file.getNumPages() #獲取pdf總頁(yè)數(shù)
print(pdf_pages_len)
for page in  range(0,pdf_pages_len,200):  #每200頁(yè)分成一個(gè)pdf
    output = PdfFileWriter()
    for i in range(start_page, end_page):
        output.addPage(pdf_file.getPage(i))
    start_page+=200
    end_page+=200
    if pdf_pages_len<end_page:  
        end_page=pdf_pages_len
    outputStream = open(recepit_split + "\\" + str(page_no_split) + ".pdf", "wb")  #recepit_split----切分后的文件存放路徑
    output.write(outputStream)
    page_no_split+=1
    outputStream.close() #記得open打開后要close文件,不然數(shù)量超過(guò)一定值會(huì)報(bào)錯(cuò)”有些文件沒(méi)有關(guān)閉“
fp_read_file.close()

結(jié)果如下:


image.png

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • error code(錯(cuò)誤代碼)=0是操作成功完成。error code(錯(cuò)誤代碼)=1是功能錯(cuò)誤。error c...
    Heikki_閱讀 3,532評(píng)論 1 9
  • Swift1> Swift和OC的區(qū)別1.1> Swift沒(méi)有地址/指針的概念1.2> 泛型1.3> 類型嚴(yán)謹(jǐn) 對(duì)...
    cosWriter閱讀 11,629評(píng)論 1 32
  • error code(錯(cuò)誤代碼)=2000是無(wú)效的像素格式。error code(錯(cuò)誤代碼)=2001是指定的驅(qū)動(dòng)...
    Heikki_閱讀 2,191評(píng)論 0 4
  • 一.簡(jiǎn)述如何安裝配置apache 的一個(gè)開源的hadoop 1.使用root賬戶登陸 2.修改ip 3.修改hos...
    梔子花_ef39閱讀 5,062評(píng)論 0 52
  • 今天看到一位朋友寫的mysql筆記總結(jié),覺(jué)得寫的很詳細(xì)很用心,這里轉(zhuǎn)載一下,供大家參考下,也希望大家能關(guān)注他原文地...
    信仰與初衷閱讀 4,826評(píng)論 0 30

友情鏈接更多精彩內(nèi)容