Python實(shí)現(xiàn)txt文本文件的分割合并

分割
直接用open函數(shù)就好(或pandas),將大文本分割為小文本代碼如下:

with open("large_file.txt", "r") as input_file:
    line_num = 0
    for line in input_file:
        if line_num % 10000 == 0:
            output_file = open("output_file_{}.txt".format(line_num), "w")
        output_file.write(line)
        line_num += 1
        if line_num % 10000 == 0:
            output_file.close()
    output_file.close()

將名為“l(fā)arge_file.txt”的大型文本文件拆分為每個 10,000 行的較小文件。每個較小的文件都被命名為“output_file_xxx.txt”,其中“xxx”是文件的起始行號。

合并
將多個文本文件合并為一個文件代碼:

import glob

# Get a list of all the files to be merged
file_list = glob.glob("*.txt")

# Open the output file for writing
with open("merged_file.txt", "w") as output_file:
    # Iterate through each input file and write its contents to the output file
    for file_name in file_list:
        with open(file_name, "r") as input_file:
            for line in input_file:
                output_file.write(line)

使用glob模塊獲取當(dāng)前目錄中擴(kuò)展名為“.txt”的所有文本文件列表。
然后逐行合并到“merged_file.txt”。

總的來說python真的比C++簡單,至少寫碼思路簡單易懂多了,效率還沒測試,不是很清楚。


若對你有幫助,點(diǎn)個贊就很nice
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容