import os
創(chuàng)建目錄結(jié)構(gòu)
- os.makedirs 可以遞歸的創(chuàng)建目錄結(jié)構(gòu),比如
os.makedirs('tmp/python/fileop',exist_ok=True)
在當(dāng)前工作目錄下面創(chuàng)建 tmp目錄,在tmp目錄下面再創(chuàng)建 python目錄,在Python目錄下面再創(chuàng)建fileop目錄;exist_ok=True 指定了,如果某個(gè)要?jiǎng)?chuàng)建的目錄已經(jīng)存在,也不報(bào)錯(cuò)
刪除文件或目錄
os.remove 可以刪除一個(gè)文件,比如
os.remove('sdf.py')
shutil.rmtree() 可以遞歸的刪除某個(gè)目錄所有的子目錄和子文件 比如
import shutil
shutil.rmtree('tmp', ignore_errors=True)
注意:參數(shù) ignore_errors=True 保證如果目錄不為空,不會(huì)拋出異常。
拷貝文件
shutil 模塊里面有很多 目錄文件操作的函數(shù)
拷貝文件,可以使用shutil模塊的copyfile函數(shù)。
from shutil import copyfile
# 拷貝 d:/tools/first.py 到 e:/first.py
copyfile('d:/tools/first.py', 'e:/first.py')
注意,如果拷貝前,e:/first.py 已經(jīng)存在,則會(huì)被拷貝覆蓋,所以使用該函數(shù)一定要小心。
拷貝目錄
如果我們要拷貝一個(gè)目錄里面所有的內(nèi)容(包括子目錄和文件、子目錄里面的子目錄和文件,等等)到另外一個(gè)目錄中,可以使用 shutil的copytree函數(shù)。
from shutil import copytree
# 拷貝 d:/tools/aaa 目錄中所有的內(nèi)容 到 e:/bbb 中
copytree('d:/tools/aaa', 'e:/new/bbb')
注意拷貝前, 目標(biāo)目錄必須 不存在 ,否則會(huì)報(bào)錯(cuò)。
上面的代碼執(zhí)行前面,如果 e:/new/bbb 已經(jīng)存在,執(zhí)行到copytree時(shí),就會(huì)報(bào)錯(cuò)
上面的代碼執(zhí)行前面,如果 e:/new 這個(gè)目錄都不存在,執(zhí)行到copytree時(shí),就會(huì) 創(chuàng)建 e:/new 目錄,再創(chuàng)建 e:/new/bbb 目錄,再拷貝 d:/tools/aaa 目錄中所有的內(nèi)容 到 e:/new/bbb 中。
上面的代碼執(zhí)行前面,如果 e:/new 這個(gè)目錄存在,但是 e:/new/bbb 不存在,執(zhí)行到copytree時(shí),就只會(huì) 創(chuàng)建 e:/new/bbb ,再拷貝 d:/tools/aaa 目錄中所有的內(nèi)容 到 e:/new/bbb 中。
修改文件名、目錄名
要修改文件名、目錄名,可以使用os模塊的rename函數(shù)。
# 修改目錄名 d:/tools/aaa 為 d:/tools/bbb
os.rename('d:/tools/aaa','d:/tools/bbb')
# 修改文件名 d:/tools/first.py 為 d:/tools/second.py
os.rename('d:/tools/first.py','d:/tools/second.py')
對(duì)文件路徑名的操作
對(duì)于文件名的操作,比如 獲取文件名稱,文件所在目錄,文件路徑的拼接等,都可以使用 os.path 模塊。
通常我們喜歡使用格式化字符串的方法來(lái)做文件路徑的拼接,但是如果你的程序需要在Linux、Windows等多個(gè)平臺(tái)運(yùn)行,它們的路徑的分隔符是不同的,Windows上是 \ , 而 Linux上是 /。
這時(shí),我們應(yīng)該使用 os.path 模塊。 它能夠自動(dòng)處理類似 Data/data.csv 和 Data\data.csv 這樣的文件路徑差異。
path = '/Users/beazley/Data/data.csv'
# 獲取路徑中的文件名部分
os.path.basename(path)
'data.csv'
# 獲取路徑中的目錄部分
os.path.dirname(path)
'/Users/beazley/Data'
# 文件路徑的拼接
os.path.join('tmp', 'data', os.path.basename(path))
'tmp/data/data.csv'
判斷文件、目錄是否存在
os.path.exists('d:/systems/cmd.exe')
os.path.exists('d:/systems')
exists方法返回值為T(mén)rue表示 存在,否則表示不存在。
如果你要判斷指定路徑是否是文件,可以這樣
os.path.isfile('d:/systems/cmd.exe')# 返回值為T(mén)rue 表示是文件
如果你要判斷指定路徑是否是目錄,可以這樣
os.path.isdir('d:/systems')#返回值為T(mén)rue 表示是目錄
文件大小和修改日期
返回文件大小
os.path.getsize('file1')
3669返回文件的最后修改日期,是秒時(shí)間
參考下一章 日期和時(shí)間 里面的內(nèi)容
os.path.getmtime('file1')
1272478234.0可以把秒時(shí)間 轉(zhuǎn)化為日期時(shí)間
import time
time.ctime(os.path.getmtime('/etc/passwd'))
'Wed Apr 28 13:10:34 2010'
當(dāng)前工作目錄
當(dāng)前工作目錄的路徑:
wd = os.getcwd()
改變當(dāng)前工作目錄到另外的路徑:
os.chdir(path)
參數(shù)就是 新的當(dāng)前工作目錄 路徑地址。
遞歸的遍歷目錄下面所有的文件
獲取某個(gè)目錄中所有的 文件, 包括子目錄里面的文件。 可以使用 os庫(kù)中的walk方法
比如我們要得到某個(gè)目錄下面所有的子目錄 和所有的文件,存放在兩個(gè)列表中
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
top :是你所要遍歷的目錄的地址, 返回的是一個(gè)三元組 (dirpath, dirnames, filenames)
topdown :可選,True則優(yōu)先遍歷 top 文件夾,與top 文件夾中每一個(gè)子目錄;否則優(yōu)先遍歷 top 的子目錄(默認(rèn)為開(kāi)啟)。
onerror :可選,需要一個(gè) callable 對(duì)象,當(dāng) walk 需要異常時(shí),會(huì)調(diào)用
followlinks :可選,如果為 True,則會(huì)遍歷目錄下的快捷方式(linux 下是軟連接 symbolic link )實(shí)際所指的目錄(默認(rèn)關(guān)閉),如果為 False,則優(yōu)先遍歷 top 的子目錄;
- 得到某個(gè)目錄下所有文件的全路徑
import os
# 目標(biāo)目錄
targetDir = r'd:\tmp\util\dist\check'
for (dirpath, dirnames, filenames) in os.walk(targetDir):
for fn in filenames:
# 把 dirpath 和 每個(gè)文件名拼接起來(lái) 就是全路徑
fpath = os.path.join(dirpath, fn)
# dirpath 代表當(dāng)前遍歷到的目錄名
# dirnames 是列表對(duì)象,存放當(dāng)前dirpath中的所有子目錄名
# filenames 是列表對(duì)象,存放當(dāng)前dirpath中的所有文件名
得到目錄中所有的文件和子目錄名
listdir返回的是該目錄下面所有的文件和子目錄。
# 目標(biāo)目錄
targetDir = r'd:\tmp\util\dist\check'
files = os.listdir(targetDir)
print(files)
如果只需要獲取目錄中所有的文件,或者只需要子目錄
import os
from os.path import isfile, join,isdir
# 目標(biāo)目錄
targetDir = r'd:\tmp\util\dist\check'
# 所有的文件
print([f for f in os.listdir(targetDir) if isfile(join(targetDir, f))])
# 所有的目錄
print([f for f in os.listdir(targetDir) if isdir(join(targetDir, f))])
得到目錄中指定擴(kuò)展名的文件和子目錄
可以使用glob庫(kù)
import glob
exes = glob.glob(r'd:\tmp\*.txt')
print(exes)