問題
獲取文件系統(tǒng)中某個目錄下的所有文件列表。
解決方案
使用 os.listdir() 函數(shù)來獲取某個目錄中的文件列表,比如:
import os
file_name = os.listdir('/Users/xz/test')
print(file_name)
['Bath.txt', 'test.py', '2.txt', '1.txt', 'cook.txt']
結(jié)果會返回目錄中所有文件列表,包括所有文件,子目錄,符號鏈接等等。 如果需要通過某種方式過濾數(shù)據(jù),可以考慮結(jié)合 os.path 庫中的一些函數(shù)來使用列表推導(dǎo)。比如:
import os.path
names = [name for name in os.listdir('/Users/xz/test')
if os.path.isfile(os.path.join('/Users/xz/test', name))]
print(names)
['Bath.txt', 'test.py', '2.txt', '1.txt', 'cook.txt']
字符串的 startswith() 和 endswith() 方法對于過濾一個目錄的內(nèi)容也是很有用的。比如:
pyname = [name for name in os.listdir('/Users/xz/test') if name.endswith('.py')]
print(pyname)
['test.py']
對于文件名的匹配,你可能會考慮使用 glob 或 fnmatch 模塊。比如:
import glob
pyname = glob.glob('/Users/xz/test/*.py')
print(pyname)
['/Users/xz/test/test.py']
from fnmatch import fnmatch
pyname = [name for name in os.listdir('/Users/xz/test') if fnmatch(name, '*.py')]
print(pyname)
['test.py']
討論
通過上述的幾種方法,均可以獲取目錄中的文件列表,但是其返回結(jié)果只是目錄中實(shí)體名列表而已。
如果想獲取文件的其他元數(shù)據(jù),比如文件大小,修改時間等等,需要使用到 os.path 模塊中的函數(shù),或os.stat() 函數(shù)來收集數(shù)據(jù)。比如:
# Get file sizes and modification dates
name_sz_dt = [(name, os.path.getsize(name), ar.get(os.path.getmtime(name)).format("YYYY-MM-DD HH:mm:ss"))
for name in pyfile]
for name, sizes, date in name_sz_dt:
print(name, sizes, date)
/Users/xz/test/test.py 214 2018-11-29 14:03:02
# Alternative: Get file metadata
file_metadata = [(name, os.stat(name)) for name in pyfile]
for name, meta in file_metadata:
print(name, meta.st_size, ar.get(meta.st_mtime).format("YYYY-MM-DD HH:mm:ss"))
/Users/xz/test/test.py 214 2018-11-29 14:03:02
需要注意的是,有時候在處理文件名編碼問題時,可能會出現(xiàn)一些問題。 通常,函數(shù) os.listdir()返回的實(shí)體列表是根據(jù)系統(tǒng)默認(rèn)的文件名編碼進(jìn)行解碼。 但有時候也會遇到一些不能正常解碼的文件名。